简介

在MySQL8.0中增加了一个新的数据结构叫做Link_buf,它是一个无锁的数据结构,这个数据结构主要用于redolog以及buffer pool的flush list.

这个数据结构简单来看就是一个拥有固定大小的数组,而对于InnoDB使用来说里面保存的就是写入log buffer或者加入到flush list的数据的大小.数组的每个元素可以被原子的更新.

由于在8.0种写入log buffer会有空洞的产生,因此这个数据结构就用来track当前log buffer的写入情况,也就是说每次写入的数据大小都会保存在linkbuffer中,而每次写入的位置通过start lsn来得到(hash), 假设有空洞(某些lsn还没有写入),那么它对应在linkbuffer中的值就是0,这样就能很简单的track空洞.

最后要注意的是这个数据结构的前提就是LSN是一直增长且不会重复的.因此在InnoDB中只在redolog中使用.

之后在分析redolog的时候,我们可以详细的看到这个数据结构的使用.

源码分析

核心字段

我们先来看这个数据结构的核心字段.

  1. Distance 这个累心表示了我们的Link_buf所包含的内容的类型(一般是lsn_t).
  2. m_capacity 表示Link_buf的大小.
  3. m_links所有的内容都是保存在这里(也就是一个动态数组).
  4. m_tail表示当前buffer的结尾(这里的结尾的意思是第一个空洞的位置,也就是可以保证m_tail之前都是连续的).
  1. template <typename Position = uint64_t>
  2. class Link_buf {
  3. public:
  4. typedef Position Distance;
  5. .....................................
  6. */** Capacity of the buffer. */*
  7. size_t m_capacity;
  8. */** Pointer to the ring buffer (unaligned). */*
  9. std::atomic<Distance> *m_links;
  10. */** Tail pointer in the buffer (expressed in original unit). */*
  11. alignas(INNOBASE_CACHE_LINE_SIZE) std::atomic<Position> m_tail;
  12. };

 

构造函数

这里构造函数就是根据传递进来的capacity,创建对应大小的数组(m_links),然后初始化数组的内容.

  1. template <typename Position>
  2. Link_buf<Position>::Link_buf(size_t capacity)
  3. : m_capacity(capacity), m_tail(0) {
  4. if (capacity == 0) {
  5. m_links = nullptr;
  6. return;
  7. }
  8. ut_a((capacity & (capacity - 1)) == 0);
  9. m_links = UT_NEW_ARRAY_NOKEY(std::atomic<Distance>, capacity);
  10. for (size_t i = 0; i < capacity; ++i) {
  11. m_links[i].store(0);
  12. }
  13. }

  

添加内容

add_link函数主要是用来将将要写入的数据的在lsn中的起始以及结束位置进行保存.流程如下。

  1. 首先根据from计算当前的写入lsn应该在数组的那个位置.
  2. 然后保存写入的大小到当前的slot.
  1. template <typename Position>
  2. inline void Link_buf<Position>::add_link(Position from, Position to) {
  3. ut_ad(to > from);
  4. ut_ad(to - from <= std::numeric_limits<Distance>::max());
  5. const auto index = slot_index(from);
  6. auto &slot = m_links[index];
  7. ut_ad(slot.load() == 0);
  8. slot.store(to - from);
  9. }

slot_index函数就是用来计算slot,计算方式很简单,和数组的大小取模,这里或许有疑问了,如果当前的slot已经被其他的lsn占据了应该怎么办?这里的解决方式就是通过has_space进行判断.

  1. template <typename Position>
  2. inline size_t Link_buf<Position>::slot_index(Position position) const {
  3. return position & (m_capacity - 1);
  4. }

判断空间

has_space函数就是用来判断对应的position是否已经被占据.

  1. template <typename Position>
  2. inline bool Link_buf<Position>::has_space(Position position) const {
  3. return tail() + m_capacity > position;
  4. }

advance_tail_until

这个函数用来更新m_tail字段,m_tail字段之前解释过,主要是为了保证它之前的slot都是连续的.

  1. template <typename Position>
  2. template <typename Stop_condition>
  3. bool Link_buf<Position>::advance_tail_until(Stop_condition stop_condition) {
  4. auto position = m_tail.load();
  5. while (true) {
  6. Position next;
  7. bool stop = next_position(position, next);
  8. if (stop || stop_condition(position, next)) {
  9. break;
  10. }
  11. */* Reclaim the slot. */*
  12. claim_position(position);
  13. position = next;
  14. }
  15. if (position > m_tail.load()) {
  16. m_tail.store(position);
  17. return true;
  18. } else {
  19. return false;
  20. }
  21. }

而上面的代码可以看到每次都会读取next_position,这个函数用来返回下一个slot是否为0,如果是0则返回true,也就是说已经到达空洞.

  1. template <typename Position>
  2. bool Link_buf<Position>::next_position(Position *position*, Position &*next*) {
  3. const auto index = slot_index(position);
  4. auto &slot = m_links[index];
  5. const auto distance = slot.load();
  6. ut_ad(position < std::numeric_limits<Position>::max() - distance);
  7. next = position + distance;
  8. return distance == 0;
  9. }