MySQL:主从报错一例

2021-03-09  本文已影响0人  重庆八怪

版本5.6使用pos位点方式


一、问题展示

image.png

说重启过后报错如上

二、错误含义

错误一共分为2部分第一部分

第一部分:

这部分来源于主库的DUMP线程函数

mysql_binlog_send
  ->sender.run()
    ->Binlog_sender::init
       ->Binlog_sender::check_start_file

  if ((file= open_binlog_file(&cache, m_linfo.log_file_name, &errmsg)) < 0) //打开这个binlog文件
  {
    set_fatal_error(errmsg);
    return 1;
  }

  size= my_b_filelength(&cache);
  end_io_cache(&cache);
  mysql_file_close(file, MYF(MY_WME)); //测试打开文件

  if (m_start_pos > size)
  {
    set_fatal_error("Client requested master to start replication from "
                    "position > file size");
    return 1;
  }

关键就是m_start_pos和size两个值,其中m_start_pos来源于从库需要读取的位点。而size则是本binlog文件的大小,那么很容易理解如果io线程需要的pos点比本binlog文件的大小还要大,那么自然不对。

第二部分:

这部分也来源于DUMP线程

mysql_binlog_send
  ->sender.run()
     ->Binlog_sender::init
     ->while (!has_error() && !m_thd->killed)
     如果正常这里开始循环读取binlog event,如果前面出错则直接继续后面逻辑
     ->如果有读取错误则报错
       my_snprintf(error_text, sizeof(error_text),
                  "%s; the first event '%s' at %lld, "
                  "the last event read from '%s' at %lld, "
                  "the last byte read from '%s' at %lld.",
                  m_errmsg,
                  m_start_file, m_start_pos, m_last_file, m_last_pos,
                  log_file, my_b_tell(&log_cache));

这里我们主要看看m_start_pos和m_last_pos,实际上m_start_pos就是和前面报错一致的来自从库需要读取的位点信息,而m_last_pos来自dump线程,就是最后读取的位置,显然这里一次都没有读取,因此位置为最开始的pos 4。

三、可能的原因

分析后觉得最有可能原因应该和sync_binlog 有关,如果我们没有设置为1,那么可能os cache没有刷盘,如果主库服务器直接crash重启很容易就遇到这种问题,稍微google查询了一下发现很大部分出现这种错误都是由于服务器crash且sync_binlog!=1导致的,这也证明我们的说法。最后查看问题数据库的主库确实没有设置为双1。
那么通过这个小案例,我们已经更加深刻体会倒设置双1的重要性。

上一篇下一篇

猜你喜欢

热点阅读