
Mysql(percona-server 5.5)在導入期間完全停止(myloader)

  • December 3, 2015

在配置我們的新伺服器(IBM X3650M4、2x Intel Xeon E5-2620、64G RAM、RAID 10(4x 240G SSD))時,我們遇到了一個奇怪的問題。我們正在嘗試將轉儲 ( mydumper) 從我們的(舊)生產環境導入到我們的新環境中,但我們幾乎無法做到。

轉儲為47G(壓縮),+/- 4500 個表,最大表為 7.1G(54285914 行)、2.2G、1.7G 和 1.7G。

我們嘗試myloader使用 12 個(或 8 個)執行緒執行,但大多數時候都失敗了。幾分鐘後myloader遇到大桌子和攤位。一些工具顯示沒有更多活動(htop沒有 cpu 負載,iostat沒有寫入或讀取),mytop顯示 4 個(長時間執行)查詢永遠不會完成,大多數innotop螢幕被凍結(因為SHOW INNODB STATUS不再返回任何結果)。當我嘗試重新啟動時mysql也失敗了,因為mysql無法殺死多個執行緒。唯一的補救措施是使用killall -9 mysqld mysql.

我們正在使用以下 mysql 配置:

# cat /etc/mysql/my.cnf 
# Ansible managed

port = 3306
socket = /var/run/mysqld/mysqld.sock

ssl_cert = /etc/mysql/client-cert.pem
ssl_key = /etc/mysql/client-key.pem

socket = /var/run/mysqld/mysqld.sock
nice = 0

user = mysql
socket = /var/run/mysqld/mysqld.sock
pid_file = /var/run/mysqld/
port = 3306
basedir = /usr
datadir = /var/lib/mysql
tmpdir = /tmp
lc_messages_dir = /usr/share/mysql

general_log = 0
general_log_file = /var/log/mysql/mysql.log
log_error = /var/log/mysql/error.log
log_queries_not_using_indexes = 0
slow_query_log = 0
slow_query_log_file = /var/log/mysql/mysql-slow.log

skip_external_locking = 1
skip_name_resolve = 1

max_connections = 1000
wait_timeout = 28800
interactive_timeout = 28800


character_set_server = utf8
collation_server = utf8_general_ci
init_connect='SET collation_connection = utf8_general_ci; SET NAMES utf8;'

default_storage_engine = InnoDB

key_buffer_size = 32M
myisam_recover_options = FORCE,BACKUP

thread_stack = 256K
thread_cache_size = 500

query_cache_type = 0
query_cache_limit = 2M
query_cache_size = 64M

max_allowed_packet = 256M
group_concat_max_len = 256M

tmp_table_size = 256M
max_heap_table_size = 64M

open_files_limit = 65535
innodb_open_files = 8192
table_definition_cache = 8192
table_open_cache = 8192

expire_logs_days = 7
max_binlog_size = 1G

innodb_buffer_pool_size = 32G
innodb_additional_mem_pool_size = 64M
innodb_log_file_size = 512M
innodb_log_buffer_size = 16M
innodb_flush_log_at_trx_commit = 2
innodb_flush_method = O_DIRECT
innodb_thread_concurrency = 0
innodb_write_io_threads = 8
innodb_read_io_threads = 8
innodb_io_capacity = 25000

innodb_stats_on_metadata = 0

innodb_adaptive_flushing_method = keep_average
innodb_flush_neighbor_pages = none
log_warnings_suppress = 1592
query_response_time_stats = 1

ssl_ca = /etc/mysql/ca-cert.pem
ssl_cert = /etc/mysql/server-cert.pem
ssl_key = /etc/mysql/server-key.pem

max_allowed_packet = 256M


key_buffer_size = 32M

!includedir /etc/mysql/conf.d/

我們正在使用以下 ext4 掛載選項:


我們正在使用以下 RAID(控制器)設置:

# ./MegaCli64 -LDInfo -Lall -aAll

# ./MegaCli64 -AdpAllInfo -a0

# ./MegaCli64 -PDList -a0

  • Percona 伺服器 5.5.46-37.5
  • mydumper 0.6.2(針對 MySQL 5.5.45-37.4 建構)
  • 核心 3.13.0-68-generic #111-Ubuntu SMP Fri Nov 6 18:17:06 UTC 2015 x86_64 x86_64 x86_64 GNU/Linux


  • myloader,mysql客戶端在多程序導入時遇到同樣的問題
  • 伺服器記憶體(已測試)
  • RAID 控制器的 RAM(已測試)
  • 多 CPU,當 mysqld 綁定到一個 CPU 時,導入也會停止


  • MariaDB ( mysqld Ver 5.5.46-MariaDB-1ubuntu0.14.04.2 for debian-linux-gnu on x86_64 ((Ubuntu))) 似乎沒有這個問題



  • innodb_adaptive_flushing_method = keep_average
  • innodb_flush_neighbor_pages = none
  • log_warnings_suppress = 1592
  • query_response_time_stats = 1


問題似乎是由以下原因引起的:innodb_adaptive_flushing_method = keep_averageinnodb_adaptive_flushing_method = estimate執行穩定


問題似乎是由以下原因引起的:innodb_adaptive_flushing_method = keep_average,但僅在 Percona Server 上,MariaDB 似乎執行穩定(使用相同的設置)

奇怪的是,我們能夠在其他(較慢的)機器上很好地導入轉儲,主要區別在於它們的緩衝池較小(<= 12G),CPU 功能較弱(Intel(R) Xeon(R ) CPU E3-1246 v3 @ 3.50GHz 或 Intel(R) Core(TM) i7-3930K CPU @ 3.20GHz),只有一個 SSD(或軟體 raid 1 和 2)。


此問題的根本原因是 5.5.46 / 5.6.27 中的 Oracle MySQL 回歸,由的修復引起,Percona Server 將盡快發布修復(使用用於跟踪)。

編輯:這個 Oracle 錯誤是

自適應刷新設置沒有錯誤,即使此設置的某些值比其他值更可能引發錯誤。MariaDB 不受影響,因為他們之前已經修復了潛在問題 ( )。

整個故事是相當技術性的,更多地與低級系統程式有關,而不是與數據庫本身有關。錯誤 76135 是關於 InnoDB 互斥原語不適用於 ARM64。這已通過使用適當的編譯器屏障得到糾正,以確保互斥鎖字載入/儲存與受該互斥鎖保護的關鍵部分之間的正確排序。但是 InnoDB 互斥鎖不僅僅是一個鎖字,而且這些障礙變得太弱,無法使用其他互斥鎖欄位對鎖字訪問進行排序。這首先由 MariaDB 的 Kristian Nielsen 分析,可以在閱讀。
