AOAG 數據庫進入 NOT SYNCSUSPECT MODE
我有 3 個副本的 SQL Server AOAG 2014。2 個帶自動故障轉移的同步送出和 1 個帶手動故障轉移的 (BCP) 非同步送出。
這是一個 DEV 環境,我每 15 分鐘安排一次日誌備份。
BCP 副本 AOAG 數據庫進入“NOT SNCHRONIZING\SUSPECT”模式。
當我檢查日誌時,它說 LOG DRIVE 是 100 GB,它完全被這個特定的數據庫日誌佔用。
當我檢查 SYS.DATABASES –> Log_reuse_wait_desc – 我看到了“AVAILABILITY REPLICA”。
我試圖備份這個特定數據庫的日誌,但我仍然無法縮小這個特定數據庫。
最後,我必須通過從 AOAG 中刪除數據庫然後重新添加來重新初始化數據庫。然備份份這個特定數據庫的日誌並縮小它。這解決了這個問題。
對於這種特殊情況,我還能做些什麼。
這種情況是由於您的一個輔助副本上的事務日誌未正確加固造成的。這可能是其中一個離線一段時間,或者無法正確連接。
為了幫助辨識有問題的副本,您可以查詢
sys.dm_hadr_database_replica_states
,特別要注意log_send_queue_size
列。AG 有時會發生一些奇怪的事情,特別是在機器重新啟動後,AG 中的一個數據庫將停止同步(並且不會記錄錯誤或問題)。與其從 AG 中完全刪除它,然後將其重新添加,您可以嘗試在
hadr_endpoint
出現問題的輔助節點上重新啟動它,然後觀察流量是否再次開始流動。
由於日誌文件增長,您需要小心驅動器已滿。發生這種情況時,導致這種情況的事務甚至無法回滾,因為日誌中沒有空間可以寫入回滾資訊。
將數據文件添加到另一個驅動器並允許日誌增長應該是一個更安全的選擇,但這不能在輔助副本上完成,所以我相信你只剩下你選擇的選項了。