Availability-Groups
集群節點之間的連接超時
我幾乎在凌晨 1 點到 1.30 點之間失去了集群之間的通信,它顯示錯誤,例如主節點上的 35206,集群上的 976,有時由於心跳失去導致 1135 錯誤,1069 錯誤,集群被刪除。我有一種強烈的感覺,那時我的聯繫每天都會中斷,但我不知道從哪裡開始有點迷失。任何幫助將不勝感激。
您檢查過 SQL 錯誤日誌嗎?先從錯誤的描述開始。是因為它失去了法定人數嗎?是否有任何節點中的 CPU 較高?你是 FCI 還是 AAG?
當數據庫在 ETL 負載高峰期間報告不健康時,我們必須調整副本之間的超時。
0 否決票 設置跟踪以調查伺服器上正在執行的其他內容。然後檢查 SQL 等待統計資訊。https://www.sqlskills.com/blogs/paul/wait-statistics-or-please-tell-me-where-it-hurts/
如果沒有負載 - 將超時增加到更高的值(https://blogs.msdn.microsoft.com/alwaysonpro/2014/06/03/connection-timeouts-in-multi-subnet-availability-group/))看看錯誤是否消失。但是,如果您的工作量沒有問題,那麼您不必擔心這些錯誤。首先,您需要評估使用者是否抱怨速度慢,在此期間是否有任何工作失敗?在嘗試簡單地重新解決錯誤之前,您必須提出這些問題。