Availability-Groups
Windows Server 2019 上的 SQL 2017 CU10 - 可用性組偵聽器無法從 DHCP 獲取 IP
我們在幾台 Windows Server 2016 機器上有幾個 SQL 2017 CU10 Standard 實例,通常我們創建基本可用性組,偵聽器從我們的 DHCP(
192.168.112.0/22
網路)獲取 IP。我們有用於伺服器的靜態 IP 和用於基本 AG 偵聽器的 DHCP。
一切正常,但是在新的(完全更新的)Windows 2019 伺服器上創建的 AG 偵聽器無法從 DHCP 獲取 IP 地址。
- 我已經在新伺服器上檢查了我們的 DHCP,它執行良好,伺服器本身確實從我們的 DHCP 獲取 IP,這意味著DHCP 工作正常。
- 我嘗試在新的 Windows Server 2019 上創建一個具有靜態 IP 的偵聽器,它執行良好,這意味著集群電腦帳戶的 OU 上的 AD 權限是好的(也仔細檢查過)。
- 我嘗試在現有伺服器(Windows 2016)上創建一個帶有監聽器的 AG,並且在那裡創建的監聽器成功地從 DHCP 獲取地址,這意味著我們的 DHCP 池沒有用盡。
- 實際上有一點不同,我們的新伺服器連接到全新設置的戴爾 S4148F-ON 交換機 VLT 堆棧,但是只要它配置了所有 VLAN 並且 DHCP 正常工作(請參閱#1)我不看看有什麼理由責怪網路。
- 當我在 2019 年機器上的 Wireshark 的物理介面上擷取流量時,我看到來自 DHCP 伺服器(Dell N3000 核心交換機)的許多廣播,其中包含我假設的租用客戶端地址:
Your (client) IP address: 192.168.113.143
.但看起來伺服器不接受它們(?),我收到的錯誤是:
Cannot bring the Windows Server FailoverClustering (WSFC) resource (ID ...) online (Error code 5942). <...>
在系統事件日誌中,我看到了事件 ID 1240 的兩個實例(根據 Wireshark,基於兩次嘗試):
Cluster IP address resource 'db11_192.168.112.0' failed to obtain a leased IP address.
而且我在故障轉移群集事件日誌中沒有發現任何有趣的東西,只是資源轉換到失敗狀態的詳細日誌。
也許我遺漏了一些東西,但除了新伺服器執行 Windows Server 2019之外,我沒有看到新舊伺服器之間的任何其他區別。
如果有人提出任何進一步的診斷建議,我會很高興,因為我已經沒有想法了,在此先感謝。
只是想確認問題出在 Server 2019 上——在我們重新安裝到 Server 2016 之後,一切正常。