Nosql

Cassandra 的手動節點添加/刪除任務在大型集群中是否繁瑣實用?

  • February 28, 2018

我正在評估將 Cassandra 用作超過 500 台商品機器的大型鍵值儲存。AFAIK,Cassandra 在永久性機器故障期間需要人工干預(刪除死節點,添加新機器)。我認為機器故障率高到足以使管理員超負荷。那麼在這麼大的集群中執行 Cassandra 是否切實可行呢?

謝謝,

提到了大小為 300-400 及更多機器的集群。但是 Cassandra 提供了許多工具,可以幫助實現部署過程的自動化。此外,您還可以找到大量適用於 Ansible(1、2、 … 或其他一些自動化框架的方法。

其他管理任務可能需要做更多的工作,例如確保維修正在執行等。但是人們正在這樣做,並且也有“第 3 方”工具可供他們使用。

我和我的團隊(五人)目前在生產中支持跨 30 多個集群的 700 多個 Cassandra 節點。我們使用Spinnaker來幫助管理外部雲中的 Cassandra。如果一個節點被吹走,它會自行替換它。

不過,您確實想密切關注它。如果替換節點使用不同的 IP,則舊節點仍將在集群中(只是DN)。所以在某些時候你需要nodetool remove手動進行。此外,如果同時發生多個節點故障,您需要確保它不會嘗試一次引導多個節點(這也會失敗)。

最重要的是,還有其他工具,例如 Spinnaker,可以幫助完成大部分繁重的工作。但這不是魔術,它只能靠自己做這麼多的“自動修復”。

引用自:https://dba.stackexchange.com/questions/198965