Scalability

哪個數據庫平台更擅長擴展?

  • January 6, 2011

我正在計劃一個數據庫,我希望它在記錄數量而不是表和數據庫數據庫方面會非常大。我的問題是哪種產品(即 SQL 2008、Cassandra、Azure)能夠更好地處理擴展?

我希望每天會添加 100k 左右的記錄,它應該很容易檢索一行和一批。

該應用程序將抓取網路,並為字典中的每個單詞找到不同句子中使用的相同單詞並將它們記錄到數據庫中。開發人員主要面向 .net,但他們也精通 C/C++,因為這是一個學術項目,所以基本上任何東西都可以負擔得起。

請每個答案一個平台/產品。

任何大型 RDBMS 系統或 NoSQL 系統都可以處理這種數據負載。早在 2002 年,我有一個包含 1B 條記錄的數據庫表,每天有超過 10 萬條記錄,並且執行的是 SQL Server 2000。今天的系統要快得多(硬體和軟體),應該能夠處理載入沒有問題。最大的問題變成了獲取數據,並根據您想要搜尋的方式正確索引數據以找到它。並且有足夠的記憶體將數據載入到記憶體中以更快地找到它。

我不知道哪個是最好的,但我在 3 個表上執行了一些測試,使用 Guid、BigInt 和 Int 作為主鍵。

每個表有 1,000,000 個條目。在我的機器上檢索整個表需要 12 秒。要檢索 80,000 個,大約需要一秒鐘。

SQL Server 無疑是非常可靠的。

microsoft.com上有這個頁面,其中包含一些關於性能和可擴展性的內容,如果需要,也許您可以找到其他內容。

引用自:https://dba.stackexchange.com/questions/278