Sql-Server

將 cdc 應用於現有數據倉庫

  • September 29, 2015

我正在建立一個教育數據倉庫。我有各種維度,我想跟踪對 DimStudent、DimClass、DimCollege、DimExamPaper 等的更改。我的解決方案目前在載入暫存表之前刪除鍵、截斷表並重新創建鍵,然後繼續載入維度表和事實表.

因此,我的問題是我需要進行的最小物理更改是什麼——>在載入之前截斷臨時表,跟踪臨時表、暗表和事實表之間的更改,以將行增量載入到暗表和事實表? 我是否需要添加一個/多個表來跟踪每個維度或事實表的更改?我看過一些例子,但似乎只有一張桌子需要做大量的工作。我有 11 個維度、4 個事實表和 22 個臨時表。

看到沒有人幫助我解決這個問題,我會回答自己以幫助任何正在尋找同一件事的人。看起來好像要在現有倉庫上啟用 CDC,您需要逐表執行此操作,建議在每個表的包中擷取所有 ETL。此外,建議為每個表啟用 CDC 狀態以避免衝突。推薦的方法是 –> 在源數據庫上啟用 CDC。將增量負載轉移到 DWH 內的暫存數據庫或模式。將記錄增量載入到維度和事實。我在網上可以找到的每個範例都是針對一個表的,這是相當無用的……如果有人能找到多個表的 CDC 範例,將不勝感激……

引用自:https://dba.stackexchange.com/questions/66548