選單

什麼是重複資料刪除技術?

主題

分享本頁

刪除重複資料技術是消除過多資料複本並顯著降低儲存容量需求的一個過程。

重複資料刪除技術可以在資料寫入儲存系統時作為即時程序執行,也可以 / 或作為背景程序執行,在資料寫入磁碟之後消除重複的項目。

NetApp 的重複資料刪除技術是一項零資料遺失技術,可同時以即時程序和背景程序的形式運作,以達到最大的成本節約效益。以即時程序的形式執行時不會干擾用戶端作業,在背景中全面運作則可達到最大的成本節約效益。重複資料刪除功能預設為開啟,系統會自動在所有 Volume 和 Aggregate 上執行,無需任何手動介入。

重複資料刪除作業的效能例行成本很少,因為它是在獨立於用戶端讀寫網域的專用效率網域中執行。無論執行什麼應用程式或如何存取資料(NAS 或 SAN),它都會在背景中運作。

當資料複寫到災難恢復站台、備份到保存庫,或是在內部部署、混合雲和 / 或公有雲之間移動時,重複資料刪除技術都能隨著資料搬移而繼續維持成本節約效益。

重複資料刪除透過丟棄重複的資料塊來減少磁碟區所需的實體儲存量。

重複資料刪除技術如何運作?

重複資料刪除作業可在整個 FlexVol® Volume 內的 4KB 區塊層級,以及在 Aggregate 中的所有 Volume 之間運作,僅儲存唯一的資料區塊,並消除重複的資料區塊。

重複資料刪除技術的核心是指紋,也就是所有 4KB 資料區塊的專屬數位簽章。

當資料寫入系統時,即時重複資料刪除引擎會掃描傳入的區塊、建立指紋,並將指紋儲存在雜湊儲存區(記憶體內資料結構)中。

指紋經過計算後會在雜湊儲存區中執行查詢,當雜湊儲存區中有指紋相符時,便會在快取記憶體中搜尋與重複指紋對應的資料區塊(貢獻者區塊):

  • 如果找到,則會在目前的資料區塊(受體區塊)和貢獻者區塊之間進行逐位元組比較,以確保完全相符。一旦驗證通過,受體區塊就會共用相符的貢獻者區塊,但不會將受體區塊實際寫入磁碟中,只是更新中繼資料以追蹤該共用詳情。
  • 如果在快取記憶體中找不到貢獻者區塊,則會將貢獻者區塊從磁碟預先擷取到快取中進行逐位元組比較,以確保完全相符。一旦驗證通過,受體區塊會標示為重複,不會實際寫入磁碟中,並會更新中繼資料以追蹤共用詳情。

背景的重複資料刪除引擎也是以相同的方式<運作。它會掃描 Aggregate 中的所有資料區塊,並透過比較區塊的指紋和逐位元組比較來消除重複資料,以避免任何誤報誤刪。此程序還可以確保重複資料刪除作業期間不會遺失資料。

NetApp 重複資料刪除技術的效益

NetApp® 重複資料刪除技術具有以下幾點優勢:

  • 可在 NetApp 或第三方的主要、次要及歸檔儲存設備上運作
  • 與應用程式無關
  • 與傳輸協定無關
  • 例行成本最低
  • 在 NetApp AFFFAS 上運作
  • 逐位元組驗證
  • 可套用至新資料或先前儲存在磁碟區和 LUN 中的資料
  • 在非尖峰時段執行
  • 已整合其他 NetApp 儲存效率技術
  • 使用 NetApp SnapMirror® 複寫技術或 Flash Cache 智慧型快取時,可受益於重複資料刪除技術,延續成本節約效益
  • 免費

重複資料刪除使用案例

無論工作負載類型為何,重複資料刪除技術都很實用。在使用多個虛擬機器進行測試 / 開發和應用程式部署的虛擬環境中,可獲得最大的使用效益。

虛擬桌面基礎架構 (VDI) 是重複資料刪除技術的一個絕佳選擇目標,因為桌面之間的資料重複比例非常高。

某些關聯式資料庫(例如 Oracle 和 SQL)無法從重複資料刪除中大幅受益,因為它們通常會為每個資料庫記錄提供唯一的鍵值,這會阻礙重複資料刪除引擎將它們識別為重複資料。

設定重複資料刪除技術

AFF 系統上的所有新 Volume 和 Aggregate 都會自動啟用重複資料刪除技術。在其他系統上,則可根據每個 Volume 和 / 或每個 Aggregate 來啟用重複資料刪除技術。

啟用後,系統會自動同時執行即時和背景作業以最大限度地節省成本。

Drift chat loading