選單

適用於 AI 工作流程的統一化資料架構

行走時手持平板電腦並透過玻璃牆觀看的人
目錄

分享本頁

Arunkumar Gururajan
Arun Gururajan

在人工智慧 (AI) 和機器學習 (ML) 快速發展的環境中,管理和處理各種類型資料的能力對於模型產生的見解品質至關重要。

最佳化儲存策略

最佳化儲存策略必須考量下列因素:

  • 企業使用的各種資料類型(資料庫和試算表等結構化資料,以及電子郵件、影像、音訊、視訊和文件等非結構化資料)。
  • 這些資料類型的所在位置 (內部部署和 / 或分散於多個地理區域的一或多個公有雲或 SaaS 供應商)。
  • 儲存架構的類型,例如檔案儲存(資料以檔案形式存取和管理)、區塊儲存(資料儲存為區塊,可實現高效率、低延遲的作業),以及物件儲存(資料以物件形式管理、每個物件都包含資料、中繼資料和唯一 ID,使其具有高度擴充性,適合非結構化資料)。

克服 AI 部署的障礙

為了在企業中廣泛採用 AI 而整合資料架構是一項艱鉅的任務,因此,許多購買 GPU 伺服器或透過大型公有雲存取它們的公司被卡在資料管理階段也就不足為奇了。IDC 研究指出,資料搬移 / 管理是成功部署 AI 的最常見障礙之一。

NetApp 憑藉統一化的智慧型基礎架構方法,無論資料的儲存方式或儲存位置為何,都能讓 AI 團隊打破孤立資料的界限。NetApp 對 AI 工作流程至關重要的具體優勢如下:

  • 資料搬移尤其是在目前的多模態 AI 之中,AI 和 ML 工作流程通常需要在不同處理階段搬移大型資料集。搬移可透過統一化儲存架構來實現,此架構為每個階段提供正確的儲存類型,並根據需要最佳化速度、可存取性或耐久性。這種方法對於推動 AI 運作至關重要,因為必須在推論管道中讓大量資料不受阻礙地移動。
  • 資料管理AI 資料集(包括圖像、影片、感知器資料等)具有多樣化且多模態的特性,需要透過 NetApp 智慧型基礎架構進行彈性的資料管理。NetApp 儲存系統可以有效地儲存這些不同的資料集,方便隨時供複雜的 AI 任務存取。例如,在醫療應用中,醫學成像工作流程受益於區塊儲存,可以對成像資料進行高效存取,另外病患記錄和其他非結構化資料則可儲存為含有豐富中繼資料的物件,以便擷取和分析。
  • 資料治理:企業必須確保透過適當的存取控制來使用正確的資料,同時遵守內部政策和當地法規,確保組織的智慧財產安全無虞且受到保護。NetApp 的資料管理功能已直接將資料治理內建在設計之中。

建置智慧型資料基礎架構

NetApp 客戶多年來一直享有統一化的混合式多雲體驗。事實上,雖然 NetApp 無法預測生成式 AI 在過去 12 個月以來的爆炸性增長,但我們仍忙於建置專為資料導向公司所設計的智慧型資料基礎架構。事實證明,這種架構正是企業運用 AI 和生成式 AI 來獲得競爭優勢的必備要件。

深入瞭解

若要深入瞭解 IDC 針對 AI 工作流程所撰寫的資料架構相關內容,請參閱統一化資料架構為 AI 工作流程提供所需的靈活度,並進一步瞭解 NetApp 高階主管對 AI 和生成式 AI 的觀點

Arun Gururajan

Arun Gururajan 是 NetApp 研究與資料科學副總裁,負責監督整個公司產品系列的 AI/ML/資料科學計畫。在此之前,他曾在 Meta 和 Microsoft 擔任過多項領導職務,開發被廣泛持續採用的 AI 產品。

檢視 Arun Gururajan 的所有貼文

後續步驟

Drift chat loading