Menu

Architetture per i dati unificate per i workflow AI

persona che cammina con un tablet in mano e guarda attraverso la parete di vetro
Sommario

Condivi questa pagina

Arunkumar Gururajan
Arun Gururajan
792 visualizzazioni

Nel panorama in rapida evoluzione dell'intelligenza artificiale e del machine learning, la capacità di gestire ed elaborare vari tipi di dati è fondamentale per la qualità delle informazioni prodotte dai modelli.

Ottimizzazione della strategia di storage

Una strategia di storage ottimale deve prendere in considerazione i seguenti fattori:

  • I vari tipi di dati utilizzati dalle aziende (dati strutturati, come database e fogli di calcolo e dati non strutturati, come e-mail, immagini, audio, video e documenti).
  • La posizione in cui risiedono questi tipi di dati (on-premise e/o all'interno di uno o più cloud pubblici o provider SaaS che sono distribuiti in più aree geografiche).
  • I tipi di architetture di storage come il file storage (i dati sono accessibili e gestiti come file), lo storage a blocchi (i dati vengono archiviati come blocchi che consentono operazioni efficienti e a bassa latenza) e lo storage a oggetti (i dati vengono gestiti come oggetti, ciascuno contenente dati, metadati, un ID univoco che lo rende altamente scalabile e adatto a dati non strutturati).

Superare i blocchi per l'implementazione dell'intelligenza artificiale

Integrare un'architettura dati per l'adozione diffusa dell'AI a livello aziendale è un'attività non trascurabile. Pertanto, non sorprende che molte aziende che procurano i server GPU o vi accedono tramite hyperscaler, si blocchino nella fase di gestione dei dati. Da una ricerca di IDC emerge che lo spostamento e la gestione dei dati sono uno dei blocchi più comuni per un'implementazione AI di successo.

Con un approccio unificato e intelligente all'infrastruttura, NetApp permette ai team AI di trascendere i limiti dei dati in silo a prescindere da come o dove vengano memorizzati. Ecco i vantaggi specifici che rendono NetApp fondamentale per i workflow AI:

  • Spostamento dei dati: i workflow ML, AI e AI multimodale di oggi spesso prevedono lo spostamento di grossi set di dati tra varie fasi di elaborazione. Questo spostamento è facilitato da un'architettura storage unificata, che fornisce il tipo appropriato di storage per ogni fase, con ottimizzazioni per velocità, accessibilità o durabilità in base alle necessità. Questo approccio è essenziale per rendere operativa l'AI, in quanto quest'ultima richiede lo spostamento senza ostacoli di enormi quantità di dati nella pipeline di inferenza.
  • Gestione dei dati: la natura differenziata e multimodale dei set di dati AI, che includono immagini, video, dati di sensori e altri ancora, richiede un approccio flessibile alla loro gestione, reso possibile dall'infrastruttura intelligente di NetApp. Un sistema storage NetApp archivia questi set di dati diversi in modo efficace, per renderli subito accessibili ad attività AI complesse. Ad esempio, nelle applicazioni per il settore sanitario, i workflow di imaging medico possono sfruttare lo storage a blocchi per un accesso dalle performance elevate ai dati di imaging, mentre cartelle cliniche dei pazienti e altri dati non strutturati possono rimanere archiviati come oggetti con metadati approfonditi per un recupero e un'analisi facili.
  • Data governance: le aziende devono assicurarsi di sfruttare i dati giusti con i controlli degli accessi appropriati, mantenendo al contempo la conformità a policy interne e normative locali e tenendo al sicuro le proprietà intellettuali dell'organizzazione. Con le funzionalità di gestione dei dati di NetApp, la data governance è integrata fin dalla progettazione.

Creare un'infrastruttura dati intelligente

Da anni i clienti NetApp godono di un'esperienza multi-cloud ibrida unificata. Di fatto, anche se NetApp non ha potuto prevedere l'esplosione dell'AI generativa degli ultimi 12 mesi, si è comunque impegnata nella costruzione di un'infrastruttura dati intelligente progettata per le aziende data driven. A quanto pare, questo framework è esattamente ciò che serve alle aziende per sfruttare l'AI e l'AI generativa per un vantaggio competitivo.

Scopri di più

Per scoprire di più su ciò che IDC ha scritto sulle architetture dei dati per i flussi di lavoro AI, leggi Unified Data Architectures Provide Needed Flexibility for AI Workflows. E scopri di più sulle prospettive dei dirigenti di NetApp sull'intelligenza artificiale e l'intelligenza artificiale generativa.

Arun Gururajan

Arun Gururajan è vicepresidente della divisione Research & Data Science presso NetApp e si occupa della supervisione delle iniziative AI/ML/Data Science per tutta la gamma di prodotti dell'azienda. In precedenza, ha ricoperto ruoli dirigenziali in Meta e Microsoft, contribuendo allo sviluppo di prodotti di intelligenza artificiale ad ampia e duratura adozione.

Visualizza tutti i post di Arun Gururajan

Passi successivi

Drift chat loading