Menu

Construa seu data Lake no StorageGRID

docas
Conteúdo

Compartilhe esta página

Joseph Kandatilparambil
Joseph Kandatilparambil
1,180 visualizações

Em muitas das principais empresas de hoje, o data Lake está se tornando um grande tópico de conversa. Em setores como finanças, manufatura e saúde, a Internet das coisas (IoT) permite que os dados sejam coletados e agregados de mais fontes do que nunca. Para essas empresas, os principais objetivos da coleta de dados são acelerar a inovação, melhorar a eficiência operacional, melhorar a sustentabilidade, reduzir riscos e, em última análise, melhorar a qualidade de vida. Para alcançar essas metas, as empresas estão procurando maneiras de ajudar os cientistas de dados a obter o máximo de valor dos dados em um ritmo mais rápido e se manter à frente em seu setor.

E a velocidade e os requisitos para análise de dados, aprendizado de máquina e inteligência artificial vêm aumentando. De acordo com a Forbes, 90% dos dados mundiais foram gerados nos últimos 2 anos. Está claro que as necessidades de dados empresariais continuarão a crescer rapidamente. A NetApp está altamente motivada para ajudar nossos clientes a criar pipelines de dados resilientes e ricos em recursos. Com a flexibilidade de se adaptar aos requisitos em constante evolução e escalar com facilidade no futuro.

A manutenção de um data Lake envolve muitas tarefas manuais complexas. Mas, em um data Lake moderno, essas tarefas podem ser simplificadas e automatizadas para tornar os fluxos de trabalho mais eficientes e eficazes. Essas tarefas incluem coleta, ingestão, limpeza, movimentação e catalogação de conjuntos de dados, além de disponibilizar esses conjuntos de dados com segurança para aplicações de análise e aprendizado de máquina. Hoje, muitos de nossos clientes estão buscando o armazenamento de objetos Simple Storage Service (S3) para seus data Lakes, porque o armazenamento de objetos tem vantagens incomparáveis em relação a outras opções, como nas e HDFS. As plataformas de storage de objetos evoluíram ao longo dos últimos anos para fornecer o desempenho, a durabilidade e a escala necessários para aplicações de análise e aprendizado de máquina . Um data Lake moderno que usa storage de objetos quebrará silos, permitindo que os cientistas de dados maximizem o valor com a consolidação de diferentes tipos de dados estruturados, semiestruturados e não estruturados em uma fonte acessível.

Imagem do ciclo de vida dos dados de análise e aprendizado de máquina com o StorageGRID

Ciclo de vida dos dados de análises e aprendizado de máquina com o StorageGRID

A solução de storage baseada em objetos StorageGRID da NetApp, de nível empresarial, líder do setor , está bem posicionada para dar suporte aos workloads atuais de análise e aprendizado de máquina. O mecanismo de gerenciamento do ciclo de vida das informações incorporado diferencia o StorageGRID de outras plataformas de storage de objetos no local. E como as soluções da StorageGRID podem utilizar os serviços de computação, seja em uma nuvem pública ou privada, os cientistas de dados têm a flexibilidade de criar pipelines de dados com uso econômico e de recursos. Além disso, ao separar a computação e o storage, o StorageGRID ajuda a reduzir o TCO geral das aplicações de análise e aprendizado de máquina, já que agora as equipes DE TI podem escalar a computação e o storage de forma independente.

Principais benefícios da criação de seu data Lake no StorageGRID

Ao criar seu data Lake no StorageGRID, você terá os seguintes benefícios:

  • Unificar o namespace de dados minimiza a movimentação de dados e fornece acesso fácil aos recursos de computação.
  • Você pode categorizar e rotular seus conjuntos de dados usando recursos nativos do S3, facilitando o controle de dados confidenciais e a correspondência dos recursos certos para suas tarefas.
  • Você tem a flexibilidade de utilizar qualquer serviço de computação onde quer que esteja, na nuvem pública ou na nuvem privada da sua empresa.
  • A integração aprimorada com o NetApp Cloud Data Sense e aplicações de terceiros agrega valor e organização aos conjuntos de dados, ajudando os cientistas de dados a melhorar a tomada de decisões e reduzir os riscos e custos operacionais.
  • Ao separar os dados em categorias no StorageGRID de acordo com a atividade dos conjuntos de dados, você se dedica apenas à quantidade necessária de recursos para otimizar os custos.
  • As soluções da StorageGRID para governança e proteção de dados permitem Planejar a conformidade de dados como parte da estratégia de implementação de data Lake.
  • Ao usar os recursos de criptografia e as integrações de gerenciamento de acesso no StorageGRID, você pode proteger os dados do data Lake contra acesso não autorizado.

Empresas que querem ajudar seus cientistas de dados a construir um pipeline de dados econômico verão os benefícios da incorporação do StorageGRID em seus data Lakes. A StorageGRID está no mercado há mais de 20 anos, começando com uma solução de armazenamento e gerenciamento de imagens médicas DICOM para empresas de saúde. Desde então, o StorageGRID vem expandindo o suporte para novos casos de uso. À medida que o setor muda, a StorageGRID continua se adaptando e inovando para oferecer aos nossos clientes as vantagens líderes do setor e dar suporte às mudanças nos requisitos.

Saiba mais

Para saber mais sobre como o NetApp pode ajudar sua equipe a modernizar sua arquitetura de dados, confira nosso infográfico sobre como chegar onde você precisa estar nesse mercado competitivo.

Joseph Kandatilparambil

Joseph Kandatilparambil é engenheiro técnico de marketing da StorageGRID, com mais de 7 anos de experiência no setor de armazenamento. Joseph ajuda na inovação orientada para o cliente, capacitando os clientes com soluções que os ajudam a se concentrar em impulsionar seus produtos e expandir seus horizontes. Fora do trabalho, Joseph gosta de kite-surf, escalada e caminhadas.

Ver todas as publicações de Joseph Kandatilparambil

Próximas etapas

Drift chat loading