Os conceitos básicos que culminaram com a formulação das tecnologias de Inteligência Artificial (IA) existem desde o século XIV. No entanto, somente em 1898 começaram a se tornar realidade, quando Tesla estreou o primeiro barco sem piloto controlado por rádio, seguido pelo primeiro carro sem motorista em 1925. O primeiro robô estreou no cinema em 1927, com o lançamento do filme Metropolis.
Essas primeiras referências à IA provavelmente foram vistas como ideias novas que foram recebidas com uma combinação de reverência e medo. Poucas pessoas naquela época poderiam prever que, em apenas 100 anos, a IA se tornaria um aspecto importante e real de nossas vidas diárias. A câmera do seu smartphone sabe como focar automaticamente o assunto principal. O uso suspeito do seu cartão de crédito pode ser identificado instantaneamente. O câncer de cólon já pode ser detectado precocemente. Todos esses avanços, e muitos outros mais, podem ser creditados à IA.
A pesquisa “CIO Agenda 2019” do Gartner mostra que entre 2018 e 2019, as organizações que implantaram a IA cresceram entre 4% e 14%. Essa adoção crescente demonstra o valor das informações de dados e os ganhos resultantes para os negócios que a IA pode oferecer.
Hoje, a IA pode ser aplicada em vários casos de uso, incluindo:
Marketing: redirecionando um cliente ou fornecendo recomendações de produtos a um cliente existente;
Vendas: descobrindo padrões preditivos de vendas, geração de leads, chatbots e bots de e-mail;
Operações: Manutenção preventiva, análise de dados de fabricação;
Atendimento ao cliente: análise de chamadas, sugestões de resposta, processamento automatizado de reclamações;
Segurança de dados e segurança pessoal: segurança cibernética e detecção de fraudes, sistemas de segurança autônomos com inteligência artificial;
Assistência médica: diagnóstico precoce, insights de exames de imagem;
Automotivo: avanços na IoT (Internet das Coisas) e na GPU (Graphics Processing Unit) que possibilitam carros sem motoristas.
Independentemente de seu uso, o coração de toda operação de IA é uma infraestrutura de computação de alto desempenho (HPC). Transformar a IA em resultados reais requer três componentes principais:
Dados muitos e muitos dados. Quanto mais dados, melhores os resultados.
Velocidade de computação extrema para processar e analisar rapidamente Petabytes de dados.
Uma solução de armazenamento que pode acompanhar o poder da computação.
Vamos abordar neste artigo esse último componente, o armazenamento, que pode ser um acelerador essencial em qualquer configuração de IA.
Todo caso de uso de IA ou aprendizado de máquina depende dos dados e das inferências que extraímos desses dados. Esses dados, como parte do processo de IA, passam por vários estágios no fluxo de trabalho da IA e cada estágio tem suas próprias características distintas de entradas e saídas (I/O). É essencial ter uma solução de armazenamento que não apenas ofereça suporte a esses diversos requisitos de I/O, mas também facilite o gerenciamento dos dados.
Armazenamento para todos os estágios do fluxo de trabalho de IA
Cada estágio requer diferentes recursos de armazenamento para alcançar os resultados desejados. Os recursos essenciais para uma implementação bem-sucedida de IA incluem escalabilidade, velocidade, custo e flexibilidade.
O fluxo de trabalho típico da IA possui quatro processos principais:
Ingestão de dados – É o processo de obtenção e importação de dados para uso imediato em qualquer sistema. Pode ser um desafio para as empresas ingerir dados em uma velocidade razoável. Para uma ingestão bem sucedida de dados, é preciso dispor de uma solução de armazenamento capaz de fornecer a escalabilidade, a taxa de transferência e a capacidade necessárias para a ingestão dados de fontes heterogêneas a um custo acessível.
Classificação, preparação e transformação dos dados – Após a ingestão, a classificação, preparação e transformação automatizadas, se existentes, podem reduzir a complexidade no gerenciamento dos dados recebidos de fontes heterogêneas. Uma maneira de fazer isso pode ser dispor de uma solução baseada em políticas, para ajudar na utilização dos mesmos dados em vários casos de uso de IA.
Análise e treinamento dos dados – São processos altamente iterativos, isso é, que fazem progresso através de tentativas sucessivas de refinamento. Cada iteração, dependendo do tamanho dos dados, pode levar muito tempo para ser concluída. Uma solução de armazenamento com baixa latência pode ajudar a concluir um ciclo de treinamento de IA em menos tempo.
Inferência e insights – A etapa final é extrair informações valiosas dos dados, o que pode ajudar uma empresa a alcançar a vantagem competitiva desejada. A velocidade, portanto, é novamente um aspecto importante da solução de armazenamento.
Como o IBM Storage for AI se destaca?
As soluções IBM Storage destacam-se ao endereçar os tipos de desafios que podem surgir em um fluxo de trabalho de IA, ajudando a equilibrar custo e desempenho à medida que são introduzidos mais aplicações de IA em seus negócios.
A IBM oferece um amplo portfólio de soluções de armazenamento definidas por software, para atender aos requisitos de cada estágio do fluxo de trabalho de IA. As soluções disponíveis não apenas fornecem uma arquitetura inteligente, mas também permitem o gerenciamento de dados de maneira eficiente para acelerar o pipeline de dados, desde o estágio de processamento até os insights.
Figura 1: O portfólio do IBM Storage é projetado e otimizado para atender aos requisitos exclusivos de diferentes estágios, da ingestão a insights.
IBM Spectrum Scale
O IBM Spectrum Scale é um produto definido por software, compatível com a família de normas POSIX (Portable Operating System Interface), fornece acesso paralelo aos dados e ajuda a minimizar a movimentação de dados entre os diferentes estágios da IA. O Spectrum Scale disponibiliza várias maneiras de acessar os dados com um único namespace global e, portanto, é útil durante diferentes ciclos de dados, nos quais a ingestão de dados ocorre a partir de fontes globais heterogêneas. O Spectrum Scale move os dados sem complicações e de forma rápida entre as camadas, com latência extremamente baixa e alta taxa de transferência. Também está disponível como um hardware, o IBM Elastic Storage Server, que entrega um tremendo rendimento a partir de apenas uma única unidade.
IBM Cloud Object Storage
Os grandes conjuntos de dados usados pela IA exigem o armazenamento de uma quantidade enorme de dados por um grande período. O IBM Cloud Object Storage é uma solução econômica, escalável, segura, com alta disponibilidade e facilmente gerenciável. Está disponível como uma solução de software e como hardware. O dispositivo físico está disponível desde configurações menores começando em Terabytes e escalando para Exabytes.
IBM Spectrum Discover
O IBM Spectrum Discover é um software moderno de gerenciamento de metadados, que ajuda a trazer estrutura para dados não estruturados. O Spectrum Discover ajuda a acelerar o estágio de preparação de dados, com a catalogação, a classificação de dados não estruturados e a remoção de dados duplicados durante o processo de classificação e transformação do fluxo de trabalho de IA.
IBM FlashSystem
A análise e o treinamento dos dados nos sistemas de IA são processos complexos e, nesta fase, um armazenamento mais rápido é a chave para resultados rápidos. O IBM FlashSystem é desenvolvido e construído com a tecnologia patenteada IBM FlashCore, para fornecer excelente desempenho, com um custo total de propriedade altamente competitivo.
As soluções de armazenamento IBM para AI suportam estruturas de IA como TensorFlow, Caffe, Spark e CNTK.
Conclusão
Quanto mais cedo sua empresa definir uma estratégia consistente de IA, mais competitivo e inovador será o seu negócio. As organizações interessadas em adotar a IA precisam trabalhar com fornecedores que ofereçam uma ampla variedade de soluções de armazenamento para dar suporte a todos os estágios do processo de IA, e o IBM Storage pode entregar isso.
Se você quer conhecer mais sobre armazenamento definido por software e no IBM Spectrum Storage Suite, agende uma conversa conosco aqui.
Tem um projeto em mente? Entre em contato conosco.
Artigo adaptado do artigo “Accelerate AI workloads with IBM Storage”, IBM Systems, 2020.