Os dados da computação na borda (edge computing), da nuvem e da Internet das Coisas estão mudando a maneira como as empresas armazenam, analisam e gerenciam todas as informações geradas no perímetro da empresa. No entanto, o armazenamento na borda está recebendo pouca atenção da TI ou dos fornecedores.
A centralização sempre foi o paradigma dominante e se existisse armazenamento na extremidade da rede da empresa, talvez estivesse em um pequeno servidor em um escritório remoto ou em um laptop corporativo, somente porque contribuía para o principal armazenamento de dados corporativos. O maior foco de atenção nesses casos, talvez tenha sido os riscos adicionais à segurança que essa prática traz.
Atualmente, como a nuvem virou de cabeça para baixo os modelos arquitetônicos duradouros e elevou a importância da própria borda, particularmente em conexão com a IoT e a Internet Industrial das Coisas (IloT), o que antes era um assunto sem importância começou a se destacar. A IoT, e especialmente a IIoT, estão se tornando fontes de vastas quantidades crescentes de dados, e alguns deles, mas não todos, podem ser bastante valiosos. O armazenamento de dados IoT e IIoT está se tornando um ponto crítico de atenção.
Por exemplo, milhares de câmeras de vídeo que geram grandes quantidades de dados mantêm muitas cidades seguras. Em outras áreas, volumes enormes de dados vêm de locomotivas pesadamente instrumentadas, aeronaves e até operações agrícolas, onde os sensores do solo estão ajudando os agricultores a ajustar as aplicações de fertilizantes e pesticidas e a irrigar com precisão. Todos esses dados podem facilmente sobrecarregar os modelos tradicionais de armazenamento centralizado, o que levou a experimentos com pré-processamento e análise na fonte e centralização de apenas uma pequena parte dos dados.
Apesar de um grande volume de dados na borda da empresa não ter muito valor, são os dados externos que mais importam e devem ser extraídos e avaliados.
Normalmente, pensamos que qualquer coisa que não seja o data center está na borda, seja escritório remoto, filial ou IoT, e se pensarmos no data center clássico como a borda e a nuvem como o núcleo? Se você tiver vários sites de borda distribuídos, poderá fazer um backup do tipo peer-to-peer, em que um protege remotamente o outro, ou todos eles protegem o data center principal ou a nuvem.
Repensando o armazenamento de dados para a IoT
A computação de borda, a nuvem e a IoT convidam a repensar o armazenamento.
É verdade que, com o aumento da adoção e dos casos de uso da IoT, a computação de borda ganhará destaque, entretanto, na maioria das vezes, os dados gerados por esses dispositivos IoT são transitórios. Depois de analisá-lo e obter insights, apenas os insights precisarão ser armazenados. Felizmente, reter os insights e não os dados brutos não consume muito armazenamento.
As empresas não têm feito backup de muitos dados gerados em locais externos, como aqueles gerados a partir de trabalhos em casa ou de operações da fábrica. Além disso, esses dados não são críticos para os negócios. Da mesma forma, o estado atual é válido para planos de recuperação de desastres.
Com todas essas novas tecnologias, IoT, IIoT e IoD (Dispositivos da Internet das Coisas), você definitivamente precisará ter mais armazenamento nos pontos finais. Isso é verdade mesmo se os dados permanecerem lá apenas por um curto período de tempo.
É preciso fazer uma distinção entre armazenamento, principalmente armazenamento para aplicativos de IoT na borda da empresa, conectado diretamente a sensores ou a bordo de um caminhão e infraestrutura de armazenamento na borda, que pode estar a alguma distância, mas ainda muito mais próxima do que, por exemplo, um data center .
O armazenamento na borda continua a crescer de várias maneiras, tanto para vigilância por vídeo, telemetria quanto para aplicativos reais que estão sendo empurrados para a borda, como análise de dados de fluxo de cliques, acontecendo quase em tempo real.
Nem é uma questão de escolher um ou outro. As empresas determinarão onde os dados são armazenados caso a caso, mas os dados provavelmente passarão algum tempo na borda da empresa ou nas proximidades dela. Você pode analisar rapidamente os dados na borda ou enviá-los de volta para análises mais tradicionais de repositório e, em muitos casos, provavelmente fará os dois procedimentos.
O problema de mover todos esses dados
Para os aplicativos IoT ou IIoT mais ricos em dados, a movimentação de dados ainda é um processo físico.
Pense na quantidade de dados gerados em uma perfuração offshore. As essas empresas certamente estão coletando terabytes, se não petabytes, de dados nas bordas e alguns deles podem ser processados no local, mas alguns precisam ser enviados fisicamente para um data center . A abordagem antiga era gravar em fita ou disco e enviar por portador ou correios para a central.
Agora existem alternativas, como o Snowball da AWS, que foi um dos primeiros dispositivos de armazenamento disponibilizados por um provedor de nuvem.
Além disso, algumas implementações de IoT incluem dispositivos com grande armazenamento interno de acesso direto, principalmente em servidores de borda ou clusters de servidores. Também existem dispositivos de IoT com uma pequena quantidade de armazenamento incorporada, e existem até empresas que utilizam cartões SD para fornecer armazenamento extra no dispositivo ou na borda da empresa.
Além de simplesmente reconhecer a necessidade de movimentação de dados e armazenamento de dados para aplicativos de IoT, também é necessário entender que nem todos serão dados comuns de protocolo NFS. Isso ocorre principalmente quando se trata da IIoT, que tende a gerar necessidades de armazenamento muito mais diversas. Algumas organizações podem utilizar iSCSI ou mesmo sistemas de arquivos POSIX (Portable Operating System Interface).
Não é preciso ficarmos obcecados com a quantidade potencial de dados.
Todo mundo pensa que volume de dados da IoT equivalem a volume de armazenamento quando, na realidade, se referem à análise. Embora os dados gerados pela IoT tenham valor e o armazenamento dos dados da IoT seja importante, criar data lakes não é o que as áreas de negócios que usam a IoT desejam. Eles certamente não querem data lakes isolados.
O que as organizações desejam é uma plataforma de dados aberta, que seja alimentada por fontes de dados variáveis e as formate para ajudá-las a tomar decisões contextuais.
Isso soa como uma oportunidade de ouro para os fornecedores? Sim, mas os participantes provavelmente não serão as empresas de armazenamento tradicionais.
Fornecendo as análises necessárias
A conexão de dispositivos à rede é geralmente considerada uma coisa boa, e agora que os dados estão disponíveis em objetos e outros ativos que não podiam ser obtidos anteriormente, isso abre uma série de novas oportunidades de serviço para todos.
Operadoras, provedores de serviços, provedores de rede, provedores de nuvem, empresas de software de gerenciamento de dados e, é claro, fornecedores de hardware de armazenamento poderiam reivindicar uma parte da torta. Mas se eles querem fazer isso é outra questão.
Aqueles fornecedores que estão acostumados a mover grandes quantidades de dados, por exemplo, podem achar difícil mudar o modelo do seu negócio.
Da mesma forma, os fornecedores tradicionais de hardware de armazenamento podem não estar prontos para fornecer os recursos analíticos intermediários necessários, porque estão focados na venda de caixas.
No entanto, os desafios da IoT, armazenamento de dados da IoT e computação na borda da empresa serão resolvidos, mudando para ambientes definidos por software, onde nenhum jogador precisará criar nada de muito novo. Em vez de ter matrizes, dispositivos ou aplicativos específicos, haverá muito mais definições feitas por software junto à infraestrutura física que está por baixo.
Definindo uma direção
À medida que o próximo cenário se descortina, haverá muito trabalho a fazer.
Em muitos casos, os dispositivos IoT ou sua aquisição são orientados pelos requisitos das unidades de negócios, e esses líderes raramente são especialistas em TI. Dessa forma, considerações sobre proteção e gerenciamento de dados podem se tornar uma reflexão que as operações de TI devem abordar antes de qualquer definição.
Felizmente, do ponto de vista tecnológico, não há muita inovação necessária para resolver a maioria desses desafios. A tecnologia de backup e recuperação de desastres existente pode cobrir atividades remotas, incluindo a IoT.
O único requisito adicional é o aumento da escala, à medida que mais e mais aplicativos geram dados. Os esforços para lidar com essa escala estão sendo providenciados por fornecedores no espaço de infraestrutura hiperconvergente, juntamente com os fornecedores de ferramentas de backup que estão se expandindo nesse espaço.
Trata-se de um padrão familiar. Há grandes ondas que observamos periodicamente, sejam de modelos distribuídos para centralizados e de centralizados para distribuídos. Esta é apenas mais uma delas.
Fonte: Managing storage for IoT data at the enterprise edge – Tech Target, Search Storage