Qual o melhor tipo para sua empresa?
O armazenamento de dados não é mais uma atividade simples. No passado, os dados eram estruturados na sua maioria e cuidadosamente colocados em um banco de dados, enquanto os usuários salvavam arquivos individuais nos sistemas de arquivos locais em seus desktops. Dizer que os tempos mudaram seria um eufemismo.
O crescimento exponencial dos dados não estruturados está tomando conta do universo digital. Esse afluxo maciço de documentos, vídeos, e-mails e conteúdo da Web faz com que as equipes de TI se esforcem para encontrar melhores formas para armazenar seus ativos de informação. As tecnologias disponíveis nos oferecem algumas opções para trabalhar, mas escolher qual a melhor entre elas não é tão fácil quanto se pode imaginar.
As empresas têm necessidades diversas. Em algumas ocasiões é preciso compartilhar conteúdo com vários colaboradores em diferentes localidades, que irão interagir, editar e gerar novos dados. Em outras situações, possivelmente você tenha um banco de dados grande e complexo com métricas de vendas, que precisa ser processado ou manipulado, o que pode consumir muitos recursos on-premises. Você pode também simplesmente ter dados que precisam ser arquivados.
Independentemente de qual é a necessidade, sempre aparece alguém que rapidamente recomenda a “nuvem” para qualquer cenário de negócios que envolva dados. Entretanto, é preciso saber qual nuvem é a mais adequada para o seu cenário.
No que diz respeito às arquiteturas, existem basicamente três níveis de armazenamento para você escolher: sistemas de armazenamento baseados em arquivos, blocos e objetos.
Armazenamento por objetos (Object Storage)
No armazenamento em nuvem, a definição de “objeto” é bastante simples. O armazenamento por objetos é literalmente uma reunião de dados com um identificador exclusivo e uma quantidade infinita de metadados.
Talvez isso não pareça tão simples, afinal. Vamos dividir o assunto em seus componentes para tentar torná-lo mais claro.
Os dados
Os dados que compõem um objeto podem ser qualquer coisa: um arquivo de áudio de um jingle de publicidade, um álbum de fotos da festa da empresa, o manual de um software com 300 páginas ou simplesmente um agrupamento relacionado de bits e bytes.
Os identificadores
Quando esses dados são adicionados ao armazenamento, geralmente eles recebem um identificador chamado UUID (Universally Unique Identifier) ou GUID (Globally Unique Identifier). Esses identificadores são números inteiros de 128 bits. Em termos leigos, isso significa que o identificador, ou seja, o “nome” do objeto, é um número complexo de classificação. Ele é tão complexo, que permite que cada identificador seja considerado único.
Os metadados
O terceiro e último componente de um objeto são seus metadados, literalmente “os dados sobre os dados”, que podem ser qualquer informação usada para classificar ou caracterizar os dados em um objeto específico. Esses metadados podem ser o nome do jingle, uma coleção de coordenadas geográficas onde um conjunto de fotos digitais foi tirado ou o nome do autor que escreveu o manual do usuário do software.
As vantagens do armazenamento por objetos
As principais vantagens do armazenamento por objetos, e o motivo pelo qual é usado pela maioria dos provedores de armazenamento em nuvem, é que permite o armazenamento de grandes quantidades de dados não estruturados, mantendo uma fácil acessibilidade aos dados. Essa maior quantidade de armazenamento é alcançada graças à sua estrutura plana, usando GUIDs em vez das hierarquias características do armazenamento por arquivos ou armazenamento por blocos, o que faz com que o armazenamento por objetos permita uma escalabilidade infinita. Em outras palavras, ao reduzir a estrutura, há mais espaço para dados.
O nível mais alto de acessibilidade se deve em grande parte aos metadados, que são infinitamente personalizáveis. Pense nos metadados como um conjunto de rótulos para seus dados. Como os metadados podem ser refinados, reescritos e expandidos infinitamente, os objetos no armazenamento por objetos podem ser facilmente reorganizados e dimensionados, com base em diferentes critérios de metadados.
Esse último ponto é o que torna o armazenamento por objetos tão popular para as funções de backup e arquivamento. A natureza irrestrita dos metadados permite que os administradores de armazenamento implementem facilmente suas próprias políticas de preservação, retenção e exclusão de dados, facilitando a consolidação dos dados e a criação de melhores estratégias de “recuperação de desastres”, como Reed-Solomon Erasure Coding e Vault Architecture.
Principais casos de uso do armazenamento por objetos
-
Armazenamento de dados não estruturados, como arquivos multimídia;
-
Armazenamento de grandes conjuntos de dados;
-
Armazenamento de grandes quantidades de ativos de mídia, como arquivos de vídeos, no lugar de unidades de fita locais.
A escalabilidade e a flexibilidade do armazenamento por objetos o tornaram a opção preferida para muitas empresas que estão migrando para soluções em nuvem. Dito isto, a complexidade relativa dos esquemas de nomenclatura para os objetos, aquele identificador de 128 bits, não é exatamente fácil para a maioria de nós, e a abordagem de gerenciamento de metadados pode revelar-se muito complexa ou inadequada para certos casos de uso.
Armazenamento por aquivos (File Storage)
Para os administradores que precisam de uma interface de usuário mais amigável, mas com requisitos mais modestos de armazenamento, pense em milhões de arquivos em vez de bilhões, o armazenamento por arquivos pode ser a resposta.
Como o nome diz, neste modelo os dados são armazenados em arquivos. Esses arquivos são, por sua vez, organizados em pastas e essas pastas são organizadas em diretórios e subdiretórios de maneira hierárquica. Para acessar um arquivo, os usuários ou máquinas precisam apenas do caminho do diretório para o subdiretório para a pasta e para o arquivo.
Como todos os dados armazenados em tal sistema já estão organizados em uma árvore de diretórios hierárquica, como os arquivos no disco rígido, é mais fácil nomear, excluir ou manipular arquivos sem nenhuma interface adicional. Se você já usou qualquer sistema operacional (Windows, Apple iOS ou qualquer outro), provavelmente já conhece esses tipos de árvores de arquivos e pastas e tem experiência em trabalhar com eles.
As vantagens do armazenamento de arquivos
A acessibilidade do armazenamento por arquivos é frequentemente vista como sua principal vantagem. Porém, o uso do armazenamento por arquivos na nuvem adiciona um elemento-chave: o compartilhamento. Nesse método, como em um computador individual, um administrador pode definir facilmente o acesso e editar permissões em arquivos e árvores, de forma que a segurança e o controle de versão sejam muito mais fáceis de gerenciar. Isso permite fácil compartilhamento de acesso e, portanto, fácil colaboração.
A desvantagem dos sistemas de armazenamento por arquivos, no entanto, pode ser notada quando você planeja aumentar o volume de seus dados. Há certo ponto em que a hierarquia e as permissões se tornam complexas o suficiente para degradar significativamente o desempenho do sistema.
Casos de uso mais comuns para o armazenamento por arquivos
-
Armazenamento de arquivos para um diretório em um repositório de conteúdo;
-
Armazenamento de arquivos em ambientes pequenos de desenvolvimento ou data center, uma opção econômica para arquivamento local;
-
Armazenamento de dados que requer proteção de dados e fácil implantação.
De um modo geral, quantidades variáveis de dados estruturados funcionam bem em sistemas de armazenamento por arquivos. Se isso descreve o perfil de dados da sua organização e você precisa de um compartilhamento robusto, o armazenamento de arquivos na nuvem pode ser a opção mais adequada.
Armazenamento por Blocos (Block Storage)
Atualmente, muitas cargas de trabalho corporativas baseadas na nuvem estão usando armazenamento em bloco. Nesse tipo de armazenamento, os dados são divididos em partes chamadas blocos e, em seguida, armazenados em um sistema que pode ser fisicamente distribuído para maximizar a eficiência. Cada bloco recebe um identificador exclusivo, que permite ao sistema de armazenamento reunir novamente os blocos quando os dados que eles contêm são necessários.
As vantagens do armazenamento por blocos
Um sistema de armazenamento por blocos na nuvem é usado em cenários em que é importante poder recuperar e manipular dados rapidamente, com o sistema operacional acessando esses pontos de dados diretamente nos volumes de blocos.
O armazenamento por blocos também dissocia os dados dos ambientes do usuário, permitindo que esses dados sejam espalhados por vários ambientes. Isso cria vários caminhos para os dados e permite que o usuário os recupere rapidamente. Quando um usuário ou aplicativo solicita dados de um sistema de armazenamento por blocos, o sistema básico de armazenamento remonta os blocos de dados e apresenta os dados ao usuário ou aplicativo.
As principais desvantagens do armazenamento por blocos são a ausência de metadados, o que limita a flexibilidade organizacional, o custo maior e a complexidade mais alta, em comparação com as outras soluções que apresentamos.
Principais casos de uso para armazenamento por blocos
-
Armazenamento de bancos de dados;
-
Armazenamento para volumes RAID;
-
Armazenamento de dados para sistemas críticos, que impactam as operações de negócios;
-
Armazenamento de dados como sistemas de arquivos para sistemas operacionais de software de virtualização de terceiros.
O desempenho relativamente rápido e confiável do sistema de armazenamento por blocos o torna a tecnologia preferida para bancos de dados. Pelo mesmo motivo, além de funcionar bem para bancos de dados, também fornece um bom suporte para aplicativos corporativos: para aplicativos de negócios baseados em transações, o armazenamento por blocos garante que os usuários sejam atendidos com rapidez e confiabilidade. Os sistemas de arquivos de máquina virtual (VMFS), como o VMware, também tendem a usar o armazenamento por blocos, devido à maneira como os dados são distribuídos por vários volumes.