A cada dia grandes organizações se atualizam com as tecnologias que mais facilitam e se adaptam melhor a cada empresa, enfrentando grandes desafios que lhes permitem descobrir e analisar além das ferramentas que se utilizam no dia a dia, é para elas que foi criado o que é conhecido como Big Data ou em espanhol massivo de dados, que são sistemas de armazenamento de dados em grande escala.
Este fenômeno de armazenamento está enquadrado nas novas tecnologias de informação e comunicação. Big Data é o que ocupa todas as atividades relacionadas aos sistemas que armazenam um grande conjunto de dados. Uma das principais características é que ele manipula uma grande quantidade de informações, coletando, classificando e armazenando. O objetivo desta coleção é criar relatórios estatísticos para uso das organizações, seja como análise de planos de negócios, publicidade, espionagem, entre outros.
A margem de armazenamento cresceu ao longo dos anos, desde 2008, o nível de armazenamento foi medido em petabytes a zetabytes de dados. Os especialistas procuram periodicamente por novas medidas de armazenamento porque há certas áreas onde grandes quantidades de dados precisam ser armazenadas e os programas existentes não são muito adequados.
Existem milhares de ferramentas para criar e gerenciar Big Data, porém nem todas são iguais, existem três tipos de Dados, que são:
- Dados Estruturados: são aqueles em que os dados apresentam uma estrutura muito particular, como datas, números, entre outros. Um exemplo deles são as planilhas.
- Dados não estruturados: geralmente são dados que possuem um formato específico e não podem ser armazenados em uma planilha, muito menos manipular as informações, a exemplo de documentos PDF.
- Dados semiestruturados: este tipo de dado não possui um formato particular, pois possui metadados semiestruturados próprios, um exemplo disso são os códigos HTML.