Paulo Sasaki & Consultores Associados
Artificial Intelligence, Deep Learning, Big Data, Ciber Security
Desde 1995
blog: paulosasakiblog.wordpress.com
CV´s
Dados - BIGDATA
ARE
YOU
READY
???????
O jovem e intrépido Campeão O sábio e muito bem treinado Mestre
Fala-se muito, e já há algum tempo, à respeito dos "DADOS GRANDES", geralmente promovendo o pânico, e, claro, junto com os produtos miraculosos que, supostamente, protegeriam as pessoas e, principalmente, organizações, de seus temíveis efeitos. Por isso, certo de que já estamos todos ciêntes deles, gostaria de abordar este assunto sob uma ótica um pouco diferente.
Geralmente, quando chamamos algo de "GRANDE", também o estamos, simultaneamente, adjetivando como "temeroso". E o fato de a maior parte do mundo de TI ter promovido e aceito tal nomenclatura é bastante significativo.
No meu entender, a resposta à pergunta dos vídeos ("você está pronto ???"), é NÃO! Não estamos preparados sequer para caracterizá-los ou categorizá-los de forma apropriada, quanto mais a processá-los adequadamente, fazendo frente a seus efeitos.
Como um gigantesco exército de formigas, os dados chegam à nós a uma enorme velocidade, e sua quantidade os tornam invencíveis, exatamente como na natureza.
Não conseguimos prevê-los, gerenciá-los, e, muito menos, responder adequadamente.
Mesmo as tentativas elegantes de classificação (como "Bases de Dados" versus "Não-Estruturados"), me parecem fúteis, pois eles continuam "brotando do chão" em quantidades imensas e crescentes.
E, exatamente como no caso dos vídeos, não há qualquer culpa à ser atribuida aos envolvidos.
A Era da Informação simplesmente ultrapassou os Recursos de Informação.
Em Fevereiro de 1946 surgiu o ENIAC, com suas quase 20.000 válvulas, kilometros de cabeamento, e uma equipe da Universidade da Pensilvania, chamada de "computadores", para calcular os "liga-ou-desliga" de suas chaves (entradas), que alimentavam os sistemas valvulares (cpu e memória), e apresentava seus resultados em paineis de pequenas lampadas (saída).
Ou seja, em quase 70 anos, nenhuma idéia nova surgiu no mundo da computação. Substituímos as válvulas por micro-chips, as entradas são por bluetooth ou redes wi-fi, as saídas cantam e dançam em visores de alta definição, desde telões até pequenos portáveis, MAS A ARQUITETURA COMPUTACIONAL CONTINUA A MESMA!
ENIAC - 1946
Electronic Numerical Integrator Analyzer and Calculator
John Eckert e John Mauchly
Electronic Control Company
Em 1947, Turing apresentou as bases de um sistema computacional que poderia aprender com a experiência, e provido de mecanismos que lhe permitissem sua auto-reprogramação, e consequentemente, sua auto-adaptação à mudanças, quantitativas ou qualitativas.
Um sistema como este ainda não existe, exceto na forma de simulácros, que se valem da estrutura computacional antiga, mas que, em grande velocidade, ou distribuídos entre vários processadores, operam "como se" fossem capazes de tais feitos, como o JAVA Hadoop, baseado no "MapReduce" e no "GoogleFS", que armazenam redundantemente enormes quantidades de dados (HDFS), e geram listas ou índices (Reduce Function), mas que ainda precisam ser submetidas à critérios préviamente definidos nas funções, ou ao excrutínio de pessoas, para que se tornem uma forma de conhecimento útil.
É meu entendimento de que só estaremos prontos, de fato, para o fenomeno dos Grandes Dados, quando dispositivos física e arquiteturalmente semelhantes ao modelo de Turing forem criados.
Até lá, enfrentaremos os exércitos de formigas com vassouras de palha, paus e pedras.
Dados - BIGDATA