Paulo Sasaki & Consultores Associados
Artificial Intelligence, Deep Learning, Big Data, Ciber Security
Desde 1995
blog: paulosasakiblog.wordpress.com
CV´s
Análise - Timing
A Dança de Shiva inicia o Universo ao som do Damaru (tambor), e o encerra com o Fogo da transformação final.
Entre o princípio e o fim, Cronus rege o Tempo e suas métricas.
Sobre Épocas e Grânulos
A segunda atividade mais importante na preparação dos dados para modelagem tem a ver com o Tempo.
Épocas se distinguem por diferenças implícitas de ambiente, que os tornam tão distintos que impossibilitem comparações entre si. No caso de ambientes de TI, pode se chamar de "Época" uma configuração física, por exemplo. Se mudarmos os modelos dos servidores ou a velocidade das linhas de comunicação, os dados da configuração anterior são incomparáveis aos da nova, entrando, portanto, em uma nova "Época".
Já os grânulos ou átomos são as menores unidades de tempo monitoradas para cada entidade sob gestão. Em um conjunto ou integração entre ambientes distintos, a menor unidade possível é dada pela maior unidade de monitoração disponível. Voltando, novamente, aos ambientes de TI, caso estejamos monitorando um MainFrame IBM, que só reporta a cada 30 minutos, de forma integrada com servidores Open (Unix, Windows, Linux, etc), que reportam a cada 5 minutos, os dados dos servidores Open terão de ser sumarizados a cada 30m, como os do MainFrame, de forma a possibilitarem a geração de um registro único para todo o ambiente.
A granulação reversa também pode ser feita (obtendo-se valores médios escalares para a maior granularidade, de forma a fornecer dados que preencham as lacunas até os de menor escala), mas mantendo-se em mente que tais dados NÃO SERÃO mais auditáveis. Ou seja, não há uma fonte documental para os mesmos
Portanto, todos os registros criados para modelagem devem conter o identificador de sua Época (ou config ou outro nome qualquer), que permita que os modelos sejam criados apropriadamente.
Vale notar que um mesmo ambiente pode apresentar sobreposições de Épocas, dependentemente dos modelos de estudo desejados.
Por exemplo, uma Época que se relacione ao ambiente físico pode não ser apropriada a um estudo de duração mais longa, como os comportamentais de clientes a longo prazo.
Neste caso, cada registro do banco deverá conter um enquadramento cronológico distinto, adequado aos modelos que se deseja criar a partir dele, com 2 ou mais campos indicativos das Épocas às quais pertence.
Ia(x) => Índice de Ambiente(x)
O índice de ambiente (Ia), é a maneira mais simples de se calcular uma mudança de época.
Pode ser calculado como a somatória dos KPIs do ambiente, ou seu valor médio, dividindo-o pela quantidade:
Índice do Ambiente (x) seu valor médio
Uma vez calculado para cada registro no tempo, mudanças >20% em seu comportamento (eu prefiro o uso de médias e desvio-padrão), indica que algo SISTÊMICO de grande influência ocorreu.
A importância desse cálculo é que, novamente, por ser sistêmico, um ambiente pode "represar" em certos pontos, e "inundar" outros, mesmo sem alterações significativas. Caso se considere valores pontuais, essas indicações (ou pior, apenas uma delas), já poderia indicar uma mudança no quadro geral.
Já com o uso do Ia, elas se anulam.