Governança e Qualidade de Dados - A informação é o poder
Quem tem a informação e a usa tem o poder. O poder de estar bem informado, o poder de estar a frente, o poder ser melhor preparado, o poder de planejar melhor as estratégias, o poder de conquistar seus objetivos e por incrível que pareça até o poder de prever o futuro. Esses são alguns super poderes que a informação proporciona à quem a detém.
Imaginamos o seguinte cenário: é apresentado o dado 38. Esse número sozinho não fornecer a informação necessária da sua representatividade, então fica o seguinte questionamento: 38 o quê ? Número do calçado ? Calibre do revolver ? Dinheiro ? Balinhas ? A mensagem apresentada é que o dado por si só não gera informação, por sua vez não gera conhecimento. O dado é uma pedra bruta que precisa ser trabalhada.
Ao apresentar o número 38 e dizer que é a temperatura corporal, o que logo vem a cabeça? Febre? Deduzir o estado febril sem alguns questionamentos é ser leviano. Há uma série de perguntas para as duas informações apresentadas. Exemplo: foi usado qual medida da temperatura (Celsius, Fahrenheit, Kelvin)? Foi usado qual tipo de termômetro para aferição? Corpo medido é de um ser humano? Qual ambiente foi medido essa temperatura?
Contextualizar os dados coletados é de suma importância para gerar informação e usar o conhecimento a favor da situação. Voltando ao cenário hipotético apresentado foi: aferido em ser humano, com um termômetro digital usando a temperatura Celsius, em uma ambiente monitorado e não dentro de ambientes extremos.
A contextualização do dado 38 apresentado foi gerada e lapidada, porém a informação por si só não é de grande valia, pois caso não houver o conhecimento do que deve ser feito a informação, nada é valido.
Com a contextualização pode-se afirmar que é uma pessoa com febre, ou seja, há informação. O que é preciso ser feito para reverter o quadro clinico do paciente é o conhecimento. Exemplo: medicar com antitérmico.
Existe a pirâmide da informação, onde é composta por dados que sustenta esse diagrama, informação que é contextualização dos dados coletados e o conhecimento que é ação que será realizada com a informação analisada.
Conceitos básicos
A inteligência está presente em todas as instituições, empresas, governo e em quase tudo que possamos imaginar e inclusive na vida pessoal.
Quando decide ler um artigo para captar informação e melhorar seus conhecimento é uma decisão inteligente e provavelmente melhora o arsenal de conhecimento das suas habilidades, ou seja, inteligência é transformar informação em conhecimento.
Há um termo muito conhecimento: inteligência competitiva. É o ato de entender uma indústria e os concorrentes para que a empresa possa tomar as melhores decisões. Essa inteligência ajuda as organizações na manutenção de sua competitividade a partir do uso do conhecimento.
O tempo para processar os dados, gerar informação e transformar em conhecimento é muito valioso, por isso cada vez mais a busca por técnicas e ferramentas que agiliza todo esse processo.
Um grande conjunto de dados gerados e armazenados com os quais os aplicativos de processamento de dados tradicionais ainda não conseguem lidar em tempo tolerável, ou seja, surge a necessidade da humanidade processar em tempo real os dados produzidos por ela.
Big Data
O que é exatamente o termo BIG DATA ? São dados com grande variedade e volumes enormes com tendência a crescimento a uma velocidade cada vez maior. As cinco dimensões do Big data, também conhecida com os cinco V's, são:
- Volume
- Variedade
- Velocidade
- Veracidade
- Valor
Qualidade
O que é ter qualidade? Provavelmente vem a sua mente a característica de algo bom, mas a qualidade pode ser usado também para algo ruim, exemplo: esse produto é de baixa qualidade. Então significa que na coleta de dados acontece a classificação ter qualidade, ter boa qualidade ou alta qualidade.
Para uma alta qualidade nas informações apresentadas, é necessário obedecer os seguintes elementos:
- Desempenho
- Confiabilidade
- Conformidade
- Durabilidade
- Disponibilidade
E para ser de alta qualidade as informações coletadas é necessário:
- Consistente
- Confiável
- Relevante
- Estar disponível
- Coletados
- Higienizados
- Padronizados
- Contextualizados
- Disponibilizados
- Consistente
- Confiável
- Relevante
- Ter contexto
- Estar disponível
- Coletas organizadas
- Higienizados
- Padronizados
- Contextualizados
- Disponibilizados
A sociedade do conhecimento
A todo instante estamos gerando dados através dos smartphones, computadores e até caminhando pela a rua há uma câmera filmando nosso comportamento e esses registros são transformados em informações.
Um exemplo corriqueiro de coleta de dados é na fila do supermercado. Passando o produto pelo o caixa gera um gama de informações do que será feito pelo o cliente no futuro. Um homem adulto passando pelo o supermercado comprando balão cor de rosa e uma vela no formado de número 2. O que o supermercado pode deduzir ? Provavelmente irá acontecer uma festa de aniversário, que o homem tem uma filha do sexo feminino, e essa festa irá acontecerá no dia ou nos próximos dias, porém mais do que isso, posteriormente pode ser oferecido aquele cliente fraldas, leites, brinquedos e com isso a empresa ganha em publicidade aumentando suas vendas.
A sociedade está estabelecendo cada vez mais por meio digital suas relações, ou seja, registrando a todo momento e facilitando o monitoramento das mesmas. Vivemos em um sociedade super conectada, pois todos nós temos um perfil digital que é virtualmente universal e eterno.
Os data centric como são conhecido as pessoas ultra conectadas. E nossa sociedade a maioria das pessoas podem ser rotuladas com esse nome. Fazer escolhas através de recomendações, buscas, avaliações é cada vez mais comum. Também contribuímos colaborando, comentando, compartilhando.
Há muito tempo o conhecimento era passado de pessoa à pessoa, exemplo clássico, o professor ensinava para o aluno o que fazer e como fazer. Atualmente o conceito moderno de educação é o aluno "aprender a aprender". Para aprender as pessoas buscam informações na internet, nas redes sociais, nos site de busca e aprender a pesquisar é mais importante que memorizar, assim nasce o conceito "aprender a aprender".
A construção da impressão digital está em evolução o tempo todo, devido aos constantes registros. Até mesmo quando estamos offline há o monitoramento, registro e rastreamento.
O uso ético dos dados
As questões de privacidade estão cada vez mais sensíveis e a tecnologia e o uso dos dados afetam enormemente estilo de vida das pessoas, assim vem as preocupações com a privacidade, segurança e governança de dados.
Estamos em uma sociedade digital conectada e faminta por informações. O celular incorpora a principal interface com as redes sociais e possui mecanismos de monitoramento. GPS é um exemplo.
As preocupações de uso ético dos dados são definidas pela a cultura daquele país, exemplo a preocupação aqui no Brasil é diferente na China. As regras mudam dependendo do local.
Para a governança de dados funcionar de fato, deve preocupar com os 5 passos:
- Identifique os titulares da informação
- Determine a situação atual (onde irá usar os dados)
- Desenvolva uma estratégia (como coletar e usar dados)
- Use a informação da melhor forma possível
- Meça Riscos e resultados
Plano de Qualidade de Dados
Os pilares para uma qualidade da governança de dados é:
- Qualidade Total e certificações dessa qualidade
- Planejamento da qualidade dos dados
- Gestão da Qualidade de Dados
- Garantia e Controle da Qualidade
Como fazer uma boa qualidade do conhecimento ? Seguindo as normas
- Inspeção (aferir sem como está os dados coletados)
- Controle
- Garantia da Qualidade
- Qualidade Total (normas iso)
- Qualidade na perspectiva do cliente
- Adequação
- Acurácia
- Interoperabilidade
- Segurança de acesso
- Conformidade
- Maturidade
- Tolerância a falhas
- Recuperabilidade
- Conformidade
- Inteligibilidade
- Apresentabilidade
- Operacionalidade
- Atratividade
- Conformidade
- Comportamento em relação ao Tempo
- Utilização de recursos
- Conformidade
- Analises
- Modificações
- Estabilidade
- Testes
- Conformidade
- Adaptabilidade
- Capacidade para ser instalado
- Coexistência
- Capacidade para substituir
- Conformidade
- Consistente
- Confiável
- Relevante
- Ter Contexto
- Estar Disponível
Para o conhecimento ser classificado de alta qualidade, precisa ser:
- Coletados
- Higienizados
- Padronizados
- Contextualizados
- Disponibilizados
- Coletados
- Higienizados
- Padronizados
- Contextualizados
- Disponibilizados
Os critérios definições de alta qualidade passa a ser conformidade, ou seja, algo que corresponda exatamente as especificações satisfazendo as exigências do consumidor da informação. Os processos de gestão de qualidade devem ser contínuos em constante evolução e sempre questionado "Por quê?" e "Como ?".
Implantar a Governança de Dados
O que é mais valioso na instituição? Seja ela privada ou pública! Acertou quem disse o conhecimento. E a geração desse conhecimento é gerado por dados, por sua vez deve passar a ser bem governado.
Governança de dados é um sistema de tomada de decisões executado por um modelo que descreve quem age com qual informação, em que momento, usado que métodos e sob quais circunstancias. Para implantação da governança de dados deve levar em consideração:
Objetivos:
- Proteção da informação
- Eficiência nos processos
- Redução de custos
- Transparência
Departamento deve englobar em suas atividades:
- Um conselho
- Procedimentos
- Planos de ação
O primeiro passa para implantar a metodologia é definir quem é o governador de dados (Chief Data Officer) que irá estabelecer um comitê de governança determinando quem é o titular de cada informação. E todo o processo de governança começa com o diagnóstico e o planejamento.
Diagnóstico de Planejamento:
Todo diagnóstico deve ser baseado em uma metodologia de avaliação. Que segue os passos:
- Determinar a situação atual
- Que dados existem na organização atualmente ?
- Quais são os dados mais sensíveis ?
- Que medidas de proteção existem
- Qual a qualidade atual dos dados
- Desenvolver uma estratégia
- Escrever a missão da comissão de governança de dados e a visão que a organização tem sobre os dados
- Estabelecer um projeto, priorizando as áreas mais sensíveis estabelecendo os objetivos estratégicos
- Desenvolver o plano táticos e operacional
- Quem é o titular do dado?
- Quem tem acesso?
- Quais são as alçadas ?
- Qual o objetivo do acesso ?
- Como se controla ?
- Plano de ação em caso de desvio e saber quais os valores desses dados
- Definir uma lista de riscos e oportunidades
- Classificar estes riscos de acordo com a probabilidade e impacto
- Estabelecer planos de ação para os riscos que devem ser mitigados ou impactos podem causados ou remediados
- Monitorar sempre