O que é Ciência de Dados ?
A ciência de dados é uma metodologia que analisa os dados que procura extrair deles informações relevantes para uma tomada de decisão, com isso, o cientista prevê o futuro através das análise combinatórias, sendo esse o papel principal da área.
Há três perguntas essenciais que devem ser respondidas antes mesmo de uma análise de dados bem feita: Por que? Como ? O que?
1 - Por que queremos resolver esse problema ?
2 - Como será feito a solução desse problema? Ou seja, qual a metodologia será usada ?
3 - Qual é a ferramenta que será usada para ?
Qualquer negócio pode e deve fazer a análise de dados, independente da ferramenta. As propostas das informações têm que ir de encontro com a melhoria da gestão, evitando erros, corrigir processos, evitar gargalos no andamento das atividades, evitar desperdícios de recursos. Seja com a ferramenta mais comum, exemplo o Excel, para coletar informações e basear nessas coletas à tomada de decisão, reduz drasticamente os equívocos, deixando o achismo mais assertivo.
Estratégia, a boa comunicação, a análise exploratória são artes que o cientista de dados precisa dominar, para retirar suas grandes conclusões, e não só o domínio da parte técnica.
Um grande problema humano nos negócios é a falta da equalização das informações e o entendimento das estratégia. A ciência de dados facilita essa relação com as ferramentas e organizações de dados, ou seja, os dados contam histórias e o cientista traduz para os tomadores de decisão com gráficos, relatórios, fluxogramas, planilhas.
As principais habilidades para um cientista de dados são:
Analise de dados: Não é só o domínio da ferramenta, mas o entendimento do negócio como todo e através das análises dos dados descobrir como ajudar e a melhorar as decisões .
Probabilidade e Estatísticas: Usar o poder do como, para abordar os problemas e propor soluções com as estatísticas que os dados fornecem, ou seja, criar novas oportunidades.
SQL: Executar consultar ou ações de forma assertiva para melhorar mineração dos dados.
Excel ou Google Sheets: Entender bem essas ferramentas simplificam as analises e baixa os custos, pois é acessível para todas empresas e encaixa perfeitamente para pequenas análises.
Experimentação e testes: Colocar estratégia
Ferramentas de visualização: Saber o conceito da ferramenta e principalmente gerar gráficos que mostrem nos primeiros segundos de observação os objetivos que a imagem quer mostrar.
Python ou R: Essas linguagens de programação são ideais para fazer as análises complexas com estáticas, gráficos, formulas matemáticas e gerar as tomadas de decisões.