Ciência de Dados é explorar Big Data para fazer perguntas para prever o futuro

Alfred Reinold Baudisch
4 min readFeb 16, 2016

--

“A primeira regra da Ciência de Dados é não perguntar o que é Ciência de Dados” Por quê? Ciência de dados é uma filosofia emergente multidisciplinar, um vasto modus operandi que impacta uma mudança cultural nas organizações e no meio acadêmico.
The first rule of Data Science

A habilidade de obter, entender, processar, extrair valor, visualizar e se comunicar com dados vai ser extremamente importante nas próximas décadas, não só no nível profissional, mas também na educação, da educação infantil ao ensino superior, pois agora nós temos basicamente dados em todos os cantos gratuitamente.
Hal Varian, Google

Ciência de Dados é Curiosidade

Ciência de Dados significa fazer perguntas em busca de profundos e ocultos padrões num oceano de dados de diversos formatos. É a combinação de estruturas de armazenamento, programação, estatística e técnicas de visualização para tirar profundas conclusões de grandes quantidades de dados e aplicar em situações reais. É a produção de produtos de dados que respondem perguntas preditivas e a produção de produtos que empoderem outros a usarem os dados.

Enquanto empresas usam análise de negócios e BI para explicar dados exatos que já ocorreram, a ciência de dados visa prever o futuro, pela construção de produtos que direciona os usuários a tomar decisões, como a seção de “produtos que você talvez goste” na Amazon, recomendação de amigos no Facebook, recomendação de filmes na Netflix, algoritmos de negociação no mercado financeiro, etc.

Fluxo

Uma abordagem facilitada do processo da Ciência de Dados

Uma área emergente de trabalho focada na obtenção, preparação, análise, visualização, gerenciamento e preservação de grandes quantidades de informações. Apesar de parecer que o nome Ciência de Dados é mais relacionado a áreas como banco de dados e ciência da computação, muitas habilidades estão envolvidas, incluindo habilidades não exatas.
Jeffrey Stanton, Syracuse University

Ciência de Dados é Multidisciplinaridade

É o envolvimento de um grande conjunto de áreas, que vai da armazenagem, extração e análise de dados, matemática, estatística, design, programação, negócios e pesquisa.

É a inclusão do design como todos os aspectos do produto, da arquitetura, distruibuição até a experiência final funcional.

Design de um produto envolve manter cinco mil coisas na sua cabeça, testando-as em novas e diferentes maneiras para obter o que você quer. E todos os dias você descobre algo novo que é um novo problema ou oportunidade para transformar essas coisas em algo um pouco diferente. E esse processo que é a mágica [do design].
Steve Jobs

A definição de design ajuda a entender que a ciência de dados está envolvida em todas as etapas da busca de respostas a perguntas com o fim de criar produtos de dados.

Diagrama da Ciência de Dados (Data Science Venn Diagram por Drew Conway)

Uma área completamente nova que combina:

  1. Ciência da Computação: armazenar, obter e tratar dados
  2. Matemática e estatística: filtrar e minerar
  3. Design Gráfico: visualizar e refinar
  4. Especialização Científica: perguntar

Ciência de Dados, como é praticada, é uma mistura de programação movida a Red Bull e estatística inspirada com café espresso
Mike Driscoll, CEO metamarkets

Ciência de Dados é Universal

A ciência de dados tem aplicação em quase todos os setores, como:

  • E-commerce: personalização e recomendação
  • Entretenimento: personalização, recomendação, retenção, riscos
  • Marketing Digital: anúncios multiplataforma direcionados em realtime
  • Mídias Sociais: aumento da retenção de usuários, habilidade para detectar padrões de comportamento e sentimento do usuário, reconhecimento facial
  • Serviços Financeiros: análise de crédito, detecção de fraudes, aquisição e retenção de clientes, gerenciamento de risco, análise sentimental
  • Energia: eficiência de uso e redução de apagões
  • Segurança de TI: monitoramento de informações, melhora na detecção de roubos e invasões
  • Saúde: personalização de tratamentos, detecção antecipada através de análise genética
  • Astronomia: busca e reconhecimento de planetas e estrelas

E Big Data? E quem “faz” Ciência de Dados?

No próximo artigo falarei sobre a relação de Big Data com Ciência de Dados, e futuramente, sobre Cientista de Dados e as centenas de habilidades envolvidas, as oportunidades excitantes nessa área e quais os passos para se tornar um.

Cientista de Dados: A profissão mais sexy do século 21
Harvard Business Review

Profissão sexy ou entediante?

Acompanhe

Twitter | LinkedIn

--

--

Alfred Reinold Baudisch

Autistic Savant software engineer with 25+ years of development experience. Also an indie game developer and digital artist.