top of page

Ciência de Dados: Que ciência é essa? Como ela se conecta com as Geociências?

Foto do escritor: Business to ScienceBusiness to Science

Talvez você já tenha ouvido falar sobre ciência de dados, muito provavelmente nos últimos anos você escutou algo relacionado a Data Science. Mas você saberia dizer do que se trata e quais aplicações dessa “nova ciência” em Geociências? 


Fato é que, com o avanço da internet e sua popularização, os seres humanos foram gerando e compartilhando cada vez mais dados e fazendo isso de forma cada vez mais rápida. Pense: com tamanha velocidade com que os dados mudam e são gerados, fica difícil acompanhar tudo isso e realizar uma análise. É nesse contexto que os seres humanos desenvolveram ferramentas e métodos para poderem lidar com esta nova questão do século e acompanhar as mudanças. 


O que é e como faz?


Ciência de dados

A ciência de dados pode ser definida como um estudo cuja finalidade consiste na extração de insights significativos que estão “escondidos” nos dados de uma organização. Isto é feito utilizando ferramentas como matemática, estatística, programação, análise avançada e inteligência artificial aliado à expertise nos tópicos para que se obtenha informações significativas, levando as empresas a resultados melhores, por exemplo.¹² De modo mais claro, podemos utilizar a ciência de dados para responder perguntas sobre o passado (o que aconteceu e por que aconteceu) e o futuro (o que acontecerá), e se beneficiar dessas informações nas tomadas de decisões.


Para você ter uma ideia de quantos dados nós temos criados e compartilhados, segundo o site Statista (veja o relatório completo aqui), a previsão feita foi que os dados chegassem a 64.2 Zettabytes em 2020. Tá, mas o quanto é isso? Usando a metáfora criada pelo autor David Wellman, um byte seria um grão de arroz, enquanto um zettabyte seria todo o Oceano Pacífico preenchido por arroz. Logo, temos aqui vários Oceanos Pacíficos de arroz.³


Desse modo, conseguimos ver o quão importante é ter um método e ferramentas que nos ajudem a analisar os dados de forma rápida, segura, confiável e otimizada. 


Principais técnicas e aplicações


A utilização da ciência de dados se divide basicamente em quatro análises:

  • Descritiva: obtenção de insights referentes ao passado (aconteceu) e o presente (o que está a ocorrer).

  • Diagnóstica: busca entender de forma detalhada o por que de algo ter acontecido.

  • Preditiva: investiga o passado na busca de padrões para a realização de predições sobre o que acontecerá no futuro.

  • Prescritiva: uma análise muito sofisticada que combina a predição com a sua resposta: “se determinado evento acontecer, quais os efeitos?”


Dentre as principais técnicas estão:


  • Classificação: consiste na categorização de dados em classes. Neste caso, a máquina é treinada para se adaptar a dados com classes conhecidas e utilizar  essa experiência para identificar o mesmo padrão em dados novos. Um exemplo poderia ser a classificação de vegetais saudáveis ou não saudáveis em uma plantação.


  • Regressão: estima o valor de uma ou múltiplas ocorrências com base nos dados aprendidos. Funciona da mesma maneira que na classificação, mas aqui o alvo é um valor contínuo e não uma categoria. A regressão linear é um exemplo comumente aplicado onde é criado um modelo linear que se adapta à medida que novos dados são inseridos.


  • Clustering: visa o agrupamento de dados por meio de suas semelhanças, mas sem o conhecimento prévio de categoria. Essa diferença da classificação torna o processo mais subjetivo e o entendimento do dado é crucial para interpretar os grupos resultantes. É muito utilizado na busca de padrões e anomalias em grupos de dados. 


E o que podemos fazer com isso tudo?


Há uma gama de aplicações em que a ciência de dados pode ser utilizada para solucionar problemas e desafios, otimizar resultados e etc. Uma aplicação pode ser a descoberta de padrões desconhecidos em um processo, ou de modo geral, em uma organização. Pode-se também utilizar a ciência de dados para tomadas de decisões estratégicas baseadas em análises preditivas.


Construindo uma carreira: quais as qualificações necessárias?


Unsplash

Antes de falar sobre uma carreira no mundo da ciência de dados, é importante citar a revista Harvard Business Review que categoriza o cientista de dados como sendo o trabalho mais sexy do século 21 (leia o texto completo aqui). Segundo os autores, Thomas H. Davenport e  DJ Patil, os cientistas de dados são capazes de extrair tesouros de dados confusos e não estruturados. Bem, isto explica bem o quão poderosos são esses profissionais.


Na página do Insper na internet, eles destacam o fato do profissional de ciência de dados ser tão valorizado: E vão além: destacam perspectivas promissoras para este mercado.


“O cientista de dados é um dos profissionais mais requisitados no mercado atualmente, e as perspectivas para o futuro são ainda mais promissoras. Ele trabalha com o que é considerado o “petróleo” da nossa era: dados, informações. E costuma ser bem remunerado por isso.”


De acordo com o Insper, a formação/qualificação do cientista de dados pode ocorrer da seguinte forma:


“Como a ciência de dados é interdisciplinar, e o profissional vai precisar de outros conhecimentos também, como matemática, estatística, design e até negócios, uma opção é que os profissionais formados em áreas como ciência da computação ou administração façam uma pós-graduação para se aperfeiçoarem em ciências de dados.”

Desse modo, pode-se observar a multidisciplinaridade do profissional de ciência de dados. Ademais, vale ressaltar que este profissional pode atuar em diversas áreas e setores, desde a indústria, mídias sociais, setor de saúde, finança e etc… 


Ciência de Dados nas Geociências 


Geociências

A ciência de dados pode ser uma ótima aliada dos geocientistas na análise de rochas. As técnicas modernas aplicadas ao trabalho de geólogos, geofísicos e  geógrafos podem automatizar processos demorados, otimizar os resultados e embasar ainda mais os estudos para validação e tomada de decisão. 

Um exemplo aplicado às geociências é o trabalho produzido pelos geólogos Rafael Rubo, da Petrobras, e Cleyton Carneiro, professor da Escola Politécnica da USP, que utiliza ciência de dados para analisar rochas em regiões de interesse e identificar suas características minerais.

Conforme nos diz a matéria feita pela USP (você pode ler o texto completo aqui) a respeito do trabalho desenvolvido pelos geólogos:


“A petrografia óptica fornece dados sobre a textura, a mineralogia, o litotipo e os processos de dissolução e compactação pelos quais a rocha passou. A partir dessas informações, é possível contar a história geológica da bacia sedimentar de onde a rocha analisada foi extraída. Mas tudo isso precisa ser organizado e interpretado. E é aí que entram as ciências de dados.”


O geólogo Rafael Rubo ainda complementa que “o trabalho envolve a aquisição dessas imagens e a sua análise com auxílio de algoritmos de aprendizado de máquina. Aplicamos diferentes tipos de modelos preditivos para poder analisar automaticamente essas imagens. Assim, ganhamos tempo na etapa de análise petrográfica, ampliamos a quantidade de informação que extraímos da imagem e damos mais tempo para o geólogo se dedicar a uma atividade de interpretação daquele dado. Então, o geólogo deixa de fazer um serviço mecânico, como a contagem de pontos na lâmina, algo que pode ser automatizado, e ele passa a se dedicar a essa etapa de interpretação da deposição da rocha.”


Neste exemplo, temos uma visão clara de como pode-se utilizar a ciência de dados tanto no âmbito acadêmico quanto nos negócios. A caracterização petrográfica permite o cálculo de variáveis importantes dentro da exploração do óleo e gás, como o volume total de hidrocarbonetos e sua parcela recuperável, por exemplo. Nesse processo, a ciência de dados promove rapidez, economia de tempo e automatização de etapas, de modo que o geólogo possa se dedicar a interpretação dos resultados a partir de sua expertise. 


O que podemos concluir?


O nosso mundo consome e produz cada vez mais dados, sendo necessário cada vez mais tecnologias e profissionais capazes de lidar com esses dados e obter informações valiosas. No mundo de hoje, os dados e sua correta interpretação são um fator chave para a tomada de decisões e o sucesso de qualquer organização. Dessa maneira, conseguimos enxergar o potencial que a ciência de dados tem nos próximos anos e que será peça fundamental para as próximas décadas.


Isso é B2S: Business to Science! E se você quer saber mais sobre as novas tecnologias e como combinar ciência e negócios, não deixe de acompanhar os próximos artigos, para isso, certifique-se que você está inscrito e acompanhando nossos canais de comunicação!


Texto por: Vitor Gonçalves


Recomendações: 

Se você quiser aprender mais sobre o assunto de forma autônoma e gratuita, este artigo lista 15 livros imprescindíveis que você pode encontrar sem nenhum custo na internet: 


Quer saber mais sobre Data Science aplicado à geologia, geofísica ou áreas correlatas e o que isso pode proporcionar?


Referências:



34 visualizações0 comentário

Posts recentes

Ver tudo

Comments


bottom of page