Ao longo da história, a humanidade vivenciou diferentes evoluções, em que cada época foi marcada pelo uso de diversos recursos para o desenvolvimento civilizacional e econômico. Destas fases, as que mais se destacam são as Revoluções Industriais (STEARNS, 2013), as quais trouxeram novos combustíveis de produção para cada período, sendo eles o carvão, eletricidade e o petróleo, durante as três primeiras fases, respectivamente. Atualmente, a sociedade vive a quarta fase, na qual os dados são o “new oil” (CAO, 2020), impulsionando ou até mesmo determinando o futuro da ciência, da tecnologia e da economia.
Para compreender a atual centralidade dos dados, é preciso conhecer a evolução da área de dados ao longo do tempo, em especial da ciência de dados. Seus primórdios se originam em 1962, quando John Tukey aponta uma nova forma de analisar dados, distinta da estatística tradicional (TUKEY, 1962). Em 1974, Peter Naur utilizou o termo “data science” para se referir a métodos voltados ao tratamento e organização de dados após sua coleta (NAUR, 1974). Nos anos seguintes, instituições como a International Association for Statistical Computing (IASC, 1977) consolidaram o vínculo entre estatística tradicional, computação e especialistas para converter dados em informações e conhecimento. Já nos anos 1990, a crescente produção de dados impulsionou pesquisas em Knowledge Discovery in Databases (KDD89, 1989) e consolidou eventos científicos especializados. No início dos anos 2000, William Cleveland propôs a reformulação da estatística como uma nova ciência orientada por dados (CLEVELAND, 2001) e, entre 2008 e 2012, o termo “data scientist” passou a ser usado no meio corporativo para descrever profissionais capazes de extrair conhecimento a partir de grandes volumes de informação. Como destaca Press (GIL PRESS, 2013), a ciência de dados emerge não apenas como uma disciplina acadêmica, mas como uma resposta prática às demandas da sociedade orientada por dados.
Após entender a história da evolução da ciência de dados, autores mais recentes como Cao (CAO, 2020) destacam a interdisciplinaridade desta área. Segundo ele, ciência de dados compreende a integração de diversas disciplinas, tais como estatística, informática, computação, comunicação, administração e sociologia para estudar os dados em diferentes ambientes (incluindo domínios e outros aspectos contextuais), com o objetivo de transformá-los em insights e decisões a partir de metodologias bem definidas. Sob a ótica de produto, o autor destaca que o produto de dados pode se materializar em descobertas, previsões, serviços, recomendações, modelos ou sistemas. Já os produtos de maior valor são o conhecimento, a inteligência e a decisão obtidos a partir dos dados coletados. Essa percepção permite observar como diferentes setores têm se beneficiado desses produtos informacionais.
Um dos grandes impactos ofertados pela ciência de dados está na área da saúde. Em um artigo publicado por Wu et al. (WU et al., 2020), foi demonstrado que um modelo de redes neurais profundas, aplicado à detecção de câncer de mama em uma população de triagem, atingiu AUC de 0,895 — o que significa que, em 89,5% dos casos, o modelo foi capaz de distinguir corretamente entre imagens com e sem câncer. Esta é uma alta taxa de detecção do tumor. Para validar a efetividade clínica do modelo, os autores realizaram um reader study com 14 radiologistas, cada um analisando 720 exames. Os resultados indicaram que o desempenho do modelo foi comparável ao de radiologistas experientes. Além disso, ao combinar a probabilidade de malignidade atribuída por um radiologista com a previsão do modelo de IA — formando um modelo híbrido — os autores observaram um desempenho superior ao de ambos isoladamente, o que demonstra como a colaboração entre inteligência artificial e julgamento clínico pode elevar a precisão diagnóstica. Esse é um exemplo real e claro de como o uso de dados pode ser transformado em insights e decisões que impactam diretamente a vida das pessoas envolvidas.
Diante do exposto, observa-se que os dados assumem o papel fundamental no atual contexto histórico, assim como o carvão, o petróleo e a eletricidade representaram as primeiras revoluções industriais. A ciência de dados, fruto de uma evolução histórica e interdisciplinar, revela-se como um campo essencial para a geração de conhecimento, a tomada de decisão, além do desenvolvimento científico, tecnológico e econômico. Aplicações reais, como a detecção de câncer de mama, demonstram seu potencial não apenas para otimizar processos, mas também para salvar vidas. Assim, compreender a ciência de dados em sua complexidade histórica, teórica e prática é essencial para acompanhar os rumos da nova economia e das inovações que moldam o presente e o futuro.
Referências
CAO, Longbing. Data Science: A Comprehensive Overview. 2020. Disponível em: https://arxiv.org/abs/2003.10036. Acesso em: 3 jul. 2025.
CLEVELAND, William S. Data science: an action plan for expanding the technical areas of the field of statistics. International Statistical Review, v. 69, n. 1, p. 21–26, 2001. DOI: 10.1111/j.1751-5823.2001.tb00477.x.
GIL PRESS. A very short history of data science. Forbes, 28 maio 2013. Disponível em: https://www.forbes.com/sites/gilpress/2013/05/28/a-very-short-history-of-data-science/?sh=5aaa816f55cf. Acesso em: 3 jul. 2025.
IASC – International Association for Statistical Computing. Sobre a associação. 1977. Disponível em: http://www.iasc-isi.org/. Acesso em: 3 jul. 2025.
KDD89 – Workshop on Knowledge Discovery in Databases. In: IJCAI-89 Workshop, 1989. Disponível em: http://www.kdnuggets.com/meetings/kdd89/index.html. Acesso em: 3 jul. 2025.
NAUR, Peter. Concise Survey of Computer Methods. Lund: Studentlitteratur, 1974.
STEARNS, Peter N. The Industrial Revolution in World History. 4. ed. Londres: Routledge, 2013.
Tukey, John W. The future of data analysis. Annals of Mathematical Statistics, v. 33, n. 1, p. 1–67, 1962. DOI: 10.1214/aoms/1177704711.
WU, Nan et al. Deep neural networks improve radiologists’ performance in breast cancer screening. IEEE Transactions on Medical Imaging, v. 39, n. 4, p. 1184–1194, abr. 2020. DOI: 10.1109/TMI.2019.2945514.
Autor: Leandro Dalla Nora