Coluna C & T: Organização de dados exploratórios – Daniel Nascimento-e-Silva

Os estudos exploratórios são, de certa forma, os primeiros níveis de desafios para a construção do edifício da ciência. Esses desafios convergem para dois aspectos fundamentais. O primeiro é a descoberta de novas variáveis componentes de determinado fenômeno; o segundo é a organização interna dessas variáveis. É como em um jogo de quebra-cabeças, com a diferença residindo no desconhecimento completo das peças que compõem o quadro que queremos montar. Parece esquisito, mas é mais ou menos isso. Foi o que aconteceu com a covid-19. No início, não se sabia que fenômeno estava causando aquelas mortes. Realizaram-se estudos exploratórios que culminaram na categorização do vírus em um tipo ou família já conhecida, os SAR- CoV. Os conhecimentos se foram acumulando até que se pudesse remontar quase todo o quebra-cabeças, a ponto de permitir os estudos mais elevados, no sentido de manusear o fenômeno. Foi esse manuseio que permitiu a criação de imunizantes capazes de conter os efeitos do vírus.
Estudos exploratórios não testam hipóteses. No máximo, as descobrem. Hipóteses são explicações provisórias. Como formulá-las, se ainda não se conhecem suas lógicas internas? Diversas técnicas têm sido criadas com a intenção de capturar ou identificar as partes que compõem os diferentes tipos de fenômenos, com ou sem máquinas e equipamentos mais ou menos sofisticados. Por exemplo, o pouco que se sabe sobre os neutrinos foi decorrente do uso de máquinas sofisticadas criadas com fins bastante delimitados. Alguns desses estudos foram considerados satisfatórios quando permitiram a formulação de hipóteses a partir das descobertas a que chegaram. Isso significa que a formulação de uma hipótese pode ser considerado o sucesso de um empreendimento exploratório.

A ideia de exploração vem justamente do fato de que pouco se sabe sobre o fenômeno de nosso interesse. Esse pouco se sabe não é referente ao pesquisador, sua equipe ou grupo de pesquisa a que estão vinculados. O pouco se sabe é relativo a toda a ciência. O estoque de conhecimentos que a ciência detém ainda é extremamente precário. Nunca é demais reafirmar que conhecimento científico é aquele que foi produzido com o manuseio adequado, consistente, do método científico. Seus resultados são considerados válidos justamente pela adequação desse manuseio, aferido pelos pares, integrantes da mesma comunidade científica. Descartam-se, portanto, todos os demais tipos, incluindo os massivos ensaios teóricos, todos de natureza filosófica, ainda que utilizem conhecimentos da ciência.

Essas considerações são fundamentais para que se compreendam as maneiras por que podem e devem ser representados os resultados, parciais ou conclusivos, dos estudos exploratórios. Os primeiros modelos organizativos são os referentes à descoberta de novas variáveis. Os desenhos com esse intuito precisam mostrar as variáveis já conhecidas e mapeadas pela ciência junto com as variáveis recém-descobertas. Essas representações precisam dar conta de questões parecidas com “Quais são os componentes de…”, repetidas e aferidas em diferentes estudos. Cada um deles apresenta uma lista de respostas em que algumas se repetem e outras se fazem inéditas. As representações mais simples precisam apontar as descobertas de estudos anteriores em conjunto com as do estudo que se está realizando. Isso pode ser feito a partir de estruturas analíticas, em que as diferentes peças do quebra-cabeças são apresentadas. Essas representações são uma espécie de mapa de variáveis.

Os segundos modelos organizativos estão vinculados à descoberta de fatores. Fatores são agrupamentos de variáveis. Quando se indaga “Quais são os fatores do sucesso escolar?” se tem em mente alguns poucos deles, de maneira que é possível memorizar seus nomes. Cada um desses fatores apresenta pelo menos duas variáveis, que chamamos de categorias analíticas para cada uma delas. O fatores são, portanto, nomeados pelos pesquisadores em conformidade com algum esquema lógico. Por exemplo, os fatores do sucesso escolar poderiam ser agrupados em psicológicos, ambientais, recursos e familiares. Os fatores psicológicos poderiam ser vontade de aprender, prazer em estudar e vontade de vencer na vida; os ambientais poderiam ser sala de aula agradável, sala de estudos equipada e recursos pedagógicos adequados; os recursos poderiam ser computadores e tecnologias de comunicação; enquanto os familiares poderiam ser incentivo da família e exemplo de sucesso familiar. Os nomes dos fatores (psicológico, mbiental, recurso e família) são inventados pelos pesquisadores e por isso são chamados de constructos. As variáveis componentes de cada fatores são uma espécie de primeiro agrupamento (originário ou não de uma hipótese), que podem ser aferidos matematicamente com recursos mais sofisticados, como as análises fatoriais exploratórias.

O que queremos mostrar é que a maneira como organizamos os dados exploratórios precisa gerar uma figura que mostre as variáveis descobertas pela ciência e as descobertas pelo estudo que se está concluindo. Este é o desafio dos estudos pioneiros exploratórios. O desafio do segundo tipo é mostrar ou sugerir formas de organizar as diferentes variáveis em grupos a partir de algum esquema lógico. Esse esquema lógico pode dar origem a uma hipótese, passível de ser testada nos estudos de tipo associativo. A representação do primeiro tipo é uma lista do que já se sabe mais o que se acabou de descobrir. A representação do segundo tipo também é uma lista, mas já com os primeiros agrupamentos das partes do quebra-cabeça.

Os dados exploratórios ainda são muito mal conhecidos. Melhor seria dizer que eles são quase que completamente desconhecidos. Seus desafios, principalmente. Tanto é assim que quando se lê “exploratório” no título do trabalho a ideia que isso passa é que é algo preliminar, que não tem lá muita preocupação em fazer avançar a ciência. Quando, por outro lado, um cientista lê essa palavra no título, sua curiosidade se aguça para aferir duas coisas: a) que variáveis o estudo mapeou da literatura e b) que variáveis ele descobriu. Na maioria das vezes não é isso o que se vê em todo o texto.

(*) Daniel Nascimento-e-Silva, PhD, Professor e Pesquisador do Instituto Federal do Amazonas (IFAM)

 

Veja também

Topo