Coluna C & T: Organização de dados racionais – Daniel Nascimento-e-Silva

A organização dos dados racionais costuma ser temida por quem não tem conhecimentos e habilidades matemáticas. Geralmente isso é decorrente da confusão que quem não é cientista faz de estudos qualitativos com quantitativos. Geralmente associam números com quantidade e não números com qualidade. Sem pretender entrar nessa seara, o esforço da organização de dados racionais tem que ser o mesmo que o relativo aos demais tipos: gerar uma figura capaz de demonstrar a resposta procurada para a questão de pesquisa. De fato, o que caracteriza os dados racionais é a existência de um número real. Isso significa, na prática, que com eles é possível que se façam multiplicações e divisões. Isso não é possível, por exemplo, com os dados intervalares e tampouco com os nominais e ordinais. Mas o que isso quer dizer? Simples: que podemos fazer qualquer tipo de cálculo com eles. E, por extensão, que podemos fazer projeções e previsões, duas consequências naturais da ciência.

Tabelas são os exemplos mais modestos para organizar os dados racionais. E essa técnica tem sido muito utilizada. Contudo, por incrível que pareça, é difícil encontrar um exemplo de seu uso adequado, consistente com a visualização da questão norteadora que se pretende responder. São os casos, por exemplo, de tabelas de duas colunas, em que uma delas contém categorias e a outra, os dados racionais, como as que apresentam a evolução do produto interno bruto e as de situações de saldos financeiros familiares. É recomendado que essas representações busquem dar conta de respostas difíceis ou impossíveis de serem feitas através de desenhos, como são os casos dos testes de hipóteses.

Tome-se o caso do teste de Kolmogorov-Smirnov, para aferir a normalidade de dados. Uma tabela pode mostrar os desvios, frequência simples, frequência acumulada, frequência relativa acumulada, desvio padronizado, a probabilidade acumulada sob a curva normal, os valores absolutos das diferenças entre as frequências relativas, dentre outras medidas. Cada medida dessa é como se fosse uma peça de um quebra-cabeça que permite ao cientista revelar o comportamento da realidade, como se quisesse ter uma visão panorâmica e aprofundada de toda aquela realidade. Mas o cientista também pode querer ver algo específico da própria normalidade.

Ainda levando em consideração o teste Kolmogorov-Smirnov, um dos mais frequentemente utilizados em pesquisas, dada a sua versatilidade de análise de variância (ANOVA). Esse teste serve, por exemplo, para comparar médias de diferentes amostras. Pode acontecer de se estar interessado apenas em representar por meio de uma tabela a estatística obtida, os graus de liberdade e o nível de significância alcançados por cada período. Aqui o teste vai apontar se há ou não normalidade comportamental, ou seja, se deve ou não ser rejeitada a ideia de normalidade. Vale ressaltar, também, que é praxe na ciência que resultados de pelo menos dois testes sejam representados na mesma tabela simultaneamente, para efeitos comparativos. É por isso que o teste de Kolmogorov-Smirnov aparece lado a lado com o de Shapiro-Wilk. O teste de Levene, por outro lado, quase sempre aparece em tabelas sozinho, em que são apontados os grupos, graus de liberdade, soma dos quadrados, o quadrado das médias, o valor de F e o p-valor.

Queremos dizer que os dados racionais precisam ser trabalhados como racionais. Quando se pegam dados de produto interno bruto de uma década e criam-se tabelas ordenando o valor anual deles é ter pepitas de ouro nas mãos utilizadas para adornar os pés de uma planta. É exatamente isso o que parece acontecer também com os gráficos nas mãos de quem não conhece os tipos de variáveis. Essas pessoas tendem a transformar, novamente, os dados racionais em nominais ou ordinais, dadas suas preferências por gráficos de setores (pizza) e de barras. Dados racionais não se prestam para isso. Aliás, fazer isso com eles tende a ser uma forma inconsciente de ocultar o que eles teimam em revelar em toda a sua majestosidade.

Uma forma singela de representar correlações, por exemplo, é o uso de gráficos de linhas. Economistas são craques em fazer isso. E o fazem muito bem. Projeções feitas com o auxílio de econometria e suas avançadas técnicas de regressão são enormemente empregadas com esse intuito. Aqui o desafio é praticamente o mesmo: mostrar como dois ou mais fenômenos se associam ou se influenciam ao longo do tempo, conjugado com as probabilidades (veja, a ciência é sempre probabilística) futuras. Essa estratégia organizativa é decorrente da necessidade de se mostrar respostas para perguntas do tipo “Qual é a correlação entre A e B?”, “Os fenômenos C, D, E e Z estão associados?” ou “Qual a probabilidade de se eliminar a miséria na região Norte do Brasil até 2030, se os investimentos em educação aumentarem em 5% ao ano?”.

Representações, desenhos, gráficos, tabelas e inúmeros outros recursos visuais são formas de se condensar com precisão os achados empíricos acerca de determinada questão de pesquisa, também chamada de questão norteadora. Cada questão desse tipo precisa apresentar evidências empíricas com esse intuito. As questões que exigem dados racionais são ainda pouco compreendidas em seu uso com esse intuito. O desconhecimento, talvez, tenha sido o principal motivo de pesquisadores darem tratamento inadequado a esse tipo de dados.

A organização dos dados racionais, portanto, representa um desafio para quem desconhece o valor de cada variável que tenha um zero real. Na prática, essa parece ser uma evidência de que não se sabe nem mesmo o que é um zero e para que ele serve. Cientistas com muitas experiências no manuseio de dados racionais conseguem traduzir em representações singelas e precisas as respostas que buscam para questões complexas e audaciosas. Como diz um grande ditado em ciência, uma hipótese ou questão de pesquisa ousada exige evidências ousadas. Os dados racionais se prestam a isso.

(*) Daniel Nascimento-e-Silva, PhD, Professor e Pesquisador do Instituto Federal do Amazonas (IFAM)

Veja também

Topo