Coluna C & T: Organização de dados ordinais – Daniel Nascimento-e-Silva

O processo de organização de dados tem como finalidade gerar uma figura que contenha a resposta procurada pelo cientista. É precisamente isso que se deve ter em mente quando se coloca o desafio de organizar dados ordinais: encontrar uma maneira de sintetizar os dados coletados de uma forma que a resposta esteja em uma figura de forma explícita, que não necessite de apontamentos para identificá-la. Para que isso aconteça com os dados de tipo ordinal é preciso que se conheça a relação entre cada variável pesquisa e suas categorias. Vale dizer, em termos estruturais, que toda variável só é ordinal se as categorias vierem em forma de ordem, se estiverem ordenadas. Evidentemente que muitas delas, por si só, já designam ordem, como grau de escolaridade ou simplesmente escolaridade e nível de satisfação. Quem desconhece a relação lógico-matemática das questões de pesquisa pode imaginar que essa não é uma questão importante porque sua pesquisa é “qualitativa” e por isso não precisa realizar nenhum tipo de cálculo. Ledo engano. Não há ciência sem cálculo, a menos que se pense que calcular é apenas fazer conta. Vejamos.

Os dados ordinais servem para mostrar a ordem de determinado fenômeno tal como ele aparece na realidade. O cientista quer encontrar, descobrir essa ordem, ainda desconhecida para ele (e para a ciência). Veja o caso dos graus de satisfação. Geralmente esse fenômeno é classificado com o auxílio de um continuum, que é uma reta com dois pontos extremos, um positivo (satisfação máxima) e outro negativo (nenhuma satisfação). No centro há uma zona de indiferença em que satisfação e insatisfação se anulam. Essa escala é descrita mais ou menos assim, da esquerda para a direita: muito insatisfeito, insatisfeito, nem satisfeito/nem insatisfeito, satisfeito e muito satisfeito. É visível, aqui, o ordenamento da satisfação. Mas apenas isso é conhecido. Nenhuma relação entre as categorias (níveis de satisfação) pode ser estabelecido. Isso quer dizer que não dá para dizer que duas insatisfações são iguais a uma posição neutra ou que duas satisfações são iguais à satisfação máxima. Da mesma forma, não é possível dizer que a satisfação máxima menos muito insatisfeito é igual à satisfação neutra.

Vejamos outro exemplo. Tome-se o caso dos níveis de cargos de uma universidade federal. Ali há professor auxiliar, assistente, adjunto, associado e titular. Sabe-se que o professor auxiliar é o início da hierarquia acadêmica e que o titular é o topo. Mas nada mais do que isso é conhecido. Não dá para dizer que um professor titular é cinco vezes um professor auxiliar ou que o professor associado é igual a dois professores adjuntos. Os dados ordinais são assim. Eles denotam apenas posições, ordens, verticais, horizontais ou diagonais de um determinado fenômeno. Nada, portanto, de achar que uma posição é “melhor” ou “pior” que a outra ou interpretação subjetiva como essa muito comuns nos textos de quem ignora os tipos de dados.

Mas o que se pode fazer com esses dados? Como organizá-los? Resposta número um: tudo o que se pode fazer com os dados nominais (frequências simples, relativa e acumulada, além da moda), mais a mediana e os quartis. Tome-se o caso da variável desempenho acadêmico. É possível saber qual é o mais comum, o segundo mais comum e assim por diante, se ordenados por excelente, bom, mediano, fraco e péssimo. De forma semelhante, é possível dividir a série de dados em dois grupos iguais, com o uso da mediana, ou em quatro, com o uso dos quartis. Cada uma dessas formas de medida têm seus devidos tipos de representação, como gráficos e tabelas. É isso que torna a organização de dados um exercício lúdico: cada resultado do cálculo traz também um tipo de figura que o sintetiza. E isso é válido tanto para pequenos casos, como os menores que 40, como para grandes séries, com até trilhões de casos. E cálculo nada mais é do que organizar os fatos e fenômenos do mundo por algum tipo de critério. Sua origem remota justamente à “contagem” de animais e produtos agrícolas associando cada animal a um tipo de pedra. O cálculo, até hoje, é um tipo de pedra – ainda que seja eletrônica, como se pode ver.

Mas fazer levantamentos para transformar os dados ordinais em gráficos e tabelas simples é muita pobreza. É como se minerar metal retendo os de menores valores e jogando fora os mais precisos. Uma coisa é a descrição do comportamento do desempenho escolar (o que aconteceu); outra coisa é fazer ciência, adicionando duas outras exigências: como aconteceu e por quê. É aqui que entram as chamadas explicações ou simplesmente procedimentos analíticos dos dados. Alguns poderosos instrumentos analíticos estão disponíveis para fazer os dados ordinais irem além do óbvio.

Podemos comparar resultados de dados através do teste Mann-Whitney U e com o teste de Kruskal-Wallis H. O primeiro pode dizer se um grupo é maior ou menor que o outro, enquanto o segundo permite se os dois têm a mesma mediana. Saber essas duas coisas abrem o mundo daqueles dados para os cientistas. Mas é possível também gerar representações do cálculo do r-bisserial, Rho de Spearman, teste t de Wilcoxon, dentre inúmeros outros que a ciência tem descoberto. Em uma entrevista, por exemplo, com alguns poucos indivíduos podem ser coletados dados dessa natureza capazes de revelar fator surpreendentes que vão além da subjetividade discursiva que podem, inclusive, aferir a inconsistência daquilo que é falado.

Os dados ordinais são aquele tipo de recurso ainda desconhecido e que, quando utilizado, é feito de forma inadequada. E a consequência disso são descrições e inferências inconsistentes tanto em relação aos dados entre si, mas principalmente quando comparados com o que os quadros teóricos cientificamente edificados mostram. Muitos dados ordinais são tratados e representados, por exemplo, como nominais, mas o inverso não é tão incomum no universo de estudos equivocados. E o pior é que muitos deles são publicados, como clara evidência de que seus autores e avaliadores desconhecem esse tipo especial e muito importante de tijolinho que tem ajudado a construir o edifício da ciência.

(*) Daniel Nascimento-e-Silva, PhD, Professor e Pesquisador do Instituto Federal do Amazonas (IFAM)

Veja também

Topo