Coluna C & T: Organização de dados associativos – Daniel Nascimento-e-Silva

Vimos que os estudos e dados exploratórios têm o desafio primeiro de descobrir variáveis integrantes de determinado fenômeno e organizar essas variáveis em torno de possíveis partes que o compõem. É como um jogo de quebra-cabeças, com a diferença residente no fato de que as peças ainda são desconhecidas, para o primeiro caso, ou o lugar onde as peças já conhecidas se encaixam, para o segundo caso. O desenho que representa a fase final da organização dos dados exploratórios é uma espécie de demonstração onde a peça se encaixa ou onde um conjunto de peças conformam um cenário do quebra-cabeça. A lógica da organização dos dados associativos é um pouco mais ousada e (por que não dizer?) desafiadora. Aqui o cientista já suspeita que duas ou mais dessas variáveis já mapeadas pelos estudos exploratórios parecem aparecer juntas. É mais ou menos assim: quando a escolaridade de uma determinada população é baixa e as condições de subsistência são precárias, parece que a criminalidade aumenta. A suspeita, colocando-se em termos de raciocínio científico, é que escolaridade, condições de subsistência e criminalidade estejam associadas. É preciso compreender bem isso para que seja compreensível a simplicidade de se organizar esse tipo de dado.

Dois aspectos sobre esses dados precisam estar claros em todos os indivíduos que queiram fazer ciência. O primeiro é que associação é a mesma coisa que correlação. Mas o que é isso? É o simples fato de que a presença de uma variável (escolaridade) faz aparecer também a outra (criminalidade). Assim, onde estiver a escolaridade, lá vai estar também a criminalidade. Se a escolaridade for alta, é provável que a criminalidade seja baixa. Inversamente, se a escolaridade for baixa, a criminalidade esperada será alta. Comportamento semelhante pode ser esperado em relação às condições de sobrevivência. Se elas forem elevadas, é provável que a criminalidade seja baixa; se forem baixas, a criminalidade tenderá a ser elevada.

Note, pelos exemplos citados, que aparecem sempre a ideia de mudança de comportamento de baixo para alto e, inversamente, de alto para baixo. Essa é a primeira exigência representativa de um desenho resultante da organização dos dados associativos: ele deve mostrar a mudança de comportamento, que atesta a existência de correlação entre as duas ou mais variáveis sob análise. Como consequência, os gráficos e tabelas são os desenhos mais recomendados para a representação desses dados. Em um eixo são colocados os dados de uma variável (escolaridade e/ou condições de existência) e no outro devem ser registrados os dados da outra variável (criminalidade).

Um olho treinado vai procurar, dentre os inúmeros pontinhos (que representam o encontro no plano cartesiano dos valores dessas variáveis), se eles vão subindo, da esquerda para a direita. Esta é a primeira possibilidade. A segunda é que os pontinhos comecem lá em cima e vão baixando, descendo, sempre da esquerda para a direita. A terceira possibilidade é quando não é possível ver o crescimento ou decrescimento. Na primeira situação, a associação é dita diretamente proporcional; na segunda, inversamente proporcional; e na terceira, que não há associação. É possível calcular o valor da associação e, a partir daí, fazer deduções. Regra geral, se o número for igual ou menor a 0,5, diz-se que há correlação fraca; entre 0,51 a 0,7, a associação é mediana; entre 0,71 a 0,9, é forte; e acima de 0,91, é muito forte. Forte e fraco significam possibilidades de aparecerem juntas. Um desenho para representar as descobertas feitas com dados associativos precisam conter, portanto, a) as variáveis associadas, b) os valores de cada uma delas, c) as marcações dos valores no plano cartesiano ou nas linhas da tabela, d) o valor da correlação e e) o nível de significância.

O segundo aspecto é que associação não é sinônimo de causa. Quando um estudo mostra que há associação entre escolaridade e criminalidade, não está dizendo que a baixa escolaridade causa a criminalidade ou que a criminalidade é a consequência da baixa escolaridade. O uso de isqueiros está associado ao câncer de pulmão, mas isso não quer dizer que é o isqueiro que causa o câncer, mas porque quem fuma muitas vezes usa isqueiro, de maneira que é o fumo o verdadeiro causador da doença. A compreensão da diferença de associação e causa é fundamental para que se evitem as inúmeras interpretações equivocadas e criminosas que se veem todos os dias em publicações científicas, inclusive em algumas consideradas renomadas.

Mas para que servem os estudos associativos? Para acelerar a identificação de possíveis estudos relacionais ou causais. No fundo, a finalidade da ciência é poder agir sobre a natureza, o que só é possível quando se sabe como isso é possível. E o campo da possibilidade vem a partir da constatação de elevadas associações entre variáveis. Aquelas com alta magnitude são candidatas a estudos relacionais, cuja finalidade é sempre explicar como uma causa impacto na outra e por que isso ocorre. Os estudos relacionais geralmente são mais demorados, mais caros, exigem recursos materiais e instrumentais mais aprimorados, dentre inúmeros outros fatores que fazem com que eles sejam mais desafiadores. Os estudos associativos eliminam de antemão prováveis relações causais que só existem na mente popular, como a de que salário causa motivação.

A organização dos dados associativos, portanto, é feita através de gráficos e tabelas. Contudo, inúmeros recursos atuais de infográficos (que não deixam de ser gráficos), modelos mentais e representações em redes também têm tido muito sucesso para expressar visual, numérica e logicamente se duas ou mais variáveis estão ou não correlacionadas. O desafio é sempre o de fazer com que a comunidade científica bata os olhos no desenho e entenda com precisão a descoberta do nosso estudo. A leitura da nossa interpretação apenas atestará a consistência do que foi aferido na realidade.

(*) Daniel Nascimento-e-Silva, PhD, Professor e Pesquisador do Instituto Federal do Amazonas (IFAM)

Veja também

Topo