Coluna C & T: Organização de dados causais – Daniel Nascimento-e-Silva

O desafio da ciência é explicar o comportamento dos fenômenos do mundo. O da tecnologia, reproduzi-lo em benefício da humanidade, em busca de resolver problemas específicos, particulares, ou gerais. É por isso que se diz que a ciência é um esforço planetário, enquanto a tecnologia, no mais das vezes, é localizado. As tecnologias baseadas na ciência ainda são muito poucas quantitativamente, em relação às de base não científicas. Em contrapartida, qualitativamente, são muito mais significativas tanto em abrangência quanto em benefícios que proporcionam. As vacinas como a varíola e a paralisia infantil são exemplos típicos de tecnologias assentadas em conhecimentos científicos, em que vieram primeiro as explicações sobre o comportamento das coisas e depois a construção desses artefatos. As tecnologias de bases não científicas são aquelas tradicionais, históricas, que se aperfeiçoam com a tradição ao longo de centenas e às vezes milhares de anos, como é o caso das garrafadas do Quilombo do Pacoval, em Alenquer, no Pará, para estancar a dor e sarar as picadas de animais peçonhentos. Em quaisquer que sejam baseadas essas práticas, comungam o fato de estabelecerem relações de causa-efeito. Dizemos, portanto, que as tecnologias, quase todas, estão assentadas em relações causais. Por isso é fundamental que se entenda a lógica de organização desses dados para que as próprias explicações e prototipagens consequentes sejam compreendidas.

Muitos cientistas estão convictos de que todo o empreendimento científico, que começa com os estudos exploratórios e prosseguem com os associativos, culmina nos estudos causais. Esses estudos se concentram na relação entre variáveis, da mesma forma que os associativos. A diferença, contudo, é que a intenção da pesquisa causal é estabelecer o efeito que uma exerce sobre outra. Isso pode ser feito de três formas possíveis. A primeira é quando uma variável provoca efeito sobre apenas outra; a segunda é quando uma variável impacta duas ou mais variáveis; a terceira é quando não há impacto estatisticamente significativo de uma sobre a outra. Daí advém justamente o desenho que se deve fazer para representar a descoberta dos estudos causais. Essa é a ideia mais básica que todos devem ter para entender a lógica desse tipo de pesquisa, ainda muito rara na prática brasileira em praticamente todos os campos.

A segunda coisa que é fundamental que se saiba é o sentido da causalidade. Se houver relação causa-efeito, ela será direta ou inversamente proporcional. Vejamos isso a partir de um exemplo corriqueiro. Imagine que uma pessoa invista em uma caderneta de poupança uma certa quantidade de dinheiro e que a cada real investido um real também lhe será pago também como dividendo. Digamos que em janeiro foram depositados 100 reais, de maneira que no final do mês também foram creditados 100 reais de dividendos, perfazendo 200 reais de saldo. Se em janeiro o investimento foi de 200 reais, 200 reais também lhe serão creditados, de forma que quanto mais investir, mais ganhar. Essa relação mais-mais é dita diretamente proporcional. É direta porque quando uma cresce a outra também cresce. É proporcional porque cresce na mesma proporção ou em uma taxa que é possível conhecer.

Mas há relações causais diferentes, em que, quando uma variável cresce, a outra diminui. É o caso das dívidas. Quanto mais uma pessoa deve, menos dinheiro ela terá na sua conta bancária. É também o caso quantidade de horas diárias de estudo em relação à possibilidade de reprovação: quanto mais horas dedicadas ao estudo, menores serão as chances de reprovação. Aqui também há uma relação do tipo causa-efeito, mas inversa. Se uma variável crescer, a outra, obrigatoriamente, terá que diminuir.

A terceira consideração que é essencial na organização dos dados causais é consequência das duas primeiras: a relação de dependência e independência. Diz-se que uma variável é depende quando o seu comportamento depende do comportamento de outra. Dito de outra forma, quando uma variável impacta, altera, modifica, determina o comportamento de outra ela é chamada de independente. A quantidade de investimento é que determina a quantidade de dividendos que o investidor terá. Quanto mais ele investir, mais dividendos, mais retornos ele terá. Investimento é, portanto, variável independente e os dividendos, dependente. Os dividendos dependem do quanto será investido. O mesmo acontece com a probabilidade de fracasso escolar, que depende da quantidade de horas dedicadas ao estudo, que é a variável independente.

Essas três coisas obrigatoriamente têm que aparecer na organização dos dados causais. Elas têm que ser visíveis, preferencialmente com a taxa, a proporção da causação e o sentido. A taxa é a força do impacto expressa em números, enquanto o sentido é se esse número é negativo ou positivo. Por exemplo, uma taxa de 0,80 significa que a alteração em uma unidade na variável independente causa variação em 80% no comportamento da variável dependente; se a proporção for de -0,45, significa que o aumento de uma unidade na variável independente impacta negativamente o comportamento da variável dependente em 45%. Quanto mais próximo de zero, diz-se que a causação é fraquíssima ou inexistente; quanto mais próximo de 1, perfeita ou plena.

Queremos mostrar que os estudos causais não podem ser tomados como sinônimos de pesquisas quantitativas, que é o terror de quem nem quer ouvir falar delas. É possível conhecer causações, por exemplo, entre as ofensas que alunos sofrem e sua autoestima e medi-la. De forma semelhante, é possível identificar uma quantidade significativa de efeitos psicológicos e comportamentais que as ofensas causam neles. Para quem quer fazer pesquisa científica para gerar tecnologia, dominar esse esquema triádico é fundamental. E para quem tem medo de números, basta aplicar essa lógica nos softwares que eles dão o resultado. Basta saber ver os números (proporções) e entender o sentido (sentido inverso ou direto) e estará entendida a resposta procurada.

(*) Daniel Nascimento-e-Silva, PhD, Professor e Pesquisador do Instituto Federal do Amazonas (IFAM)

 

Veja também

Topo