Coluna C & T: Coleta de dados estruturados – Daniel Nascimento-e-Silva

O processo de produção científica é interessante. Pode ser percebida e interpretada de diversas formas, inclusive com antagonismo entre elas, o que é bastante natural. Uma dessas formas é a classificação dos dados em conformidade com o estoque de conhecimentos que a ciência mantém sob determinados fatos e fenômenos do mundo. Quando esse estoque é diversificado e robusto é possível que se façam engenhosas e robustas arquiteturas teóricas, nas já clássicas taxonomias de dimensões analíticas (partes do fenômeno), categorias analíticas (partes das dimensões analíticas) e o consequente entrelaçamento, nos casos de estudos relacionais ou associativos. As dimensões analíticas são constructos elaborados com base nas configurações que as categorias analíticas apresentam; as categorias são as variáveis que compõem as dimensões e que permitem verificação e aferição empíricas. Sintetizando, estudam-se as categorias para inferir sobre as dimensões e explicar o comportamento do fenômeno. Quando isso acontece, está-se diante do que chamamos de dados estruturados.

A ideia de estrutura remonta a uma espécie de geometria enquanto esforço de representação da realidade. Quando dizemos que uma cadeira é um móvel composto de pés, assento, encosto e uma estrutura que une os seus componentes está-se traduzindo em palavras aquilo que se vê fisicamente. Outra forma de traduzir cadeira poderia ser f(cadeira) = estrutura (pés + assento + encosto), em linguagem matemática. Em ambas as representações podem-se visualizar os componentes que forma o objeto cadeira. É essa possibilidade de visualizar a totalidade dos componentes do objeto em representação que caracteriza o que chamamos de estrutura. Como inferência, nas coletas de dados estruturados a exigência básica é que sejam conhecidos os componentes estruturais dos fenômenos sob investigação.

Como saber se os dados que precisam ser coletados são estruturados ou não? A primeira forma é através da construção da arquitetura teórica. Se a literatura permitir identificar todas as partes do fenômeno e suas respectivas subpartes ou elementos componentes de cada parte os dados são considerados estruturados. Com eles é possível a construção de questionários fechados, por exemplo. Aliás, todo questionário fechado é a representação porque para cada pergunta é possível identificar todas as respostas possíveis. A segunda forma é consequência da primeira: o pesquisador sabe o que quer saber e sabe também todas as respostas possíveis para cada coisa que quer saber. Por exemplo, para saber o sexo dos respondentes, o pesquisador sabe o que quer saber (como é distribuída a população da pesquisa por sexo) e todas as respostas possíveis (masculino e feminino).

Quando são estruturados, a coleta desses dados permite estabelecer a estrutura de um questionário e outros tipos de instrumentos em três partes. A primeira é reservada para as questões de controle, cuja finalidade é garantir que o respondente faz parte da amostra e excluir os que não fazem. Por exemplo, se desejo estudar eleitores de uma cidade, todos aqueles que não tiverem título de eleitor (item de controle) daquela cidade (outro item de controle) não poderão fazer parte da amostra. A segunda é destinada às questões sociodemográficas (principalmente no caso de pesquisas com seres vivos), com itens relativos à idade, tamanho ou altura, região a que pertence e características físicas, dentre outros. A terceira e última é focada nas questões explicativas, que são elaboradas com base nas categorias analíticas encontradas na literatura, organizadas a partir de suas dimensões analíticas.

Note, mais uma vez, que todas as questões relativas a dados estruturados são compostas por respostas fechadas, que permitem que o respondente apenas aponte a resposta ou respostas. Por essa razão todas as categorias são exaustivas, não havendo possibilidade que não esteja ali elencada. Pode parecer estranho, mas as investigações dessa natureza servem justamente para testar a consistência da arquitetura teórica elaborada pelos pesquisadores, que é o primeiro passo para a criação de um novo campo explicativo, uma nova teoria. Esses estudos não têm a finalidade de descobrir novos componentes dos fenômenos envolvidos. Muitas vezes a intenção é elaborar constructos, que são os agrupamentos de variáveis, que chamamos de dimensões analíticas. Os constructos elevam a compreensão da realidade porque sintetizam inúmeras variáveis em uma só.

A coleta dos dados estruturados pode ser feita de duas formas. A primeira é diretamente pelo pesquisador. Nessa modalidade, quem coleta os dados faz a pergunta, ouve a resposta do respondente e faz a anotação no instrumento de coleta de dados. No caso de seres não humanos ou coisas, o pesquisador, naturalmente, faz as devidas mensurações e observações e o consequente registro. A segunda é o preenchimento pelos seres humanos, sempre que possível. O pesquisador lhes fornece o instrumento e eles leem, interpretam, fazem os registros e devolvem o instrumento preenchido aos pesquisadores. Ambas as alternativas têm seus prós e contras que precisam ser avaliadas com adequação pelo pesquisador, de maneira a garantir a máxima validade dos dados.

A estruturação dos dados não é uma ocorrência natural nas práticas das investigações científicas. A maioria das pesquisas se dedicam à descoberta de novas variáveis, configurando-se as típicas pesquisas exploratórias. Dados estruturados são utilizados em estudos associativos e relacionais, com raras exceções. Nos esforços de geração de tecnologias, contudo, como a finalidade é a materialização de algum artefato físico, é bastante comum que estudos não estruturados e semiestruturados sejam utilizados e simultaneamente trabalhadas as suas descobertas (dimensões e categorias) em formatos estruturados, como será mostrado a seguir.

(*) Daniel Nascimento-e-Silva, PhD, Professor e Pesquisador do Instituto Federal do Amazonas (IFAM)

 

Veja também

Topo