Coluna C & T: Organização de dados não estruturados – Daniel Nascimento-e-Silva

A mente dos cientistas procura de diversas formas encontrar uma lógica para organizar os dados não estruturados. Com o perdão da tautologia, essa dificuldade é característica fundamental desse tipo de dados, que é o desconhecimento de uma possível estrutura, que todos os tipos de dados apresentam. A diferença é que, nesta etapa dos empreendimentos científicos, ainda são desconhecidas as categorias que fazem parte de cada uma de suas dimensões analíticas. Analogicamente, é como se os dados colhidos fossem peças de um quebra-cabeças que os cientistas não fazem ideia de onde encaixá-los porque também não têm a mínima noção de que figura ou paisagem estão compondo. Sabe-se, ainda que de forma um tanto quanto sem convicção, de que aqueles dados coletados fazem parte de alguma variável (categoria) que provavelmente faz parte do fenômeno que se está querendo conhecer, mas que não se faz ideia de que e quantas partes o compõem. Também é comum que algumas partes sejam conhecidas e outras não, assim como não se sabe que componentes formam cada uma delas. Todas essas possibilidades confirmam a natureza dos dados não estruturados porque não se tem conseguido, até então, montar o quebra-cabeças de uma forma que se tenha uma visão, mais ou menos nítida, de suas partes e componentes. É esse o desafio da organização dos dados não estruturados.

Estruturar é dividir em partes e componentes das partes. Um organograma, por exemplo, é uma forma de organizar um órgão público, como um instituto federal. Ali estão representadas as unidades fim, nos extremos da figura, e unidades-meio, no meio, naturalmente. A primeira caixinha representa a autoridade máxima, enquanto a segunda linha mostra as autoridades máximas de cada unidade, meio e fim. Embaixo de cada autoridade máxima, representada pelas pró-reitorias, estão os seus componentes. É como se fosse uma fotografia, em que o todo (o instituto federal) é composto por partes (cada pró-reitoria) e seus componentes (cada diretoria de cada pró-reitoria). Nesses casos se tem uma figura que representa com fidelidade o aspecto formal, oficial, legal, juridicamente ordenado do fenômeno instituto federal, que é o organograma. Naturalmente que há outras formas de representar esquematicamente qualquer estrutura, de maneira que o organograma é apenas uma peça com esse intuito.

Mas há muito fatos e fenômenos do mundo que são desconhecidos da ciência. Muitos deles não são de seu interesse. Mas outros o são. Dentre estes, há os que não se têm a mínima ideia de como eles podem ser ou parecer. A matéria escura e a energia escura são dois exemplos típicos, assim como a maneira através da qual o conhecimento migra do cérebro, que é um artefato físico, para a mente, reconhecidamente extrafísica. Inúmeros fenômenos são de interesse científico, mas que ainda se está tateando, avançando-se lentamente, ainda que os estudos se tenham avolumado, como é o caso dos que focam o conhecimento da consciência. Alguns motivos explicam essa lentidão, quase todos centrados na fragilidade de métodos e técnicas para tal, ou mesmo sua inexistência.

Para que se entenda melhor esse desafio hercúleo, imagine-se procurando alguém invisível em uma multidão. Você só sabe que esse alguém é invisível. E mais nada. Em outras situações já se sabe alguma coisa. Esse alguém, que é invisível, é careca. Daí vem que o primeiro esforço é inventar uma forma de ver o invisível, para depois, evidentemente, separar os carecas dos não carecas. A separação dos carecas dos não carecas já é uma primeira etapa do desafio de conhecer esse indivíduo invisível, já é um progresso rumo à estruturação dos dados não estruturados. Como proceder? Não se sabe ao certo, até que alguns elementos e partes sejam conhecidas para que as primeiras associações possam ser feitas.

Uma estratégia pode ser mapear os sintomas ou efeitos que o fenômeno ou uma de suas partes causam. O problema é que muitas vezes não se sabe o que é causa ou efeito. Por exemplo, é a matéria escura e energia escura que causam a gravitação ou o contrário? Sabe-se apenas, e ainda em termos de alta probabilidade, que a matéria física representa pouco mais de 4% de tudo o que existe. Quase tudo o mais são justamente matéria e energia escuras. E como se sabe? Pela suposição de que são elas que impedem os átomos e tudo o que existe fisicamente de se dissipar. É uma suposição porque ainda não se pode demonstrar isso. E toda suposição sem demonstração fática é pura filosofia. Não é ciência. Nem que seja falado, afirmativo e bradado pelo mais famoso e idolatrado cientista.

Mas geralmente o que se faz são esquemas lógico-interpretativos provisórios, que serão utilizados em investigações imediatas. Esses esquemas podem ser tanto relações de causa-efeito, do tipo efeitos inexplicáveis em aspectos físicos por parte de outros aspectos ainda desconhecidos, como é o caso da energia e matéria escuras, ou do tipo de agrupamento de sintomas, como se fizéssemos conjuntos ou coletâneas de sintomas semelhantes. No primeiro caso, a finalidade é contornar o fenômeno desconhecido; no segundo, o mapeamento de suas consequências. Em ambos os casos, contudo, o que se faz são os prenúncios estruturais a partir de estratégias diversas. Ao final da organização dos dados se tem a) um possível contorno fenomênico, b) possíveis componentes ou partes do fenômeno ou c) mapa de efeitos.

Freud é considerado o pai da psicanálise. Seu trabalho consistiu no desvelamento de um natureza intrínseca aos seres humanas, que foi denominada inconsciente. Como é inconsciente, nada se pode falar dele. Foi a partir do mapeamento de seus efeitos (atos falhos, tiques nervosos etc.) que pôde fazer um mapa relativamente completo desse fenômeno. Outros pesquisadores fizeram avançar os estudos, a ponto de Lacan demonstrar que o inconsciente é estruturado como uma linguagem. E, como toda linguagem, pode ser conhecido. A psicanálise e seus métodos são exemplos formidáveis de investigações que se aventuram por meio de dados não estruturados.

(*) Daniel Nascimento-e-Silva, PhD, Professor e Pesquisador do Instituto Federal do Amazonas (IFAM)

Veja também

Topo