Os desafios silenciosos da mineração de dados

[O texto abaixo é uma colaboração do grupo Grupo Geminis UFSCar, que está utilizando o BrandCare graças ao apoio de um plano acadêmico oferecido pela Social Figures]

Sessão-TerapiaNa última década, as ferramentas de monitoramento de redes sociais se multiplicaram numa velocidade vertiginosa e se tornaram um dos grandes motores da economia contemporânea. Na sociedade da informação, a expressão, o meio e a mensagem cedem lugar para os grandes bancos de dados das plataformas transmídia. Assim, devido à enorme importância econômica e social que adquiriram, as técnicas de monitoramento das redes sociais geram controvérsias. A maior desconfiança é gerada pelo fato de que essas técnicas são tratadas no mercado, bem como no ambiente acadêmico, como verdadeiras caixas-pretas. Ou seja: como existem poucos estudos que mostrem como essas ferramentas funcionam, elas são vistas como máquinas dotadas de um saber/fazer que produz uma série de ruídos na comunicação, provocando a deterioração de algumas noções do que se entende por ‘social’.

Na realidade, essas ferramentas influenciam os novos modos de vida que se encontram em curso nas redes sociais, vide o espaço conquistado pela legião de novos comunicadores das redes sociais, mais conhecidos como youtubers, instagrammers e viners. O temor difundido nas próprias redes sociais é de que essas ferramentas foram criadas somente para nos monitorar (capazes de ler os e-mails, conversas entre usuários e preferências de consumo) e utilizar essas informações com os mais diversos propósitos. Um dos sintomas disso está na disputa intensa de compra e venda de dados, como a aquisição do Whatapp e do Instagram pelo Facebook.

As formas de mineração de dados em redes sociais são interpretadas em um contexto onde informações de valor são números e gráficos condensados, excluindo o dado real do social e do subjetivo, a fim de gerar dados econômicos, objetivos e não necessariamente críticos. A maioria das pesquisas geram dados que respondem de forma quantitativa às perguntas específicas que validam uma ou outra hipótese previamente definida (opinião sobre um jogo de futebol, resultados de campanhas políticas, o valor percebido em uma marca ou a circulação de um conteúdo específico na rede) e são utilizadas para expor o que aconteceu em um determinado momento do passado ou para traçar previsões futuras baseadas nesse resultado encontrado – sem um contexto amplo da circulação.

Ao somar essas constatações, o manuseio do software BrandCare e os propósitos de pesquisa efetivada pelo grupo GEMInIS, foi percebido que os dados coletados, embora ricos e eficientes para nosso conhecimento de pesquisa com redes sociais, não iriam conseguir responder todos os aspectos subjetivos relacionados à recepção dos fãs da série brasileira, Sessão de Terapia (nosso objeto de pesquisa). Esse aspecto não está relacionado às limitações e funcionalidades do software, mas tem origem na complexidade encontrada ao lidar com um grande volume de informações no campo da comunicação. Muito além de analisar os gráficos e tabelas, para compreender a multiplicidade de discursos e as contextualizações possíveis com a obra expressadas pelo fã, é necessário que os pesquisadores retomem aos dados brutos para efetivar uma análise manual e individualizada. Além disso, é necessário que o pesquisador se coloque junto aos fãs, atuando entre a observação e a participação para poder, inclusive, traçar novas formas de coletar e organizar o material. Somente assim, ele terá a possibilidade de não se transformar numa máquina geradora de respostas e não questioná-las ao se isolar em números e gráficos, crendo apenas nos dados, quando eles são passíveis de falhas e de entendimento de práticas subjetivas.

Afinal, o que exatamente leva alguém a curtir, compartilhar ou comentar algo nas redes sociais? Porque ficar apenas nos números, quando eles são passíveis de manipulações com propósitos diversos? Em qual contexto social, econômico e de produção surgem esses líderes de opiniões e celebridades nas redes sociais? O quanto toda essa caixa-preta de dados é conduzida por interesses de mercado institucional e não do público? Em tempos que a comunicação significa também o ecoar de várias vozes pelas redes, precisamos reposicionar e repensar o seu papel perante a interpretação desses gráficos e números, o que demanda um olhar global menos fascinado com os meios e mais atento às metodologias utilizadas para entender as mediações e seus entornos.

Ao mesmo tempo em que esse panorama parece posicionar a pesquisa com mineração de dados em um labirinto gigantesco, é o tamanho desse desafio que se apresenta como um catalizador para que os pesquisadores continuem buscando a realização das perguntas corretas ao invés de tentar obter todas as respostas possíveis por meio dos softwares.

A pesquisa em andamento é uma realização do Grupo Geminis – certificado pelo CNPq, vinculado ao Programa de Pós-Graduação em Imagem e Som da UFSCar. O grupo desenvolve o projeto de pesquisa ”Laboratório de Pesquisa sobre a Produção Seriada Audiovisual Brasileira para Plataformas Transmídia” , aprovado pelo Edital MCTI/CNPQ/MEC/CAPES Nº 22/2014 – Ciências Humanas, Sociais e Sociais Aplicadas. Diretório de Grupos de Pesquisa no Brasil – http://dgp.cnpq.br/dgp/espelhogrupo/1519774412251748.
Prof. Dr. João Carlos Massarolo- UFSCar
Prof. Me. Dario Mesquita – UFSCar
Gustavo Padovani – UFSCar

Deixe uma resposta