Big Data nas eleições

(*) Por Wesley Santos

Quem é o meu eleitor? Qual a opinião das pessoas sobre as minhas propostas? Será que os eleitores gostaram da postagem que eu fiz ontem? Estas são algumas dúvidas que provavelmente passarão pela cabeça dos políticos que disputarem as eleições deste ano para prefeito, vice-prefeito e vereador. O modo tradicional de responder a estas perguntas se baseia nas pesquisas eleitorais feitas por grandes institutos. Mas fica a pergunta: e as milhares de opiniões geradas diariamente pelas redes sociais? Como quantificar um tuíte, um post no Facebook, um comentário feito no Youtube após um vídeo viral ou até mesmo um meme de um candidato? A resposta está no uso de ferramentas de Analytics voltadas para análise de grande quantidade de dados, ou seja, o Big Data.

Para se ter uma ideia do tamanho das informações que estamos falando, apenas nas eleições presidenciais de 2014, assuntos relacionados ao tema chegaram a 39 milhões de tuítes e cerca de 674 milhões de postagens no Facebook (incluindo curtidas e comentários), no período de julho a outubro de 2014. Esse novo cenário cria inúmeras vantagens para o partido que souber melhor aproveitar as soluções analíticas voltadas para a análise de grandes bases de dados.

Para dar conta dessa avalanche de informações são necessárias técnicas que apliquem conhecimentos avançados de estatística e de computação. Estamos falando de algoritmos de Machine Learning e tecnologias que possibilitam aos sistemas encontrar padrões e, assim, auxiliar na tomada de decisões rápidas. Uma técnica já aplicada com sucesso em áreas de inteligência analítica voltadas para marketing é o Support Vector Machine (SVM – Máquinas de Vetores de Suporte) – algoritmo que busca padrões para classificação de dados.

O SVM pode ser utilizado para saber a opinião, a satisfação e o sentimento dos eleitores nas redes sociais. Geralmente, essas percepções são chamadas de análises de sentimentos. Para o candidato, é interessante saber se determinada política ou programa eleitoral está com aceitação ou rejeição junto aos eleitores; ou ainda ter conhecimento, em tempo real, do sentimento das pessoas durante um debate eleitoral. Estamos falando de opiniões e comentários, sejam na forma de tuítes, curtidas, postagens em blogs, comentários em vídeos e até a reação de pessoas a determinados memes.

Outra técnica que pode ser utilizada é o algoritmo de classificação k-means. O objetivo, nesse caso, é encontrar grupos de eleitores com similaridade ou dissimilaridade de opiniões. Por exemplo, grupos de eleitores que demonstrem interesse em candidatos que defendam politicas voltadas a sustentabilidade ou melhorias no transporte público em detrimento ao uso de carros, entre outros exemplos. Também é possível identificar regiões com baixa adesão de eleitores e que mereçam maior engajamento. Dessa forma, os candidatos podem segmentar seus esforços em determinados grupos e terem um foco de atenção mais especifico.

Independente da técnica utilizada, o candidato que souber tirar melhor proveito das ferramentas de Analytics terá uma vantagem sobre os demais. As pessoas estão dizendo o que querem, mas agora a informação está dispersa, diluída, misturada em diferentes plataformas. Ter as ferramentas certas para analisar e traduzir em insights essa grande quantidade de informações será o diferencial que poderá levar o político a uma vitória na próxima eleição.

(*) Wesley Santos é formado em Estatística pela USP (Universidade de São Paulo). Atua como instrutor nos cursos estatísticos do SAS Brasil. Possui experiência como consultor nas áreas de Modelagem de Risco de Crédito, Modelagem de Prevenção à Fraudes e Estatística Avançada.

Fonte: sas.com