Em sua coluna para o jornal O Globo ontem (19/06/13), o
jornalista Merval Pereira destaca uma coisa importante em relação aos protestos
recentes no Brasil, iniciados a partir do aumento tarifas de transportes públicos: “...é impressionante que o imenso aparato de
informações de que cada governo dispõe, especialmente a presidência da
República, e as pesquisas de opinião não detectaram essa indignação que
explodiu nas ruas.”
É realmente impressionante, mas não inexplicável.
O próprio jornalista fornece a pista dessa explicação em outra parte do texto: “O dono de um desses institutos de opinião chegou
a ironizar as oposições e analistas que criticavam o governo, afirmando que
viviam em uma realidade paralela, que nada tinha a ver com a vida do cidadão
comum, que estava muito satisfeito. Segundo ele, não havia sinal de mudança de
ventos que suas pesquisas pudessem captar.”
Pronto. Está tudo dito. Pesquisas de opinião
não captam sinais de problemas complexos. Por que?
Porque uma pesquisa de opinião é a resposta
para uma pergunta que é feita. Um problema complexo é o somatório de milhares
de respostas às perguntas que ninguém fez.
Quando se elabora uma pesquisa de opinião,
perguntas preconcebidas só dão conta de questões previstas e recebem respostas
previamente pensadas.
As manifestações desta semana no Brasil são,
em seu conjunto, um fenômeno complexo desencadeado por um conjunto de fatores
que não estão diretamente ligados com o problema, portanto uma pesquisa de
opinião jamais poderia contemplá-los em suas perguntas. Sim, isso era um caso
para a analítica preditiva feita a partir de dados que não foram coletados para
nenhum fim específico (Big Data).
Antecipar a ocorrência de uma manifestação
justa como a que está ocorrendo, pode não ser o melhor exemplo da utilidade da
tecnologia preditiva, mas é um ótimo exemplo da diferença entre o poder de previsão
de uma pesquisa de opinião e o poder de uma analítica preditiva em Big Data.
Para entender a limitação de atuação de
cada tecnologia, é preciso saber a diferença conceitual e metodológica entre previsão
(forecast) e analítica preditiva (predictive analytics).
PREVISÃO (forecast)
A previsão é feita a partir da utilização
de grande quantidades de dados de mesma natureza. A metodologia consiste em uma
projeção, em que os dados viajam para dimensões maiores de tempo ou espaço.
O exemplo mais conhecido disso é a previsão
do tempo. Dados de um mesmo domínio, que têm uma relação direta de causa e
efeito com o fenômeno, são transferidos para o futuro (viagem no tempo) gerando
um resultado com grau de incerteza conhecido.
Outro exemplo é a pesquisa de opinião.
Dados de uma mesma natureza, coletados em uma amostra, são transferidos para o
total da população (viagem no espaço) gerando também um resultado confiável.
O resultado de uma previsão é uma estimativa
e a ciência que a fundamenta a metodologia é a Estatística.
ANALÍTICA PREDITIVA (predictive analytics)
A predição é feita a partir de uma grande
quantidade de dados de domínios diferentes, aquilo que já se convencionou
chamar de Big Data. A metodologia é
um julgamento baseado na experiência e no aprendizado que se dá quando dados de
um domínio do conhecimento viaja para outros domínios.
Em 2008, por exemplo, o Google conseguiu antecipar
em 7 a 10 dias, a dinâmica da contaminação pelo vírus da gripe H1N1, baseado
nos dados de utilização da ferramenta de busca dos seus usuários. Rastreando o conteúdo
das buscas, a empresa conseguiu identificar correlações inusitadas entre as
pesquisas e a contração da doença em um determinado grupo social. É importante
entender que o modelo antecipava não apenas a quantidade de casos, mas também o
deslocamento do vírus. O modelo foi tão bem sucedido que fundamentou as ações
preventivas do governo americano para impedir uma pandemia da doença.
O resultado de uma analítica preditiva é um
insight e a ciência que fundamenta a
metodologia é a Ciência das Redes. Para saber o que é isso leia esse post aqui.
Diferente da previsão, a analítica
preditiva é capaz de antecipar as mudanças nas tendências porque considera
fatores que não têm uma relação causa-efeito imediata com o fenômeno.
Voltando às manifestações recentes no
Brasil, por que as pesquisas de opinião não captaram um evento tão grande, tão
generalizado e tão intenso?
Primeiro é importante ressaltar que a
última pesquisa CNI/IBOPE apontou uma queda de 8% na aprovação da atuação do
Governo Federal. Além disso, a área de atuação que mais colaborou para a queda do
índice geral foi o controle da inflação cuja aprovação caiu 10% em relação à
pesquisa anterior. Observando esses números agora, podemos dizer que se
tivessem sido olhados com mais atenção, seria possível prever as manifestações
contra o aumento das tarifas do transporte público? A resposta é não.
Os manifestantes podem nem saber, mas
quando escrevem nos cartazes “não é por 20 centavos”, estão dizendo
que a sociedade é um sistema extremamente complexo e não é possível fazer
previsões a partir de uma relação causa-efeito linear.
Predizer as manifestações dos últimos dias significava
ter o insight rapidamente a partir de milhares de informações como: em que
nível estava a tolerância dos 41% que desaprovam o governo? O que os 55% que
consideram a atuação ótima não poderiam tolerar? O que transporte significa
além de mobilidade? O quanto de confiança na democracia gera de sensação de segurança
suficiente para sair às ruas? O que significa no momento atual ir às ruas, além
de conseguir uma redução nas tarifas? As pessoas têm sede de quê? O quanto é
vital essa sede? Que assuntos as pessoas deixaram de falar para começar a falar
de ir às ruas? Qual foi o trade off?
A má notícia é que numa rede complexa é
humanamente impossível encontrar e correlacionar todos esses fatores. A boa é
que a rede complexa chamada sociedade está digitalizada. Os dados gerados nesse
contexto chamam-se Big Data. A tecnologia de geração de conhecimento a partir
desses dados existe. E a necessidade de sua utilização, não precisa dizer, é
latente.
A vantagem de ter um vislumbre do futuro é que isso nos dá opções.
Agora se você me perguntar se analítica preditiva pode ser utilizada para tomar decisões ruins, a resposta é sim. Mas isso já não é mais uma questão de tecnologia.
A vantagem de ter um vislumbre do futuro é que isso nos dá opções.
Agora se você me perguntar se analítica preditiva pode ser utilizada para tomar decisões ruins, a resposta é sim. Mas isso já não é mais uma questão de tecnologia.
Nenhum comentário:
Postar um comentário