Mostrando postagens com marcador ecossistema big data. Mostrar todas as postagens
Mostrando postagens com marcador ecossistema big data. Mostrar todas as postagens

sexta-feira, 15 de junho de 2018

Então a Espanha será a campeã do mundo


Gosta de futebol? Gosta de Copa do Mundo? Gosta de big data? Você pode gostar disso também: o jornal Financial Times analisou alguns dados para apontar o melhor time desse mundial (France, Germany, Brazil, Spain: who has the best World Cup squad?). Como você deve ler essa matéria?

Lembre-se que DADOS NÃO FALAM! Se você pegar um data set, mesmo que completo, limpo, estruturado, todo bonitinho, ainda assim ele não falará nada. Falar é comunicar e para isso é preciso haver uma mensagem. Toda mensagem é fruto de um somatório de vieses e isso é inevitável! Isso quer dizer que, com o mesmo dataset, diferentes analistas entregariam diferentes informações.

Um viés já aparece quando se formula a pergunta, mas vamos imaginar que a pergunta seja a mesma para todos, portanto que não houve escolha nessa etapa. A pergunta que o FT se fez foi: Que país tem o melhor time na Copa?
O que significa ter o melhor time da Copa? Não há consenso sobre isso. O FT optou por considerar o “somatório” da qualidade e experiência dos jogadores. Uau! Aqui já temos um grande viés! E vai piorar! Esse processo de definir o que responde à pergunta feita, chamamos de DATAFICAÇÃO. Você nem percebe, mas nesse momento esta´definindo que dados responderão à sua pergunta.

E agora vamos enviesar mais. Vamos montar o algoritmo: o que é qualidade e experiência? Para o FT, qualidade é ter jogado nos times melhores. Experiência é a soma dos minutos jogados em competições de elite. Para não complicar muito, nem vou entrar no detalhe de que ‘melhores times’ e ‘competições de elite’, já são um poço de vieses!

Pronto. Agora sim alguém falou alguma coisa (e não foram os dados, heim?): A Espanha tem o melhor time. Seguido pela Alemanha, França e Brasil. A Itália ficou bem perto, mas nem se classificou para a Copa... No final das contas, o melhor time mesmo será o que levar a taçã para casa! A conferir!

Não existe certo ou errado nas escolha de um processo analítico. Só temos que saber que são escolhas e quais foram elas (tudo a ver com a discussão sobre transparência de algoritmos). Nas escolhas do FT foram desconsiderados quantas Copas o país participou, quantos minutos os jogadores jogaram juntos, o histórico do técnico e muitos outros atributos importantes e às vezes não relacionados com futebol. Mas, escolhas são escolhas e eles deixaram as deles bem claras!

Agora um detalhe final: uma parte muito importante da mensagem data driven é como você entrega o resultado da sua analítica, processo mais conhecido como VISUALIZAÇÃO DE DADOS (nome bem equivocado, mas deixa assim...) Diga aí, o que você achou dessa? Uma boa visualização de dados mostra claramente a sua resposta para a pergunta feita. Se alguém precisar tomar uma decisão baseada nisso, que seja rápida e inequívoca. Se entregar essa analítica para um bom designer especializado em visualização de dados, o FT consegue coisa bem melhor!

Para descontrair: boa visualização de dados mesmo está no mapa que o jornal espanhol usa para falar da previsão do tempo no país. Numa feliz sacada o FT comenta: a Espanha ignora solenemente Portugal, e não somente no esporte! As duas seleçoes estreiam hoje se enfrentando. Imperdível!

OBS: Todas as fotos são da matéria do FT

sábado, 19 de maio de 2018

Fralda inteligente avisa: download concluído e é número 2

Qualquer tomada de decisão (qualquer mesmo), tem o seu ecossistema big data completinho

A Verily Life Sciences, empresa do grupo Alphabet (Google), registrou a patente de uma fralda com sensores que identificam não apenas quando a fralda precisa ser trocada, mas também informa se o bebê fez xixi ou cocô. O "tomador de decisão" recebe uma notificação no app do celular. Algo como: "Dowload concluído: é número 2"

Não preciso dizer que o dispositivo também registra dia/hora dos “eventos”.

Por enquanto a smart diaper é apenas uma patente registrada de um produto que não sabemos se será lançado ou adotado. O que importa é perceber que as inovações data driven têm um caminho de desenvolvimento: 
1. Escolher um problema qualquer (Qualquer mesmo!!! Por isso esse exemplo é tão perfeito!!!)
2. Identificar quem toma decisões sobre esse problema
3. Identificar que informações esse tomador de decisão precisa e quando
4. Dataficar o problema: escrever o problema em termos de dados
5. Definir a tecnologia que pode transformar as informações do mundo físico em dados digitais
6. Fazer um algoritmo que transforme esses dados na informação que o tomador de decisão precisa 
7. Definir como, onde e quando entregar as informações ao tomador de decisão
8. Guardar todos os dados e logo, logo começar a criar um monte de insights e serviços a partir deles

Chamamos esse processo de Gestão estratégica do Ecosssitema Big Data. Tudo isso foi transformado em uma metodologia conhecida como Big Data Estratégico1

O que foi descrito acima é um resumo genérico para quem está começando a gostar do assunto. Para o sucesso de um projeto em big data, muitas outras coisas precisam ser observadas. Por exemplo:

- Sobre o item 2: Nem sempre quem toma a decisão, age sobre o problema! Fique ligado! Às vezes você tem que projetar para duas entidades diferentes!

- Sobre o item 4: A ciência das redes oferece ferramentas incríveis para dataficar problemas complexos!

- Sobre o item 5: Nem sempre é preciso coletar novos dados. Um bom estrategista de dados sabe onde e como conseguir dados que já foram coletados para outros fins, mas interessam ao seu projeto

- Sobre o tem 7: A tomada de decisão pode ser automatizada, a partir de parâmetros pré-definidos. A ação sobre o problema também! Aí entram os robôs!

- Sobre o item 8: Como se chama o processo de pegar dados acumulados e saber para quê mais eles servem? Dataficação também! Dataficação tem dois sentidos: do problema para dados e dos dados para o problema! Em breve a Verily Life Sciences terá uma quantidade enorme de dados sobre onde, quando, e o quê os bebês fizeram nas fraldas e quanto tempo eles esperaram pela desejada troca. Pra quê servirá isso? Um especilista em dataficação no sentido dados-problema é um exímio modelador de novos negócios.

Agora é com você. Escolha um problema e projete o seu ecossistema big data!


1 Publicada na minha dissertação de mestrado (COSTA, Luciana.BIG DATA ESTRATÉGICO: UM FRAMEWORK PARA GESTÃO SISTÊMICA DO ECOSSISTEMA BIGDATA). A partir dessa pesquisa desenvolvi o WIDA (Web Intelligence & Digital Ambience), curso para tomadores de decisão data-driven. Atualmente o WIDA é uma pós graduação Lato Sensu em Big Data Estratégico sob a chancela da Coppe/UFRJ  Para saber mais sobre o curso WIDA, clique aqui.