Mostrando postagens com marcador complexidade. Mostrar todas as postagens
Mostrando postagens com marcador complexidade. Mostrar todas as postagens

sexta-feira, 15 de junho de 2018

Então a Espanha será a campeã do mundo


Gosta de futebol? Gosta de Copa do Mundo? Gosta de big data? Você pode gostar disso também: o jornal Financial Times analisou alguns dados para apontar o melhor time desse mundial (France, Germany, Brazil, Spain: who has the best World Cup squad?). Como você deve ler essa matéria?

Lembre-se que DADOS NÃO FALAM! Se você pegar um data set, mesmo que completo, limpo, estruturado, todo bonitinho, ainda assim ele não falará nada. Falar é comunicar e para isso é preciso haver uma mensagem. Toda mensagem é fruto de um somatório de vieses e isso é inevitável! Isso quer dizer que, com o mesmo dataset, diferentes analistas entregariam diferentes informações.

Um viés já aparece quando se formula a pergunta, mas vamos imaginar que a pergunta seja a mesma para todos, portanto que não houve escolha nessa etapa. A pergunta que o FT se fez foi: Que país tem o melhor time na Copa?
O que significa ter o melhor time da Copa? Não há consenso sobre isso. O FT optou por considerar o “somatório” da qualidade e experiência dos jogadores. Uau! Aqui já temos um grande viés! E vai piorar! Esse processo de definir o que responde à pergunta feita, chamamos de DATAFICAÇÃO. Você nem percebe, mas nesse momento esta´definindo que dados responderão à sua pergunta.

E agora vamos enviesar mais. Vamos montar o algoritmo: o que é qualidade e experiência? Para o FT, qualidade é ter jogado nos times melhores. Experiência é a soma dos minutos jogados em competições de elite. Para não complicar muito, nem vou entrar no detalhe de que ‘melhores times’ e ‘competições de elite’, já são um poço de vieses!

Pronto. Agora sim alguém falou alguma coisa (e não foram os dados, heim?): A Espanha tem o melhor time. Seguido pela Alemanha, França e Brasil. A Itália ficou bem perto, mas nem se classificou para a Copa... No final das contas, o melhor time mesmo será o que levar a taçã para casa! A conferir!

Não existe certo ou errado nas escolha de um processo analítico. Só temos que saber que são escolhas e quais foram elas (tudo a ver com a discussão sobre transparência de algoritmos). Nas escolhas do FT foram desconsiderados quantas Copas o país participou, quantos minutos os jogadores jogaram juntos, o histórico do técnico e muitos outros atributos importantes e às vezes não relacionados com futebol. Mas, escolhas são escolhas e eles deixaram as deles bem claras!

Agora um detalhe final: uma parte muito importante da mensagem data driven é como você entrega o resultado da sua analítica, processo mais conhecido como VISUALIZAÇÃO DE DADOS (nome bem equivocado, mas deixa assim...) Diga aí, o que você achou dessa? Uma boa visualização de dados mostra claramente a sua resposta para a pergunta feita. Se alguém precisar tomar uma decisão baseada nisso, que seja rápida e inequívoca. Se entregar essa analítica para um bom designer especializado em visualização de dados, o FT consegue coisa bem melhor!

Para descontrair: boa visualização de dados mesmo está no mapa que o jornal espanhol usa para falar da previsão do tempo no país. Numa feliz sacada o FT comenta: a Espanha ignora solenemente Portugal, e não somente no esporte! As duas seleçoes estreiam hoje se enfrentando. Imperdível!

OBS: Todas as fotos são da matéria do FT

quinta-feira, 14 de janeiro de 2016

Mind the gap


MIND THE GAP

Quem já andou no metrô de Londres sabe que mind the gap é uma recomendação quase obsessiva da TFL (Transport for London, empresa que faz a gestão da mobilidade da cidade). A expressão que significa “cuidado com o vão” alerta para o risco do passageiro de introduzir o pé no vão que existe entre a plataforma e o vagão do trem. O que está implícito na mensagem é que o gap existe e que o risco é grande: se você não sabe que ele está lá, ou negligencia sua existência, vai acabar metendo o pé naquele vazio e as consequências podem ser desde um simples contratempo, até um transtorno maior com perdas inestimáveis ou irreversíveis. 

Opa! Tá aí uma boa metáfora para quem quer embarcar na era do big data.

Vamos por partes. Primeiro a plataforma. Depois o trem. Finalmente o gap

O QUE É BIG DATA?
Big Data é a maior plataforma de geração de conhecimento e inovação do século XXI. Dados digitais são a matéria prima para informações sobre as pessoas e sobre como as pessoas se relacionam entre si, com a natureza e com os objetos que estão à sua volta.
QUAL O VALOR PRÁTICO DISSO?
Esses dados nos ajudam a ver, caracterizar e compreender coisas que antes nem sabíamos que existiam. Também nos ajudam a descobrir causas e consequências de determinados problemas. Possibilitam ainda prever determinados acontecimentos a partir de padrões ou correlações entre fenômenos. O impacto de tudo isso é um empoderamento da nossa capacidade de fazer melhores escolhas. Onde quer que haja um ser humano tomando uma decisão, desde a mais simples até a mais complexa, lá estarão os dados digitais facilitando esse processo. Um bom processo de tomada de decisão é o trem onde todos querem embarcar.
O QUE NOS IMPEDE DE IR MAIS ADIANTE?
O gap. O vão. O vazio.

A visão que se tem sobre qualquer coisa pode ser uma barreira ou uma alavanca para nossos objetivos. A maioria das pessoas, especialistas ou novatos no tema, têm a seguinte visão sobre big data:
É assunto para a tecnologia da informação; é restrito a quem possui como ativo grande quantidade de dados; exige um alto investimento; é algo que ameaça a privacidade das pessoas.
Com essa visão só nos resta esperar um ambiente restritivo ao uso de dados, onde cabe um papel ativo aos afortunados, passivo aos não favorecidos e reativo às vítimas que tentam proteger suas informações pessoais.
MIND THE GAP
Big Data é assunto para de tomador de decisão. Qualquer pessoa que precise fazer escolhas deve se interessar pelo tema, porque dados digitais ajudam a reduzir o erro nas escolhas e, numa época de grande propósitos e recursos limitados, a tolerância por erros será cada vez menor.
Não queremos errar, por exemplo, quando procuramos o melhor preço para o produto que queremos comprar, escolhemos o melhor trajeto para um deslocamento ou o melhor tratamento para uma doença. As empresas também não querem errar quando configuram um produto ou serviço, ou quando se comunicam com seu publico alvo. Gestores públicos têm cada vez menos margem de manobra para lidar com o caos urbano e os problemas para a saúde e segurança públicas.
Essa visão de que big data está relacionado com ação e sucesso, muda radicalmente o nosso posicionamento em relação ao assunto. Primeiro, porque transforma todos em atores e beneficiários do ambiente digital. Segundo, porque transforma dados digitais em ativo pelo seu uso e não pela sua posse.
A partir daí, criaremos um ambiente para trabalhar dados digitais como algo que diz respeito ao conhecimento e não apenas à tecnologia. Isso tem grandes implicações nas estratégias que estabeleceremos nas empresas e nos órgãos públicos, nos novos modelos de negócio e na regulamentação do ambiente digital.
Certamente os sensores, a comunicação móvel, a analítica digital e a computação em nuvem são os elementos que constituem o fenômeno big data. No entanto, nenhum valor será tirado daí se não compreendermos e soubermos utilizar bem outros conceitos que ultrapassam a fronteira tecnológica como:  complexidade, dinâmica social, engenharia da sociedade, smart cities, open data, colaboração, crowdsourcing, idlesourcing, gamificação, pensamento exponencial, design thinking, data driven decision, rastros digitais, ética, ativos e outputs intangíveis, entre tantos outros.

O gap existe e está lá ameaçando qualquer um que venha desavisado e ansioso para embarcar no trem. Enfiar o pé no gap significa fazer altos investimentos em tecnologia para analítica, sem ter ajustado a estratégia, processos e competências para uma cultura data driven. Mind the gap

terça-feira, 17 de novembro de 2015

“Mostre-me um muro com 15 metros e eu lhe mostro uma escada com 16..."

“Mostre-me um muro com 15 metros 

e eu lhe mostro uma escada com 16..."



Tudo ainda não passa de especulações, mas é possível que os terroristas dos ataques a Paris (13/11/15) tenham se comunicado via PlayStation 4. A suspeita do uso do PS4 veio das evidências encontradas nas casas dos suspeitos e de outras pessoas que se relacionavam com eles, do fato de poder haver comunicação entre os usuários dos jogos, da existência de um bom sistema de criptografia nessas plataformas e do fato das agências de inteligência não terem rastreado nenhuma comunicação suspeita nos meios tradicionais de comunicação.

Independente de ficar comprovada ou não essa hipótese, o fato é que os terroristas não deixaram rastros para serem seguidos, ou... pelo menos não aqueles pelos quais estávamos procurando...

Os terroristas modificam seu comportamento para garantir o sucesso da sua empreitada. Isso é típico de sistemas complexos: eles mudam para perpetuar. Toda luta por sobrevivência apresenta forças motoras de grande poder. Ações pontuais são apenas pequenos obstáculos que se colocam no caminho dos sistemas complexos obrigando-os a contorná-los. 

Em 2005 a governadora do Arizona nos Estados, Janet Napolitano, imortalizou uma frase para explicar porque um muro não conseguiria conter a imigração ilegal dos vizinhos mexicanos para seu estado: “Show me a 50-foot wall and I’ll show you a 51-foot ladder.” (o título dessa postagem é uma tradução livre dessa frase).

Ela está certa. Rastreamos aqui eles correm para lá. Erguemos um muro alto e eles arranjam uma escada mais alta...

Vejam que para um sistema complexo não importa se a sua perpetuação é algo desejado ou não pela humanidade. Não importa se o sistema em questão seja formado por pessoas famintas buscando comida, por vírus tentando dizimar uma população, anticorpos combatendo uma doença ou um grupo terrorista querendo se autoafirmar, a propriedade de adaptação é a mesma. A ciência das redes chama esses sistemas de CAS, complex adaptative systems, e afirma que eles se comportam de modo bem parecido. Isso nos dá uma dica de como abordar esses problemas: o ideal é estudar a topologia das redes que os sustentam e buscar gerenciá-las de modo a gerar um resultado diferente do que ela está apresentando. Sim, é muito mais demorado, mas é isso ou se enganar, achando qu agir na causa aparente significa resolver o problema.


O estudo da complexidade usa redes como ferramenta para elaborar modelos que possam nos ajudar a prever o comportamento dos sistemas complexos. Se essa rede atua em ambiente digital, a modelagem fica mais fácil ainda. mesmo com a comunicação criptografada, Criptografia não apaga metadados. O conteúdo da informação pode estar inacessível, mas saber de onde ela veio e para onde ela foi, pode ser suficiente para modelar, descrever, prever e controlar essas redes terroristas.

Rede é uma ferramenta de alto poder descritivo e preditivo e será usada cada vez mais em todos os domínios do conhecimento. Hoje já nos acostumamos a ver redes nos estudos de mobilidade, de influência social e de transmissão de doenças. Mas isso é só o começo.

quinta-feira, 14 de maio de 2015

Network Thinking, Ciência das Redes e Big Data

Network Thinking, Ciência das Redes e Big Data

Em 2014 o Centro de Referência em Inteligência Empresarial (CRIE) da Coppe/UFRJ, lançou um curso para colocar Big Data na agenda estratégica dos gestores brasileiros. O curso é denominado WIDA (Web Intelligence & Digital Analytics), tem uma peculiaridade digna de destaque: a determinação em fazer com que os alunos desenvolvam o network thinking, ou seja, a percepção de que os problemas que eles desejam resolver com os dados digitais são resultantes da interação de agentes de um sistema complexo. O curso apresenta a Ciência das Redes como mind set essencial para a gestão do ambiente digital. De fato, pensar em termos de rede é competência fundamental para quem deseja gerar valor a partir de dados digitais.

Você sabe o que Ciência das Redes tem a ver com Big Data?

A Ciência das Redes, como chamamos aqui no Brasil, é o campo que busca conhecer as leis que governam os sistemas complexos. Cientistas acreditam que modelar matematicamente a complexidade é o único caminho para o desenvolvimento da tão sonhada Inteligência Artificial (AI).

Falando de modo simplificado, sistemas complexos são formados por um grande número de componentes relativamente simples (também chamados de nós) e funcionam sem um comando central porque esses nós têm comportamento autônomo e emergente. São sistemas complexos, entre outros, o cérebro, o código genético, uma colônia de formigas, a world Wide Web e a sociedade. 

Como a www é um sistema complexo totalmente digital, tem sido usado como campo empírico para a modelagem matemática desses sistemas. 

Segundo Barabasi, um dos cientistas mais atuantes e reconhecidos nesse campo, com dados suficientes um sistema complexo pode modelado matemáticamente e desse modo ser compreendido para ser antecipado e controlado. Médicos querem controlar a disseminação de um vírus, empresas querem antecipar o comportamento do consumidor, o mercado deseja controlar preços, os governos, evitar crises financeiras, as seguradoras, antecipar sinistros e controlar as fraudes e etc.

Pronto. Essa é a maneira mais objetiva de associar Ciência das Redes a Big Data. 

Para começar a desenvolver seu network thinking, comece lendo uma conversation Albert-László Barabasi no site edg.org. Intitulado Thinking in Network Terms (clique no título), o texto é a transcrição de uma conversa que o cientista teve em 2012 com John Brockman, editor do site, sobre a importância dos dados digitais para o estudo da complexidade. Além de ser uma simples e excelente introdução á Ciência das Redes, o texto é uma bela defesa da cultura open data, quase um manifesto pelo livre compartilhamento de dados em benefício da ciência.

Que saber mais? Pergunte!