Open Data: valor dos dados

Mostrando postagens com marcador valor dos dados. Mostrar todas as postagens

terça-feira, 15 de setembro de 2020

Doação de dados: você está preparado para essa conversa?

Existe um grande debate em torno do monopólio dos gigantes (Big Techs) da plataforma digital que conhecemos como WWW ou Web. Oferecendo produtos e serviços que atendem muito bem as necessidades das pessoas, essas empresas conquistam e concentram o mercado. Definido como uma situação particular de concorrência imperfeita, o monopólio não surge apenas da coerção, feita por governos através de leis que visam proteger um único agente. Existem setores que apresentam uma barreira de entrada natural tão grande, que geram monopólios espontâneos. Também tem aquele caso onde os concorrentes apresentam produtos e serviços tão diferentes, que de fato não fazem concorrência uns com os outros e formam a concorrência monopolística.

Então? Em qual desses casos de monopólio se encaixam as Big Tech? Nenhum. Alphabet (Google), Facebook, Apple, Microsoft e Amazon, não são beneficiadas por nenhuma reserva de mercado. Todas essas empresas têm concorrentes. Podemos pensar numa concorrência monopolística? Strava, por exemplo, é uma rede social que oferece a oportunidade de conhecer e interagir com praticantes de esportes do mundo inteiro. Um produto excepcional que, no entanto, não oferece concorrência ao Facebook. Usuários do Facebook não querem saber se seu “treino está pago”, e o Facebook não oferece ao atleta o que Strava oferece. O mesmo acontece com Facebook e Linkedin. Temos contas em diversas redes sociais porque, embora parecidas (perfil, posts, feed, like, comentários, amigos, etc), elas são substancialmente diferentes. A barreira de entrada para esses negócios é baixíssima! Quem nunca ouviu dizer “começou numa garagem”? Por que, embora tenha concorrentes, o público se concentra em uma ou outra plataforma?

O monopólio das Big Tech tem suas peculiaridades.Você pode comprar roupas numa loja com mais alguns milhares de desconhecidos enquanto seus amigos se espalham comprando em centenas de lojas que você nem sabe que existem. Tá tudo bem. No entanto, ninguém quer ficar numa rede social onde os amigos, ou aqueles com quem se deseja se relacionar, não estejam. Também não queremos comprar onde existam poucas avaliações e recomendações. Além de oferecerem boas soluções para seus usuários, os produtos das Big Tech se beneficiam do atributo REDE. Nós nos aglomeramos voluntariamente em torno delas e involuntariamente somos agentes dessa concentração. Tente imaginar o que aconteceria se a gente conseguisse deletar todas as redes sociais tipo Facebook, e começar de novo, com centenas de pequenos concorrentes, todos oferecendo serviços absolutamente iguais, numa concorrência perfeita! (Por favor, não deixe de me mandar comentários dizendo o que você acha que aconteceria!).

Outra peculiaridade dos monopólios digitais é que eles não são temidos por porque têm poder e controle sobre o mercado. Eles são temidos porque têm poder e controle sobre os dados. Talvez acabe sendo a mesma coisa porque o mercado das Big Techs na verdade, são os dados...

Dito tudo isso, podemos afirmar que temos uma boa visão sobre problema do monopólio das Big Tech. Por que não conseguimos enfrentá-los? Porque, embora estejamos vendo bem, não estamos enxergando direito. Só existe uma maneira de regular a concentração de poder que tanto tememos: a velha, temida e injustiçada abordagem dos dados abertos.

Toda empresa que coleta dados, tem a obrigação de dar a governança e o direito de utilizá-los (tudo previsto em acordos sociais conhecidos). A cessão dos direitos de uso é condicional, portanto temporária. Só quem tem direitos permanentes sobre o uso dos dados, são os agentes de onde eles foram extraídos. Em palavras simples, seus dados, sobre você, seus hábitos, ações e relações (seus “não dados” inclusive), pertencem a você e a você é assegurado o direito de fazer o que quiser com eles. Você vai me perguntar: se eu posso fazer o que eu quiser com eles, por que não posso impedir que essas empresas usem meus dados? Porque você assinou um contrato quando começou a usar os serviços dela: serviço de graça (ou por um valor X) e, em troca, todos os seus dados poderão ser usados “na melhoria dos serviços prestados”. Não é só isso. A empresa disse também pra você não se preocupar porque ela não vai “compartilhar seus dados com ninguém”. Pronto. Você cedeu os dados, aceitou que fossem usados e garantiu o monopólio de uso para essa empresa.

E agora? Agora você exerce o poder de fato (você já tem por direito) e torna-se um doador de dados. Voluntariamente, declare que seus dados devem ficar disponíveis para que uma plataforma de dados pública¹ os colete e disponibilize a serviço da inovação. Não, isso ainda não existe, mas deveria existir.

Uma plataforma pública de dados seria um lugar onde os dados proprietários voluntariamente cedidos, ficariam disponíveis e acessíveis para todos². Há muito o que se pensar para um modelo de negócio desse tipo, até porque existem parâmetros e inspirações para ele, mas não precedentes. Poderia se exigir, por exemplo, que aqueles que desejem usar os dados dessa plataforma pública, sejam doadores de dados. Pode-se exigir das plataformas sociais privadas que anonimizem os dados e disponibilizem, através de APIs, aqueles que fossem doados pelos seus verdadeiros proprietários.

Permita-se um tempo para pensar na ideia. Com o tempo você vai entender e aceitar que dados compartilhados estão muito mais protegidos do que dados aprisionados. O seus dados já são usados de qualquer maneira, mas estão gerando valor exclusivamente para um agente desse ecossistema.

Dados digitais são imprescindíveis para a visualização e abordagem de problemas complexos. Sabe o que são problemas complexos? Aqueles com uma infinidade de causas, correlacionados com outra infinidade de fenômenos e que, para completar, são dinâmicos por natureza. Um problema complexo nunca acorda do mesmo jeito que dormiu, porque a rede que o sustenta é formada por agentes vivos, autônomos, que fazem escolhas e emitem informações o tempo todo. Exemplos? Violência. Educação. Pandemia. Terrorismo. Pobreza. Todos esses problemas são complexos e por definição não possuem soluções. O máximo que conseguimos fazer com problemas complexos, é controlá-los o tempo todo e para sempre.

Todo mundo conhece a fórmula de sucesso do controle de algo: conhecer. Quanto mais informações temos sobre um problema, melhores as chances de controlá-lo. É preciso mapear e gerenciar, o tempo todo e para sempre, o máximo de informações possiveis. Sabe onde estão os dados que podem ajudar nesse processo? Em mãos privadas. Precisamos de acordos sociais que garantam o acesso coletivo a dados coletados de indivíduos. Essa necessidade é tão humana e tão premente, que podemos apostar que uma solução desse tipo, certamente está a caminho. Claro que uma boa regulamentação para proteção de privacidade se aplicará à uma plataforma pública. Se você confia em um acordo social feito com uma empresa para a proteção de seus dados, não tem porque não acreditar que o mesmo acordo pode ser feito para uma plataforma pública . Se não confia, melhor excluir todas as suas contas do Google, Amazon, Facebook, Linkedin, Apple, Microsoft e etc.

Existem várias maneiras de fazer uma plataforma pública de dados digitais doados tornar-se um excelente modelo de negócio para todos os envolvidos (stakeholders, se você preferir). Se a gente abraçar a ideia, as soluções chegam.

Você já doa seu tempo como voluntário em uma causa que defende, mesmo que seja apenas escrevendo um texto e publicando ou debatendo nas redes sociais. Talvez até doe dinheiro. Muitos são doadores de sangue e órgãos. Doamos o que temos sobrando e não nos faz falta, e mesmo que faça, é muito pouco em comparação com o benefício que pode gerar na causa que recebe. A próxima vez que pensar em doar algo para uma causa nobre, considere a doação de dados.

Você está preparado para essa conversa?

1 Pública não é sinônimo de estatal
2 Aí também poderiam ficar os dados abertos por default (os chamados dados públicos, que já são abertos por natureza), mas para esses ao menos já existem acordos sociais para compartilhamento.

sexta-feira, 19 de abril de 2013

Quer vender dados? Pense de novo

Quer vender dados? Pense de novo.

Novo petróleo, é uma das expressões que se usa quando tentamos convencer alguém do valor do Big Data.

Qual a maneira certa de entender a comparação?

Quando Clive Humby usou a metáfora “novo petróleo” em 2006 para se referir ao Big Data, sem querer reforçou a crença de que os dados têm valor apenas pelo seu volume. Digo reforçou, porque isso aconteceria de qualquer modo, mesmo sem a ajuda de Humby. Na ânsia de conhecer a nossa riqueza, colocamos rapidamente etiquetas de valores em nossos ativos tangíveis, que podem ser vistos e contados, e muitas vezes esquecemos os intangíveis. Ver e avaliar ativos intangíveis ainda são competências raras.

Dados digitais podem ser contados e, embora não sejam tão concretos assim, é normal que qualquer um que administre um grande banco de dados, quando ouve falar que Big Data tem um valor inestimável, inicialmente se imagine sentado em cima de uma reserva de petróleo: perfurou, jorrou, vendeu, ficou rico.

É certo que o petróleo também não tem valor intrínseco, mas faz parte de cadeias produtivas que geram ativos tangíveis numa relação direta entre volumes. Portanto é fácil valorar o petróleo pelo valor dos produtos gerados.

Só que dados fazem parte da cadeia que gera um ativo intangível, o conhecimento, e não existe relação direta entre os volumes dessa cadeia. Uma grande quantidade de dados não gera necessariamente uma grande quantidade de conhecimento, simplesmente porque conhecimento não é valorado por quantidade.

Um ativo tangível aumenta seu valor quando é acumulado e poupado e para garantir que não vamos perdê-lo, o trancamos e protegemos. Um ativo intangível aumenta seu valor quando é distribuído e usado e para garantir que não vamos perdê-lo, o expomos e deixamos compartilhar.

Você até pode colocar cifrões em dados digitais, mas saiba que esses cifrões aumentam conforme eles passam por uma cadeia de agregação de valor que está de modo resumido na figura ao lado.

Se você precificar os seus dados digitais brutos com o intuito de ficar rico, não vai encontrar interessados. Se você organizá-los e indexá-los, vai encontrar muitos interessados, mas ninguém que queira pagar para você enriquecer. Então você aplica modelos estatísticos e algoritmos para identificar padrões e correlações entre seus dados e começa a encontrar bons compradores, mas quem vai ficar rico são eles, se depois que comprarem suas informações conseguirem passar para a última fase da figura.

Como dá pra saber tudo isso? Pense por um momento na internet. Lembra que para encontrar alguma coisa na rede precisávamos do endereço completo? Lembra que as pessoas ditavam os endereços enfatizando coisas do tipo: “www” ou “educação sem cedilha e sem til” ou “Hotel Copacabana Palace tudo em minúsculo sem espaço". Que valor teria um monte de dados acumulados se só comandos muito específicos pudessem encontrá-los? Então apareceu o Google que fez um trabalho incrível indexando os dados e otimizando as buscas. Agora você pode escrever um endereço sem www, sem saber a grafia perfeita e usando maiúsculos ou minúsculos. O Google acha. Todo mundo adorou! Quanto você paga por isso? Nada. Quem paga por isso? Ninguém. E se você disser que o anunciante paga, eu lhe digo que não. O anunciante paga para vender para você. Se isso não acontecer ele deixa de pagar.

Atualmente o Google administra e controla (não possui!) uma quantidade incontável de dados que apresenta uma taxa de crescimento assustadora. Eles não podem vender os dados que administram porque não são proprietários deles. Mas eles não se importam. Se os dados tivessem valor intrínseco, já estaríamos vendo a empresa engajada numa batalha judicial pela posse deles. Mas o que vemos? O Google protegendo a “privacidade” de seus usuários. No entanto, pelo acordo que faz com seus clientes, a empresa pode usar os dados para criar novos produtos e serviços (leia-se criar algoritmos e fazer correlações entre os dados). Tudo leva a crer que os conhecimentos gerados pela análise desses dados geram renda à empresa.

Antes que pensem que estou recriminando o Google, quero afirmar que não vejo nada de errado nisso. Até onde sei, a empresa trabalha dentro da lei e de um código ético estabelecido e aceito por toda a sociedade. Além disso, acredito que todo trabalho de inteligência deve ser remunerado. Sabe-se, por exemplo, que em 2008 o Google utilizou dados de busca de seus usuários para construir um modelo preditivo que ajudou o governo americano a desenvolver um plano de ação para controlar a disseminação da gripe suína antes que ela se transformasse em pandemia. Imagino que o governo americano tenha sabido valorizar e remunerar esse trabalho.

Se você duvida que modelos preditivos feitos dessa maneira sejam confiáveis, veja o gráfico abaixo sobre casos de dengue no Brasil. A linha azul é a previsão do Google feita a partir de determinados termos consultados (por exemplo: febre, dengue, dor no corpo etc). A linha amarela representa os dados oficiais do Ministério da Saúde. Excelente modelo preditivo. Quanto vale? E tornar o modelo acionável, quanto valeria?

Portanto, precisamos resistir à tentação de colocar cifrões grandes demais nos dados. O que Humby quis dizer com a metáfora novo petróleo foi que, se no século XX a economia mundial não pôde prescindir do petróleo para crescer, no século XXI não poderemos ignorar o Big Data. Só isso. Nem de longe o modelo de negocio de um se assemelha ao do outro.

quinta-feira, 4 de abril de 2013

Big Data. Isso lhe interessa?

Em setembro de 2012 li um artigo sobre ciência das redes publicado no site Edge.org. O texto era do cientista Albert-Lazló Barabási, professor e diretor do Centro de Pesquisas em Redes Complexas da Universidade de Northeastern, em Boston.

Intitulado Thinking in network terms, o texto explicava em linhas gerais a importância dos dados digitais e o impacto que eles teriam nas ciências.

O objetivo do autor era alertar para a necessidade urgente de se discutir a questão da propriedade dos dados digitais e privacidade na rede, sob pena de perder a oportunidade de dar um grande passo na direção de compreender os sistemas onde vivemos e encontrar soluções para os problemas complexos que neles se apresentam.

Entusiasta do movimento Open Data, Barabási afirma em seu texto que os dados coletados por sites como Facebook e Google têm grande valor para a comunidade científica e que isso já justificaria uma revisão dos modelos de acordos de privacidade atuais.

Até então, tudo o que eu havia lido sobre open data era baseado em argumentos da filosofia Mertoniana que afirma que dados e informações coletados na sociedade são valores gerados coletivamente, portanto impossível de se atribuir propriedade.

Barabási colocou open data em outros termos, e minimizou a polêmica questão da privacidade de modo muito simples, mostrando em retrospectiva a evolução das redes sociais.

O MySpace, primeiro site popular desse tipo, era completmente anônimo e privado. Poucas pessoas compartilhavam suas informações e quando faziam era para um grupo seleto de familiares e amigos muito próximos. Era como aquele mural de cortiça antigo na parede do quarto onde quase ninguém tinha acesso. O Facebook tirou o anonimato do modelo. Os usuários se cadastram com seus nomes e outras informações reais. Existem ferramentas de restrição de acesso ao conteúdo, mais isso vira quase uma lenda porque, sabendo que as redes sociais são altamente interconectadas, é impossível garantir que uma determinada informação postada nunca será acessada por um usuário indesejado. E então surge o Twitter, onde tudo que é postado é compartilhado por toda a rede indiscriminadamente.

Os usuários da internet estão evoluindo para um modo menos privado de vida. Não seria absurdo afirmar que a humanidade está evoluindo para um modo menos privado de vida. Na internet postamos fotos, publicamos nossas inclinações religiosas, sexuais e políticas, damos nossa opinião sobre fatos relevantes e polêmicos e fazemos checkin nos lugares que frequentamos. No mundo não virtual, aceitamos ser filmados por câmeras de seguranças ou de TVs e ser rastreados por GPS de seguradoras de automóveis.

Mas isso não quer dizer que a questão da privacidade na rede não será a celeuma que todos imaginam. Digo isso porque as informações que colocamos voluntáriamente na internet são apenas a ponta do iceberg Big Data. O valor do Big Data está no que ainda é desconhecido da maioria. A celeuma provavelmente acontecerá porque a minoria que já enxergou esse valor não abrirá mão do controle sobre esses dados. Pelo menos não facilmente. Com certeza o respeito à privacidade será alegado, mas os motivos verdadeiros para justificar mecanismos restritivos de compartilhamento serão econômicos afinal, não é difícil imaginar que dados digitais tenha valor para além da comunidade científica.

Em 2006, Clive Humby usou a metáfora "novo petróleo" para se referir a dados digitais. Para ele, os dados digitais são para o século XXI o que o petróleo foi para o século XX.

A privacidade na rede foi a porta de entrada para o meu interesse em Big Data. Mas claro que seria inevitável esbarrar em diversas outras questões relevantes como, ética na utilização de modelos preditivos, lei de patentes, segurança da rede, armazenagem, governança de dados, riscos de uma economia dataficada, empoderamento individual, novos modelos de negócio, novas competências etc.

A proposta desse blog é trocar conhecimento sobre esse assunto tão emergente e tão impactante, para o qual não podemos mais fechar os olhos.

Francis Maude, chefe de gabinete do governo britânico, afirmou recentemente que discutir a livre utilização de dados na internet é desconfortável e estranho, principalmente para os governos, mas chegamos num ponto de onde não é mais possível voltar.

Se o assunto lhe interessa sob qualquer perspectiva, inclusive contrária às coisas que serão publicadas aqui, eu quero muito saber o que você pensa.

Todo conteúdo desse blog é livre para utilização e compartilhamento, desde que seja citada a fonte, como orienta a ética do open knowledge.