quinta-feira, 9 de maio de 2013

Open data não é bandeira


Open data não é bandeira.

No final da década de 80, uso intensivo dos computadores gerou uma preocupação muito natural entre os filósofos: que impacto isso teria no conhecimento? 

O filósofo francês Jean-François Lyotard, por exemplo, afirmou que o conhecimento seria armazenado em bancos de dados, permitindo seu deslocamento, concentração e comercialização, o que ele chamou de mercantilização do conhecimento.

Lyotard percebeu muito bem que informações digitalizadas viajam facilmente e fez um prognóstico: a mobilidade dos dados digitais resultaria num movimento de concentração do conhecimento.

Por causa de temores como esse muita gente aderiu ao movimento Open Data por idealismo, fazendo o conceito parecer rebelde, quase subversivo, mas tão bem intencionado que justifica inclusive a ação de hackers. De tudo o que tenho lido sobre o assunto, posso afirmar que open data é muito mais um caminho natural do que uma bandeira.

De 80 para cá, dados e informações digitais têm aumentado em progressão geométrica e a internet ampliou consideravelmente as possibilidade de deslocamento das informações.

Se todas as condições existentes na época de Lyotard continuam existindo e até se potencializaram, por que a sua previsão (concentração e mercantilização do conhecimento) não se concretiza?

O primeiro motivo é simples e independe de contexto. Conhecimento é o ato de atribuir ideia ou noção às informações. Ou seja, é um ato humano e contextualizado. Experiência única, baseada em outras experiências únicas que não podem ser armazenadas. Por mais detalhada que seja a descrição de um determinado conhecimento, ela será sempre, no máximo, um conjunto de informações.

Como tenho que admitir que pode ter havido um erro de interpretação ou de tradução das palavras de Lyotard, passemos para o motivo mais importante.

O deslocamento das informações digitais, não obedeceu ao movimento concentrador previsto. Ao contrário, a internet propiciou, além de facilidade e rapidez, uma desconcentração da informação que, guardadas as proporções, só tem precedente com a invenção da prensa no século XV.

Juntando tudo isso, temos um contexto extremamente inóspito para concentração de conhecimento:

informações digitais viajam facilmente + internet espalha informação (e não concentra) + conhecimento é gerado atribuindo ideias a dados e informações (e não os possuindo)

Por que toda facilidade que a internet propicia na mobilidade das informações favorece a desconcentração da informação e não a concentração? Existem mecanismos restritivos altamente confiáveis para negar acesso às informações na rede, o que favorece a concentração. Por que eles não são sempre utilizados?

Porque, se o conhecimento é gerado a partir de dados, então quanto maior a quantidade, diversidade e veracidade dos dados existentes, maiores as chances de inovação. Como é impossível que um único agente de pesquisa gere sozinho uma base de dados com essa qualidade, a noção da necessidade dos dados not invented here torna-se óbvia. 

Isso não é novidade da era digital muito menos da era Big Data.  A comunidade científica sempre trabalhou no modelo de compartilhamento de dados porque gerar conhecimento a partir de dados é o core das suas instituições. Todo o foco é na busca de soluções, então todo o processo se ajustou para esse fim.

Além disso, todo cientista sabe que a capacidade de atribuir ideias aos dados é humana e contextualizada (por isso não tem medo de perder poder compartilhando) e que todo conhecimento é gerado em cima de uma base de conhecimento anterior (então, não importa de onde vem, quanto maior a base existente, melhor).

Se você pensava que o movimento Open Data é recente vai se surpreender ao saber que o conceito já fazia parte das normas Mertonianas da ciência moderna definidas em 1942 e foi utilizado formalmente pela primeira vez na década de 50, num projeto internacional sobre geofísica. 

Por extensão do raciocínio, não é difícil entender que foi na esfera cientifica que surgiram os primeiros insights sobre Big Data. Com uma visão open a visão do Big Data é mais intuitiva e possível.

Nesse modelo a inovação se descentraliza, transcendendo limites geográficos e de expertise. Já é possível visualizar uma queda das barreiras que asseguravam a primazia de certos países em algum campo específico do conhecimento e também a perda de exclusividade de algumas profissões em suas respectivas áreas de atuação.

Exemplos disso são as soluções extremamente inovadoras em serviços bancários em países da África e a recente premiação como cidade mais inovadora, concedida à Medelín na Colômbia pelas soluções efetivas para os problemas de mobilidade urbana (2 fotos ao lado). É importante notar que esses países nunca foram referencia de conhecimento nos serviços citados.

Na extrapolação das competências profissionais, uma visita ao site da organização XPrize mostrará pessoas atuando bem longe das suas competências profissionais, ajudando a resolver problemas crônicos de saúde, alimentação, poluição, educação, energia entre outros.


Podemos citar ainda o movimento Citizen Science. Plataformas na internet compartilham dados da comunidade cientifica com o cidadão comum de qualquer formação, visando uma maior geração de conhecimento. A ideia é que quanto mais gente olhando os dados, e quanto mais diferentes forem esses olhares, maiores as chances de visualização de padrões e correlações. Se você quiser saber mais sobre isso, visite Citizen Science (que estudou o fenômeno crowdsourcing na ciência), Cell Slider (que busca a cura do câncer) e Zooniverse (que agrupa diversas iniciativas do tipo).

Todos os exemplos citados são de organizações sem fins lucrativos (pesquisa, ONGs e governos). 

Como as empresas com fins lucrativos estão se posicionando? 

Em sua maioria, grandes empresas têm aderido parcialmente à ideia do Big Data, utilizando apenas a grande quantidade de dados transacionais que possuem. Aos poucos estão descobrindo que perdem muito em qualidade preditiva se não adicionam dados externos.

Apesar de existirem algumas iniciativas nesse sentido, o que ainda está totalmente fora de cogitação é o compartilhamento de dados próprios, os chamados dados transacionais clássicos. É pouco provável que fornecedores, compradores e concorrentes queiram compartilhar livremente esses dados.

Claro que o capital ambiental de uma empresa competitiva é bem diferente do de instituições sem fins lucrativos, no entanto, partindo do princípio de que conhecimento e inovação ocorrem por atribuição de ideias e não por algoritmos, talvez um business open data não seja tão desastroso assim.

Mas se você quer fazer as contas, veja isso: dados transacionais restritos provocam assimetria de informação que explica boa parte de um dos custos mais curiosos e intrigantes da Teoria das Agencias: o custo de transação. 

Como esse texto já está bem grande, deixemos as contas pra semana que vem.

2 comentários:

  1. É muito raro (na verdade não me lembro de ter lido isto alguma vez) alguém conseguir mostrar com tanta clareza porque o conhecimento precisa de ar fresco e liberdade para se desenvolver. Um ambiente fechado tira o oxigênio que ele precisa para crescer... E a internet só fez potencializar a criação deste ambiente mais aberto! Muito bom e já estou curioso para ler a continuidade...

    ResponderExcluir
  2. Penso que temos ainda muito ruído com esse conceito de "open data", pois daí só constroi música a mente privilegiada.
    A mente que conseguiu romper as barreiras de linguagem, que conhece as fundo os algorítmos relevantes nesses cenários e que possue a capacidade de reconstrução do significado da informação assente nos dados.
    Só mentes privilegiadas construirão novos significados partindo das dissimuladas pistas soterradas nos dados que a maioria chama de informação.
    Como diria um amigo meu, ..open data para quem, cara pálida?

    ResponderExcluir