Open data não é bandeira.
No final da década de 80, uso intensivo dos computadores gerou uma
preocupação muito natural entre os filósofos: que impacto isso teria no
conhecimento?
O filósofo francês Jean-François Lyotard, por exemplo, afirmou que o
conhecimento seria armazenado em bancos de dados, permitindo seu deslocamento,
concentração e comercialização, o que ele chamou de mercantilização do
conhecimento.
Lyotard percebeu muito bem que informações digitalizadas viajam facilmente
e fez um prognóstico: a mobilidade dos dados digitais resultaria num
movimento de concentração do conhecimento.
Por causa de temores como esse muita gente aderiu ao movimento Open Data por idealismo, fazendo o conceito parecer rebelde, quase subversivo, mas tão bem intencionado que justifica inclusive a ação de hackers. De tudo o que tenho lido sobre o assunto, posso afirmar que open data é muito mais um caminho natural do que uma bandeira.
De 80 para cá, dados e informações digitais têm
aumentado em progressão geométrica e a internet ampliou
consideravelmente as possibilidade de deslocamento das informações.
Se todas as condições existentes na época de Lyotard continuam existindo
e até se potencializaram, por que a sua previsão (concentração e mercantilização
do conhecimento) não se concretiza?
O
primeiro motivo é simples e independe de contexto. Conhecimento é o ato de
atribuir ideia ou noção às informações. Ou seja, é um ato humano e
contextualizado. Experiência única, baseada em outras experiências únicas que
não podem ser armazenadas. Por mais detalhada que seja a descrição de um
determinado conhecimento, ela será sempre, no máximo, um conjunto de
informações.
Como
tenho que admitir que pode ter havido um erro de interpretação ou de tradução
das palavras de Lyotard, passemos para o motivo mais importante.
O
deslocamento das informações digitais, não obedeceu ao movimento concentrador previsto. Ao
contrário, a internet propiciou, além de facilidade e rapidez, uma desconcentração
da informação que, guardadas as proporções, só tem precedente com a invenção da
prensa no século XV.
Juntando
tudo isso, temos um contexto extremamente inóspito para concentração de
conhecimento:
informações
digitais viajam facilmente + internet espalha informação
(e não concentra) + conhecimento é gerado atribuindo ideias a dados e
informações (e não os possuindo)
Por que toda facilidade que a internet propicia
na mobilidade das informações favorece a desconcentração da informação e não a
concentração? Existem mecanismos restritivos altamente confiáveis para negar
acesso às informações na rede, o que favorece a
concentração. Por que eles não são sempre utilizados?
Porque, se o conhecimento é gerado a partir de dados, então quanto maior a quantidade, diversidade e veracidade dos
dados existentes, maiores as chances de inovação. Como é impossível que um
único agente de pesquisa gere sozinho uma base de dados com essa qualidade, a
noção da necessidade dos dados not invented here torna-se
óbvia.
Isso não
é novidade da era digital muito menos da era Big Data. A comunidade
científica sempre trabalhou no modelo de compartilhamento de dados
porque gerar conhecimento a partir de dados é o core das suas
instituições. Todo o foco é na busca de soluções, então todo o processo se
ajustou para esse fim.
Além
disso, todo cientista sabe que a capacidade de atribuir ideias aos dados é
humana e contextualizada (por isso não tem medo de perder poder compartilhando)
e que todo conhecimento é gerado em cima de uma base de conhecimento
anterior (então, não importa de onde vem, quanto maior a base existente,
melhor).
Se você pensava que o movimento Open Data é recente vai se surpreender ao saber que o conceito já fazia parte das normas Mertonianas da ciência moderna definidas em 1942 e foi utilizado formalmente pela primeira vez na década de 50, num projeto internacional sobre geofísica.
Por
extensão do raciocínio, não é difícil entender que foi na esfera cientifica que
surgiram os primeiros insights sobre Big Data. Com uma visão open a visão do Big Data é mais intuitiva e possível.
Nesse modelo a inovação se descentraliza, transcendendo limites geográficos e de expertise. Já é possível visualizar uma queda das barreiras que asseguravam a primazia de certos países em algum campo específico do conhecimento e também a perda de exclusividade de algumas profissões em suas respectivas áreas de atuação.
Exemplos disso são as soluções extremamente inovadoras em serviços
bancários em países da África e a recente premiação como cidade mais inovadora,
concedida à Medelín na Colômbia pelas soluções efetivas para os problemas de
mobilidade urbana (2 fotos ao lado). É importante notar que esses países nunca foram referencia
de conhecimento nos serviços citados.
Na extrapolação das competências profissionais, uma visita ao site da organização XPrize mostrará pessoas atuando bem longe das suas competências profissionais, ajudando a resolver problemas crônicos de saúde, alimentação, poluição, educação, energia entre outros.
Podemos citar ainda o movimento Citizen Science. Plataformas na internet
compartilham dados da comunidade cientifica com o cidadão comum de qualquer
formação, visando uma maior geração de conhecimento. A ideia é que quanto mais
gente olhando os dados, e quanto mais diferentes forem esses olhares, maiores
as chances de visualização de padrões e correlações. Se você quiser saber mais
sobre isso, visite Citizen Science (que estudou o fenômeno
crowdsourcing na ciência), Cell Slider (que busca
a cura do câncer) e Zooniverse (que agrupa diversas iniciativas
do tipo).
Todos os exemplos citados são de
organizações sem fins lucrativos (pesquisa, ONGs e governos).
Como as empresas com fins lucrativos estão se posicionando?
Em sua
maioria, grandes empresas têm aderido parcialmente à ideia do Big Data,
utilizando apenas a grande quantidade de dados transacionais que possuem. Aos
poucos estão descobrindo que perdem muito em qualidade preditiva se não
adicionam dados externos.
Apesar de existirem algumas iniciativas nesse sentido, o que ainda está totalmente fora de cogitação é o compartilhamento de
dados próprios, os chamados dados transacionais clássicos. É pouco provável que fornecedores, compradores e
concorrentes queiram compartilhar livremente esses dados.
Claro que o capital ambiental de uma empresa competitiva é bem diferente
do de instituições sem fins lucrativos, no entanto, partindo do princípio de
que conhecimento e inovação ocorrem por atribuição de ideias e não por
algoritmos, talvez um business open data não seja tão
desastroso assim.
Mas se você quer fazer as contas, veja isso: dados transacionais restritos
provocam assimetria de informação que explica boa parte de um dos custos mais
curiosos e intrigantes da Teoria das Agencias: o custo de transação.
Como esse texto já está bem grande, deixemos as contas pra semana que
vem.
É muito raro (na verdade não me lembro de ter lido isto alguma vez) alguém conseguir mostrar com tanta clareza porque o conhecimento precisa de ar fresco e liberdade para se desenvolver. Um ambiente fechado tira o oxigênio que ele precisa para crescer... E a internet só fez potencializar a criação deste ambiente mais aberto! Muito bom e já estou curioso para ler a continuidade...
ResponderExcluirPenso que temos ainda muito ruído com esse conceito de "open data", pois daí só constroi música a mente privilegiada.
ResponderExcluirA mente que conseguiu romper as barreiras de linguagem, que conhece as fundo os algorítmos relevantes nesses cenários e que possue a capacidade de reconstrução do significado da informação assente nos dados.
Só mentes privilegiadas construirão novos significados partindo das dissimuladas pistas soterradas nos dados que a maioria chama de informação.
Como diria um amigo meu, ..open data para quem, cara pálida?