Notas sobre open data

A propósito do post data.gov, dados e portugal.

“The purpose of Data.gov is to increase public access to high value, machine readable datasets generated by the Executive Branch of the Federal Government.”

Esta questão da disponibilização online de dados que pela sua natureza são públicos interessa-me bastante até porque está bastante ligada com a necessidade de termos ferramentas que facilitem o escrutínio das opções que são tomadas pelos decisores públicos.
Há várias questões aqui que poderiam ser interessantes abordar:

  • que dados é que são / devem ser públicos
  • que questões de privacidade se podem levantar
  • como é que esses dados devem ser disponibilizados de forma a se poderem facilmente transformar em informação… os ficheiros de excel ou csv que muitas vezes estão online são de dificil tratamento
  • para que é que queremos ter esses dados públicos? aumentar a transparência e escrutínio das instituições; dados como infraestrutura para quem queira criar produtos que assentam na exploração desses dados (mashups e afins)
  • exemplos noutros países de mashups com exploração de dados publicos http://stamen.com/clients/cabspotting; http://oakland.crimespotting.org/
  • que exemplos já temos em portugal (ine, banco de portugal), como comparam por exemplo com o data.gov
  • e eventualmente sugerir ideias como os organismos publicos podem utilizar as ferramentas da web2.0 para atingir estes objectivos de abertura e transparência

Na minha opinião e tendo em conta só aquilo que conheço (e que naturalmente pode ser insuficiente) diria que Portugal está bastante avançado na disponibilização de alguma informação no que diz respeito aos indicadores macro, mas quando passamos para coisas mais finas como por exemplo saber que licenças de construção foram atribuídas num determinado concelho numa data especifica então aí nem com screen scrapping chegamos lá.

Como pessoa que gosta de explorar como os dados se podem transformar em visualizações apelativas e informativas fazem-me falta ainda alguns dados (que são normalmente actos públicos e que por isso acho que deveriam estar online) e, principalmente, que esses dados sejam passiveis de tratamento automático sistematizável.

Ver outras ideias sobre este tema em: “Publicidade de Informação

Junte-se à conversa

2 comentários

  1. >>1. A quem interessa essa informação disponibilizada?
    acho que isso não é assim tão importante porque na verdade quase nunca conseguimos antecipar os usos verdadeiramente inovadores e interessantes que podem aparecer quando algo de novo é disponibilizado ao mundo. por exemplo quem é que imaginava que pelo simples facto de se ter criado uma coisa tão geeky como o protocolo http hoje teríamos esta realidade quase ubiqua que é o mundo online

    >>2. Como evitar que informação relevante seja apresentada e não possa ser escondida?
    toda a informação relevante tem que ser apresentada a alguém porque senão não é informação, é uma amontoado de dados que na verdade não serve para nada.
    a questão que se levanta com a informação em formato digital é que ela dá visibilidade a problemas que já existiam.
    problemas de privacidade ou de acesso à informação sempre existiram mas normalmente eram resolvidos pela simples razão de que essa informação estaria numa estante não identificada numa sala de um edifício que quase ninguém sabia que existia ou onde ficava… mas bastava ter essa informação indirecta (onde estavam as coisas) e conseguíamos chegar à informação.
    é mais ou menos parecido com o conceito “security by obscurity” http://en.wikipedia.org/wiki/Security_through_obscurity ou seja a segurança que implementas não é propriamente intrínseca ao processo mas antes é obtida pela dificuldade em conseguir saber sequer o que existe.

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *