Dans un article de son blog, Bret Taylor explique que : « nous avons besoin d’une Wikipédia pour les données ». Article intéressant, qui tente de montrer l’intérêt qu’aurait tout le monde à avoir des données « ouvertes ». On part ici du postulat qu’il n’y a plus à démontrer l’intérêt que nous avons à avoir une connaissance synthétique ouverte, avec Wikipédia.
Sarah Perez en profite pour faire un petit tour d’horizon des différents sites mettant à disposition des données, dans un article intitulé : « où trouver des données ouvertes sur le web ? ».
Voici un petit tour dans le monde merveilleux des bases de données ouvertes utilisables pour écrire des articles encyclopédiques…
CKAN (Comprehensive Knowledge Archive Network)
Le CKAN (qu’on pourrait traduire par « réseau global d’archivage de connaissance », en étant audacieux) recense un peu tout ce qui est archivable : des pièces de Shakespeare, une base de donnée sur la densité de population mondiale, 30 ans de brevets américains, etc.
Un almanach géant, qui tente de relier des dépots de données brutes. Il reprend ainsi les infoboxes de Wikipédia, 50 ans de données météo, heures par heures, les résultats de recensement aux USA, une série de mots-croisées…
Une carte du monde où toutes les données sont libres d’être modifiées, précisées, distribuées (sous licence « Creative Commons, attribution, partage à l’identique »). Une sorte de wiki uniquement centré sur des données purement géographiques.
Une base de méta-données autour de la musique (noms de groupes, titres de chansons, etc.). La base est notamment utilisable et alimentable via des plugins pour des logiciels de lecture de musiques. Les données sont diffusées en domaine public ou sous la licence « Creative Commons, attribution, non-commercial ».
Une base de donnée structurée extraite de Wikipédia. Attention, utiliser Wikipédia pour écrire des articles dans Wikipédia peut être récursivement problématique.
Une base de données libres (CC-BY, principalement, mais aussi GFDL), avec une assez grande communauté, qui récolte ses informations sur d’autres sites et les structures. Plutôt bien fait de l’avis des internautes.
Une base de données pour tout ce qui est valeurs quantitatives.
Un site présentant les bases de données issues de la division statistiques et du département des affaires économiques et sociales des nations unies. Des chiffres sur la population, l’industrie, l’énergie, le commerce, etc.
Une site qui présente des synthèses autour de différents jeux de données, des graphiques exploitables et des croisements intéresantes.
Un site similaire.
Le meilleur pour la fin, un site qui cherche à relier tout ce qui se fait de sources ouvertes (et libres) sur le web, avec une utilisation massive de RDF. Du grand art.