Où trouver des données ?

Dans un article de son blog, Bret Taylor explique que : « nous avons besoin d’une Wikipédia pour les données ». Article intéressant, qui tente de montrer l’intérêt qu’aurait tout le monde à avoir des données « ouvertes ». On part ici du postulat qu’il n’y a plus à démontrer l’intérêt que nous avons à avoir une connaissance synthétique ouverte, avec Wikipédia.

Sarah Perez en profite pour faire un petit tour d’horizon des différents sites mettant à disposition des données, dans un article intitulé : « où trouver des données ouvertes sur le web ? ».

Voici un petit tour dans le monde merveilleux des bases de données ouvertes utilisables pour écrire des articles encyclopédiques…

CKAN (Comprehensive Knowledge Archive Network)

Le CKAN (qu’on pourrait traduire par « réseau global d’archivage de connaissance », en étant audacieux) recense un peu tout ce qui est archivable : des pièces de Shakespeare, une base de donnée sur la densité de population mondiale, 30 ans de brevets américains, etc.

Infochimps.org

Un almanach géant, qui tente de relier des dépots de données brutes. Il reprend ainsi les infoboxes de Wikipédia, 50 ans de données météo, heures par heures, les résultats de recensement aux USA, une série de mots-croisées…

OpenStreetMap

Une carte du monde où toutes les données sont libres d’être modifiées, précisées, distribuées (sous licence « Creative Commons, attribution, partage à l’identique »). Une sorte de wiki uniquement centré sur des données purement géographiques.

MusicBrainz

Une base de méta-données autour de la musique (noms de groupes, titres de chansons, etc.). La base est notamment utilisable et alimentable via des plugins pour des logiciels de lecture de musiques. Les données sont diffusées en domaine public ou sous la licence « Creative Commons, attribution, non-commercial ».

DBpedia

Une base de donnée structurée extraite de Wikipédia. Attention, utiliser Wikipédia pour écrire des articles dans Wikipédia peut être récursivement problématique.

Freebase

Une base de données libres (CC-BY, principalement, mais aussi GFDL), avec une assez grande communauté, qui récolte ses informations sur d’autres sites et les structures. Plutôt bien fait de l’avis des internautes.

Numbrary

Une base de données pour tout ce qui est valeurs quantitatives.

UN Data

Un site présentant les bases de données issues de la division statistiques et du département des affaires économiques et sociales des nations unies. Des chiffres sur la population, l’industrie, l’énergie, le commerce, etc.

Swivel

Une site qui présente des synthèses autour de différents jeux de données, des graphiques exploitables et des croisements intéresantes.

Data 360

Un site similaire.

Linking open data

Le meilleur pour la fin, un site qui cherche à relier tout ce qui se fait de sources ouvertes (et libres) sur le web, avec une utilisation massive de RDF. Du grand art.

Publicités

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :