Non, vous ne connaîtrez pas les noms des auteurs de Wikipédia

vendredi, 13 février 2009

Depuis peu, un emballement blogosphérique fait courir le bruit que le site WikiDashboard va vous permettre de connaître (sous-entendu « enfin ») le nom des auteurs de Wikipédia.

Malheureusement, non, vous ne connaîtrez pas l’identité des contributeurs, par contre, vous pouvez vous désabonner des sites vous donnant cette fausse information, car ils n’ont visiblement même pas pris la peine de consulter la page de description du site dont ils parlent.

WikiDashboard propose de présenter différemment l’information déjà contenue dans l’historique de chaque article, ni plus, ni moins. Ainsi, vous pourrez y voire une boite listant les auteurs principaux de chaque article, avec un pourcentage des éditions, à coté d’un graphique montrant les éditions sur une frise chronologique (voir cet exemple). Toutes ces informations sont déjà présentes dans l’onglet « historique » de chaque page du wiki, WikiDashboard permet simplement de les synthétiser.


Où trouver des données ?

vendredi, 4 juillet 2008

Dans un article de son blog, Bret Taylor explique que : « nous avons besoin d’une Wikipédia pour les données ». Article intéressant, qui tente de montrer l’intérêt qu’aurait tout le monde à avoir des données « ouvertes ». On part ici du postulat qu’il n’y a plus à démontrer l’intérêt que nous avons à avoir une connaissance synthétique ouverte, avec Wikipédia.

Sarah Perez en profite pour faire un petit tour d’horizon des différents sites mettant à disposition des données, dans un article intitulé : « où trouver des données ouvertes sur le web ? ».

Voici un petit tour dans le monde merveilleux des bases de données ouvertes utilisables pour écrire des articles encyclopédiques…

CKAN (Comprehensive Knowledge Archive Network)

Le CKAN (qu’on pourrait traduire par « réseau global d’archivage de connaissance », en étant audacieux) recense un peu tout ce qui est archivable : des pièces de Shakespeare, une base de donnée sur la densité de population mondiale, 30 ans de brevets américains, etc.

Infochimps.org

Un almanach géant, qui tente de relier des dépots de données brutes. Il reprend ainsi les infoboxes de Wikipédia, 50 ans de données météo, heures par heures, les résultats de recensement aux USA, une série de mots-croisées…

OpenStreetMap

Une carte du monde où toutes les données sont libres d’être modifiées, précisées, distribuées (sous licence « Creative Commons, attribution, partage à l’identique »). Une sorte de wiki uniquement centré sur des données purement géographiques.

MusicBrainz

Une base de méta-données autour de la musique (noms de groupes, titres de chansons, etc.). La base est notamment utilisable et alimentable via des plugins pour des logiciels de lecture de musiques. Les données sont diffusées en domaine public ou sous la licence « Creative Commons, attribution, non-commercial ».

DBpedia

Une base de donnée structurée extraite de Wikipédia. Attention, utiliser Wikipédia pour écrire des articles dans Wikipédia peut être récursivement problématique.

Freebase

Une base de données libres (CC-BY, principalement, mais aussi GFDL), avec une assez grande communauté, qui récolte ses informations sur d’autres sites et les structures. Plutôt bien fait de l’avis des internautes.

Numbrary

Une base de données pour tout ce qui est valeurs quantitatives.

UN Data

Un site présentant les bases de données issues de la division statistiques et du département des affaires économiques et sociales des nations unies. Des chiffres sur la population, l’industrie, l’énergie, le commerce, etc.

Swivel

Une site qui présente des synthèses autour de différents jeux de données, des graphiques exploitables et des croisements intéresantes.

Data 360

Un site similaire.

Linking open data

Le meilleur pour la fin, un site qui cherche à relier tout ce qui se fait de sources ouvertes (et libres) sur le web, avec une utilisation massive de RDF. Du grand art.