Wikipédia vaut 7 milliards de USDollars

vendredi, 17 octobre 2008

Wikipédia vaut 7 milliards de USDollars

7 milliards? Tout ça pour un projet encyclopédique?

Haaaaaaaaaa mais attendez ! On est en dollars US, en fait ça ne fait que 5 208 208 845,75 Euros (ce chiffre est basé sur une conversion faites le vendredi 17 vers 09h30). Broutilles!

Qui donc a évalué Wikipédia à 7 milliards de US Dollars? La réponse est assez surprenante puisqu’il s’agit d’un journal appelé le Silicon Alley Insider. SAI semble être un média internet dédié aux nouvelles technologies et qui fonctionne grâce à un mélange de journalisme « classique » et de journalisme collaboratif.

Un journal qui fait une étude sur la valeur de marques ou d’entreprises…  j’ai commencé à avoir des doutes sur la qualité des résultats; mais la lecture de l’article annonçant cette évaluation réserve une bonne surprise. On y trouve un lien vers la méthodologie utilisée pour réaliser l’étude. Ce lien est, je trouve, une preuve, sinon de sérieux, de transparence.

Et la transparence, chez {{refnec}}, on aime.


Il vaut mieux avoir une méthode mauvaise plutôt que n’en avoir aucune.

La méthodologie est disponible sur cette page et elle semble avoir été réalisée pour des entreprises, ou organisations. Vu que Wikipédia est une marque, je me pense qu’ils ont fait la même erreur que des dizaines de journalistes et qu’ils voulaient dire Wikimedia Foundation. Pour la suite j’utiliserai donc Wikimedia Foundation en lieu et place de Wikipédia.

Rank Company Valuation
1. Facebook $9 billion
2. Wikipedia $7 billion
3. Craigslist $5 billion
4. Betfair $5 billion
5. Mozilla Corp $4 billion
6. Yandex $3 billion
7. Webkinz $2 billion
8. LinkedIn $1.3 billion
9. Habbo $1.25 billion
10. Oanda $1.2 billion

Un petit disclaimer ne fait pas de mal. Certains termes sont des traductions de ceux utilisés par le journal et ne sont pas corrects. Il n’est pas utile de faire un commentaire du genre « Hey, hey la performance financière ce n’est pas ça ».

  • Premier critère: la valeur proposée pour le rachat de tout ou partie de l’organisation. Personne n’ayant jamais fait de proposition d’achat de Wikimedia Foundation, ce qui me semble compliqué vu que c’est une fondation à but non lucratif, ce critère n’est pas utilisable.
  • Deuxième critère: la performance financière. Sur celui-là par contre,  Wikimedia Foundation doit marquer un paquet de points. La majorité du travail étant réalisée par des bénévoles les charges s’en voient très limitées ce qui augmente donc la performance financière. La création de contenus augmentate le nombre d’utilisateur du site et augmente donc le nombre de donateur potentiel. La création de contenus augmente donc la valeur du site, mais permet également, in fine, d’améliorer les finances de la fondation.  Les dizaines de bénévoles qui s’occupent des serveurs, qui améliorent le logiciel, qui répondent à la presse ou aux centaines de mails quotidiens sont autant de personnes à ne pas rémunérer.
  • Troisième critère: la part de marché détenue par Wikimedia Foundation. Deuxième critère qui a dû être très favorabe. Partons du principe que le marché, ici, est « la diffusion de la connaissance via Internet ». Qui d’autre connaissez vous qui soit sur ce crédo? Citizendium? Knols? Britannica? Certes. Mais aucun d’eux n’a la portée mondiale que Wikimedia Foundation a grâce à la déclinaison de ses projets dans plusieurs dizaines de langues. La portée donc des projets et mondiale, alors que les projets cités précédemment ne sont souvent qu’en une ou deux langues. Ajoutons à cela, les chiffres d’Alexa qui classent Wikipedia dans les 10 premiers sites les plus consulté au monde et ce depuis presque deux ans.
  • Quatrième critère: le taux de croissance. Ce critère est particulier puisqu’il est utilisé pour départager les sites qui auraient eu des résultats équivalents pour les autres critères. Je n’ai pas de chiffres en tête, mais vu les rapports d’audit de Wikimedia Foundation, le taux de croissance doit être relativement élevé. Mais bon, je ne suis même pas sûr que ce critère ait été utilisé pour Wikimedia Foundation vu sa position dans le classement.

Je ne pense pas que cette étude puisse être pris au pied de la lettre, et donc dire que la marque vaut 7 milliards de dollars US. Par contre, elle me semble intéressante dans son classement.

Enfin tout ça me permettra d’ajouter sur mon CV, éditeur du site qui vaut 7 milliards de dollars.

Ou pas.


Le vandalisme : des études sérieuses plutôt que du pifomètre !

dimanche, 6 juillet 2008

Le vandalisme sur Wikipédia est un grand fantasme, soit que certains (généralement des wikipédiens) le déclarent quasi sans effet, soit que des critiques (souvent ayant à peine pris le temps de vérifier) affirment qu’il est ingérable. Le vandalisme, et plus généralement ce que j’appelerais les « modifications non souhaitées », est à chaque fois au coeur des discussions sur la qualité des articles de Wikipédia.

Malheureusement, quand le grand public est informé de la qualité de Wikipédia, les médias s’appuient trop souvent sur des « études » dont la qualité laisse pour le moins à désirer. Cela va de médiocre, par exemple l’étude des étudiants de Pierre Assouline, essentiellement effectuée au pifomètre et à charge, à carrément risible, par exemple quand Paris Match demande à Didier Decoin (membre éminent de l’académie Goncourt) de juger en 1 minute de la qualité de l’article sur… les sous-marins nucléaires lanceurs d’engins (cf. le numéro du 19 juin 2008).

C’est d’autant plus dommage qu’il existe des études rigoureuses, menées par des scientifiques, sur la base d’études statistiques. Bref, qui essayent d’être plus objectif que le doigt mouillé, mais qui ont l’horrible particularité de parler en chiffres, et non en exemples. Des trucs sérieux, quoi. Pouah, comme dirait Alithia.

Entre ces deux extrêmes, plusieurs études généralistes (citons celle de Nature, la plus connue, pour faire court) semblent démontrer que la qualité de certains articles de Wikipédia peut être équivalente à celle des encyclopédies classiques. Il est donc possible d’atteindre des entrées encyclopédiques de qualité en utilisant le processus de création de contenu de Wikipédia.

Je parlerais par la suite de modifications non souhaitées, définies comme des éditions violant une ou plusieurs règles éditoriales, délibérément (ce qui est qualifié alors de vandalisme) ou non.

Dans l’excellente étude de Priedhorsky et de ses collègues (de l’université du Minnesota), dont je vais ici extraire quelques informations, les dommages entraînés peuvent être classés en 6 catégories : désinformation, suppression massive, suppression partielle, contenu offensant, spam ou non-sens. Cet ensemble de dommages reste présent quel que soit l’état des articles.

Environ 5% des modifications de la Wikipédia anglophone peuvent être considérées comme du vandalisme, sur une durée d’environ 4 ans, cela représente plus de 2 millions de modifications problématiques sur environ 57 millions de modifications acceptables. La version francophone, quant à elle, dispose à l’heure actuelle d’environ 613 000 articles, avec une moyenne de 30 modifications par article (statistiques Wikimedia Foundation, janvier 2008). Étant donné que plus de 717 000 modifications y sont effectuées par mois, on peut extrapoler le nombre de vandalismes à détecter à environ 36 000 par mois, soit plus d’un millier par jour.

Bien que, sur la Wikipédia anglophone, 42% des dommages soient réparés avant même d’être vus, que quasiment tous sont supprimés après 15 révisions et que la probabilité de lire un article endommagé soit de 0.0037, ces chercheurs ont pu constater que seuls 60% des vandalismes sont détectés facilement par des humains et que 11% persistent après avoir été vus 100 fois.

Prenez le temps de méditer ces chiffres, qui ont le mérite d’être tout à fait pertinents vis à vis de l’utilisation de wikipédia. Wikipédia, c’est énorme, ÉNORME : des millions d’articles, c’est un Web dans le Web. Il y existe des articles qui ne sont pratiquement jamais consultés, alors que d’autres le sont énormément {{référence nécessaire}}. Partant, des statistiques globales seraient peu pertinentes, puisqu’elle mettraient dans le même panier des choses qui n’ont rien à voir. L’étude de Priedhorsky a donc l’intelligence de raisonner en terme de visites.

Le résultat est intéressant : vous avez environ quatre chances sur mille de lire un vandalisme, que vous reconnaîtrez aisément dans 60% des cas. En arrondissant largement pour fixer les idées, vous avez environ 2 chances sur 1000 de lire un vandalisme sans vous en rendre compte.

Je ne doute pas que les défenseurs de Wikipédia y verront l’éclatante démonstration de la validité du modèle de rédaction du projet, alors que ses détracteurs seront convaincus que cette proportion est intolérable. La vérité renforce souvent les deux parties dans leurs idées. Ou pas. Et inversement.

J’aimerais avoir des statistiques similaires sur d’autres médias, ça serait intéressant.

Les bonnes références :