Présents : Christophe Prieur (LIAFA), René Roussille (RNRT/ANR), Matthieu Latapy (LIAFA), Michaël Vicente (ENST), Benoi Habert (LIMSI), Martine Hurault-Plantet (LIMSI), Sébastien Bertrand (FT R&D), Christophe Aguiton (FT R&D), Nicolas Auray (ENST), Emmanuel Ruzé (CRG), Bernard Conein (UNSA/ENST), Sylvain Loiseau (LIMSI), Toufik Bennouas (LIAFA), Fabien Baille (LIAFA), Jean-Daniel Fekete (INRIA Futurs), Mohamed Bouklit (LIAFA), Pascal Pons (LIAFA), Clémence Magnien (CREA), David Monniaux (LIENS), Hélène Delaunay-Teterel (FT R&D/EHESS), Michel Gensollen (ENST), Julien Levrel (FT R&D/Univ Marne la Vallée), Dominique Cardon (FT R&D).

Prochain rendez-vous
:

Prochaine réunion plénière : 21 mars après-midi– organisation Benoit Haber- organisation Julien Levrel, Jean-Daniel Fekete


Mise en place d’un atelier Gouvernance des communautés en ligne

- organisation Nicolas Auray, Dominique Cardon

Point administratif (avec René Roussille) :
C’est l’OSEO-ANVAR qui s'occupe de la partie financière. Chaque partenaire a reçu la notification de l'ANVAR (penser à renvoyer à Dominique les fiches remplies pour fiche de capitalisation du projet)
- Calendrier de financement : 30% à la signature - 50% après 12 mois
- Rapport d’avancement correct à la mi-projet vers le RNRT sans doute (incertitude, dépend de l’évolution de l’ANR).
- Rédaction du consortium entre les partenaires

-se donner 6 mois.
- pour le montage du consortium. Liste de travail : Christophe, Nicolas, Jean-Daniel, Elie, Dominique.
- Jean-Daniel propose les services d'une juriste de l'INRIA (Céline Serrano)

- Pour bien caler les recrutements pour le projet, on peut éventuellement retarder la date de départ du contrat prendre le 1 avril plutôt que le 1 mars (voir avec OSEO-ANVAR)
- Notre contact à l'OSEO-ANVAR : Anne Viré

(voir la page Projet Wikipedia, avec les slides de présentation de Julien...) 


1. Histoire :

A l’origine une start up faire un annuaire des liens sur Internet concurrencé par l’Open Directory Project. Jimmy Wales décide de créer une encyclopédie en libre… Rendre la connaissance libre. Son premier essai est Nupedia, qui ne bouleverse pas l’édition, n’étant écrite que par des rédacteurs reconnus (doctorant, diplômés,…) et piloté par un comité d’experts; certes, Nupedia était déjà un projet bénévole (sauf quelques salariés embauchés par le projet). Le basculement vers Wikipedia réside dans l’ouverture à une organisation décentralisée, sur la base des possibilités offertes par le wiki utilisé pour le brouillon de Nupedia, pour la validation des papiers par les experts. Ce basculement répondait à un échec : Nupédia ne parvenait pas à enrôler suffisamment de personnes.

Histoire de la Version francophone de Wikipedia :

Début 2006 : 240 000 articles. 550 000 pages.

6 millions de pages modifiées depuis le 31 octobre 2001.

75 643 wikipédiens inscrits (6 276 personnes qui ont contribué au moins 10 fois depuis leur arrivée).
Remarque : aucun compte contributeur ne peut être supprimé.

Pour la loi française, une association est représentative du projet et c'est ici l'un des points de tension entre la loi et l'auto-organisation promue par Wikipedia. En responsabilisant individuellement les contributeurs, aucune structure légale ne peut "représenter" le projet, elle ne peut être que délégative (promotion, organisation d'évènements, ...) ou bien prendre la forme d'une association de contributeurs (comme il en existe pour "Les chiffres et les lettres", "Motus", ...). L'association francophone Wikimedia remplit ce dernier rôle et est affiliée à la Wikimedia Foundation, organisme à but non lucratif à qui appartient les serveurs faisant tourner les différents wikis.

Wikimedia Foundation :

The general purpose and objectives of the Foundation shall be the following: Wikimedia Foundation is dedicated to the development and maintenance of online free, open content encyclopedias, collections of quotations, textbooks and other collections of documents, information, and other informational databases in all the languages of the world that will be distributed free of charge to the public under a free documentation license such as the Free Documentation License written by the Free Software Foundation Inc. or similar licensing scheme. The goals of the foundation are to encourage the further growth and development of open content, social software -based projects and to provide the full contents of those projects to the public free of charge.

Wikimedia Foundation Bylaws

Le but de la Wikimedia foundation est de proposer des contenus libres sur des wikis. Il existe, en plus de Wikipedia, d’autres projets libres :

- Wikimedia Commons : des photos
- Wiki News : une agence de presse
- Wiki quote : base de données de citations
- Wiki sources : ouvrages dans le domaine public
- Wikilessons : ensemble de cours, notamment de cours d’informatique
- Wiktionary : dictionnaire (différent de l’encyclopédie). Wiktionary est la conséquence d’une fourche : scission suite à une controverse ayant eu lieu sur Wikipedia sur le thème une encyclopédie est-elle un dictionnaire ?

Remarque : Wikitravel par contre ne fait pas partie de la Wikimedia Foundation. Wikipedia en revanche est une marque protégée.

La Wikimedia Foundation est pilotée par un « Board of Trustees ». Il comprend 5 membres, dont 2 sont élus pas les contributeurs + Jimmy Wales.

Les serveurs de Wikipedia appartiennent à la Wikimedia Foundation. Le 7 avril 2005, un partenariat entre Yahoo! et la Wikimedia Foundation est annoncé. 23 serveurs coréens (Yahoo! Korean) sont dédicacés à la promotion et la mise en circulation des projets de la Wikimedia Foundation. On parle bien de donation, mais elle porte sûrement sur la capacité des serveurs plus que sur les serveurs eux-mêmes. En parallèle, Yahoo!, à travers son programme Content Acquisition commence à intégrer des shortcuts dans les résultats de son moteur redirigeant vers les contenus de Wikipédia francophone.

Les utilisateurs sont responsables de leurs écrits… (partout). La question des portails est assez intéressante. En analysant le fonctionnement de Wikipédia francophone, on remarque que n'importe qui peut ouvrir un "sous-projet" sur n'importe quel thème ("guitare", "yukulélé", ... alors qu'il existe déjà "musique", "instruments à corde", etc ...). Ils prennent en charge la coordination des activités sur une partie plus restreinte de Wikipedia. En ce sens, c'est une page de travail qui vise une réduction de la complexité de Wikipedia et, par observation, l'un des lieux où émerge des normalisations des articles (tableaux, modèles, "mise en forme", ... spécifiques aux besoins d'une thématique). Les portails visent l'accessibilité de l'information et non une coordination des tâches et des contributeurs. "Sous-projet" et "Portail" sont intimement liés. Il y a sélectivité lors de la création d'un "Portail". Après ça, on pourrait faire une figure de style en disant que les contributeurs sont "encore plus" responsables de leurs actes quand ils travaillent sur les "Portails".  

2. Les différents statuts de contributeurs dans Wikipedia
 

Stewards (20 au niveau international, 11 francophones, 5 que j'ai croisé sur Wikipedia francophone) : fonction : créer/modifier/supprimer le statut des utilisateurs sur tous les projets Wikimedia. Les stewards actuels ont été choisis à la suite de 3 votes (2004, 2005, 2006).

Bureaucrates (6 en France, au niveau international j'ai pas eu le temps de comptabiliser sur tous les Wikipedia) : ils donnent les droits d’administrateur sur un projet spécifique. Seuls les stewards ont des possibilités techniques sur tous les projets wikis de la fondation.

Développeurs (62 au niveau international).
- Ils se partagent en 4 groupes distincts : Root, Shell, CVS, MySQL Support
- c’est la ressource rare dans le projet Wikipedia
- ils développent principalement le moteur et font aussi la maintenance des serveurs.
- Le principal développeur est Brion Vibber. C’est le premier salarié de la Wikimedia Foundation. Il est dénommé « Chief Technical Officer ».
- possibilités de faire des dons individualisés à l’équipe de développeurs (certains ont des pages Paypal pour des dons dédiés). On fait des dons individualisés, cela signifie que ce sont des dons qui vont directement dans la poche d’un développeur ?

- Au niveau des branchements techniques, ce sont d’autres personnes qui font les branchements etc… Ce sont les seuls contributeurs qui ont une page dédiée avec leurs noms.

Administrateurs (langue: admins/contributeurs identifiés)(en: 860/1 million ; fr: 86/80000)
Chaque projet Wikipedia
 a son corps d’administrateurs. Ils ont plus de pouvoirs que les autres. Ils peuvent :
- protéger ou déprotéger temporairement les pages pendant les périodes de grosses discussions sur une page ou de buzz médiatique (blocage parce que guerre d’édition, article qui vient d’être évoqué dans les médias… et qui attire du coup beaucoup d’interventions).
- supprimer des pages (cependant, on peut toujours retrouver ces pages dans l’historique, à l’exception remarquable des photos, perdues à jamais).
- bloquer des adresses IP (bannir) ou bloquer temporairement un contributeur. Il ne peut pas en revanche nuancer en bloquant une personne sur un article en particulier.
- l’administrateur est le seul à avoir le droit de consulter les unwatched pages (note : les unwatched pages sont les pages qui ne sont pas sous surveillance : vérifier le sens).

Le Wikipedia anglophone propose une liste dynamique des administrateurs. Ils sont classés selon leur activité en 3 groupes distincts : Active / Semi-active / Inactive. Les "Inactives" ont encore le statut d'admin et sont classés selon leur date d'inactivité.

Méthodes de travail des administrateurs :

- Canal de discussion : sur le projet Wikipedia anglophone, les administrateurs ont un canal de discussion IRC fermé. Ils l’utilisent exclusivement pour traiter certains pbs sans exposer des détails sordides en public (types de pbs : un type qui a la photo de son gamin atteint par une grave maladie, attaques pour diffamation, etc…). En revanche il n’y a pas de canal IRC fermé pour les administrateurs francophones. A l'origine, peu de contributeurs utilisaient le canal à part ceux qui étaient administrateurs. Aujourd'hui, le canal IRC est de plus en plus fréquenté, il est en quelque sorte de plus en plus "public". (entre 20 et 50 connectés en permanence).

La façon de travailler est assez diversement interprétée selon les administrateurs : certains sont très juridiques d’autres sont très réticents par rapport au carcan de règles. « Il y a des gens qui aiment rajouter jusqu’à 300 pages de règles pour avoir un système judiciaire ; à l’inverse il y a des gens qui n’aiment pas ça et considèrent que c’est pas le but du projet : donc les procédures ne sont pas toujours appliquées au niveau des manières de faire » (David Monniaux)

Qui sont les administrateurs ?

Les administrateurs sont souvent d’anciens gros contributeurs. Le travail des administrateurs leur prend un temps très important. Quand ils deviennent administrateurs, les acteurs n’ont plus le temps de faire du contenu. Comment devient-on administrateur ? Avoir fait ses preuves dans la rédaction d’article mais aussi manifester un intérêt pour le collectif. Ensuite, on se propose et vote ouvert par tous les contributeurs depuis 3 mois ayant un certain nombre de contributions…

Discussion : il pourrait être utile d’avoir un système pour bloquer l’action d’une personne sur un article mais pas sur les autres. Car il y a des gens supportables mais qui deviennent monomaniaques sur un thème…

Les problèmes de vandalisme n’arrivent pas sur les pages très consultées mais sur des pages peu consultées.

Exemple : l’affaire John Seigenthaler. C’était un journaliste américain qui avait été dans un journal régional ; quelqu’un avait mis des bêtises concernant son implication dans l’assassinat de JFK ; il s’est offusqué. Le pb était que John Seigenthaler était un parfait inconnu avant l’affaire donc personne n’avait vu le papier.

Pour un oeil journalistique et subjectif sur "l'affaire Seigenthaler" : cliquez ici X

Pour un oeil "wikipédien" (ou comment argumenter en déployant les preuves) : cliquez ici X

Vérificateurs d’adresse IP :

Ils vérifient si tel ou tel pseudo ont la même adresse IP. Ils interviennent par exemple dans les votes pour épurer la base électorale.

3. Gestion des conflits :

Elle repose sur des procédures et sur un comité spécial : le comité d’arbitrage

Le Comité d'arbitrage :

Élu par tout le monde. Ne contient pas forcément que des administrateurs (y a-t-il une règle qui impose que dans le comité d’arbitrage soient présents des représentants des simples contributeurs ?). A un mandat de 4 ou 6 mois. Seuls eux peuvent prendre la décision finale (dans quels cas ? c’est contradictoire avec la remarque précédente qui disait que les administrateurs pouvaient enlever des pages). Ils veillent aussi à l’application des sanctions.

La procédure de désaccord de neutralité :

N’importe qui peut mettre un bandeau de désaccord de neutralité sur un article… Le but de Wikipedia est en effet Représenter la diversité des points de vue notables sur un sujet (et non simplement le consensus).
Bandeau : désaccord sur la neutralité de points de vue de cet article.

Exemple : article Nicolas Sarkozy : il y a un désaccord de neutralité sur la question de savoir si on mentionne le fait qu’il a envoyé des spams aux boîtes aux lettres.

Certaines pages sont semi-protégées. Sur les pages semi-protégées : les nouveaux entrants ou les anonymes ne peuvent pas écrire (exemple : l’article Nicolas Sarkozy).

Discussion : Les bandeaux de désaccord de neutralité aboutissent à un agrandissemetn en taille de nombreux articles qui deviennent alors filandreux et bourrés de citations, et manquant d’esprit de synthèse.

4. Dynamiques de publication des pages : 

Quelques remarques :

- Le fait de tagger une page comme « A SUPPRIMER » engendre un afflux de contributeurs qui cherchent à concentrer leur énergie sur l’amélioration de ces pages qui posent des problèmes spécifiques (Julien Levrel : il s’agit d’un « effet-piranha »).

Exemple : histoire de l’article BROUETTE ; au départ il s’agit d’une blague d’étudiant ; puis quelqu’un intègre sur elle « un chapeau dans l’article qui le propose à la suppression »; suite à ce chapeau la page est suspendue à la décision d’administrateurs, qui peuvent la supprimer si ils le veulent ; mais ce clouage au piloris a eu l’effet inverse : la page a attiré des gens fréquents contributeurs. La stigmatisation au risque de suppression a attiré des gens bienveillants. Ainsi, après un an de stand-by de la page, un utilisateur ingénieur des techniques agricoles a rajouté énormément de contenus (on sait qu’il est ingénieur des techniques agricoles car il renvoie sur sa page perso).

=> Il serait intéressant avoir une statistique pour savoir quel est le destin des pages qui sont taggées comme « à supprimer » : sont-elles sauvées suite à la sollicitation d’une âme charitable ? ou sont-elles impitoyablement détruites par des administrateurs (sous décision collective)? Comment a évolué cette proportion ?

=> Bonne question, après m'être intéressé aux procédures et dispositifs techniques, je mène l'étude quant aux arguments déployés dans les débats publics. Pour le moment, je m'intéresse à 2 procédures : les "Articles de Qualité" (qu'est-ce que l'excellence encyclopédique ?) et les "Pages à Supprimer" (Qu'est-ce qui a sa place dans une encyclopédie ?).

5. Outils de maintenance autres que gestion de conflit sur les articles :
- Outils de suivi des articles :
Les modifs récentes apparaissent sur IRC : Chan irc de Freenode #rc.wikipedia
De plus : liste de suivi individuelle et personnalisable : chacun intègre les articles qu’il suit (liste de suivi d’un contributeur).
Développement actuel de flux rss…
Sur anglophone, c’est ingérable à cause de la taille excessive du flux donc ils font des filtres (de mots clefs par exemple).

Un des outils de suivis est une page spéciale qui s’appelle « liste des blocages ». Effectivement certains contributeurs sont amenés au cours de leurs activités à être bloqués par un administrateur. Quand on regarde les historiques, cette pratique s'est de plus en plus routinisée alors qu'auparavant elle engendrait un armada procédural impressionnant. Il faut dire que l'un des premiers slogans qui circulait sur Wikipedia, "on a pas de troll, on est pas Usenet", s'est vite confronté à la réalité des cas. Pour des exemples de prise de décision allant jusqu'au bannissement : Papotages et ">Stuart Little.

Ces décisions ont éprouvé les premières procédures collectives de résolution de conflits ainsi que l'engagement des autres contributeurs amenés à se justifier. Aujourd'hui, pour la résolution de conflits, le Comité d'Arbitrage est l'instance déléguée pour traiter ces affaires. Pour les blocages, seuls les administrateurs peuvent appliquer la sanction en cas de vandalisme répété. Le blocage concerne l'IP et le pseudo du contributeur. Il peut être facilement contournable (adresse IP dynamique) mais il est généralement suffisant. Lors de vote, l'un des nouveaux outils est le Check User qui permet d'identifier l'adresse IP de différents votants et de les comparer pour tirer des conclusions sur la similarité des comptes ouverts.

- Robot :

L'usage d'un "bot" est réglementé : voici la page d'explication (avec limites, dégats, opportunités, ...).

Un robot orthographique est lancé à des heures de faible utilisation de bande passante ; un autre robot (Robot Quistrix) vérifier les traductions dans les autres langues de l’article (exemple sur Brouette).

Il existe plusieurs manières d'évaluer les éditions d'un "bot". Tout d'abord, il possède une page utilisateur comme n'importe quel autre utilisateur, on peut ainsi suivre ses modifications (Liste de suivi). On peut également se faire une idée de son travail automatique en parcourant les Modifications Récentes. Enfin, si un robot automatise un travail sur les "Catégories", il est d'autant plus surveillé. On peut faire des requêtes en passant par cette page, s'ensuivra une prise en charge par l'un des robots ou la création d'un nouveau robot si la demande est reconnue comme valide.

6. Que faire sur la base de donnée Wikipedia ?

Globalement : faire le graphe bipartite – personne/page sur des localités de la base.

Remarque sur ce qui a déjà été fait en matière de statistiques et visualisations:

Globalement, chez les développeurs, il y a eu peu de réflexion pour développer des outils parce que obsession : maintenance des serveurs.

Cependant, on peut signaler deux statistiques et visualisations :
1) Eric Zachte et Jakob Voss : Wikimania – Francfort
Ils développent sur leur site personnel des statistiques sur la communauté
2) article de Viegas Wattenberg Dave
Viegas Wattenberg Dave sur wikipedia (100 000 sujets, sur 1 an, 150 000 pages vues)

"Studying Patterns of Cooperation and Conflict with History Flow Visualizations". L’article présente divers mécanismes pour visualiser les flux de modification des articles (déplacements de paragraphes, ajouts, suppressions). Et il aboutit à quelques conclusions sur les patterns de coopération et de conflit (notamment l'idée de "first move avantage") dans l'écriture coopérative des articles sur Wikipedia.


On pourrait ranger les idées en plusieurs items :

Au niveau de l’amélioration de la simplicité de rédaction d’un écriture :

Le graphe bipartite, lui-même sans doute à amélioré, pourrait donner une aide au rédacteur, en lui indiquant les articles qu’ont écrit ceux qui ont écrit des articles proches de l’article à lire.

Au niveau de l’amélioration de la simplicité de lecture :

Des sous-projets spécifiques émergent au sein de Wikipedia : projet et portail Cinéma par exemple, ...

Question sur la qualité :
- est-ce que lle graphe bipartite peut aider à qualifier la qualité des articles (en montrant la position de l’article dans l’ensemble du groupe, dégager les pages orphelines, peu de personne qui surveille des pages) ?
Ce qui infirmerait cette hypothèse : les utilisateurs vont sur Wikipedia à partir de Google. Donc c’est plutôt le Page Rank de Google qui qualifierait la qualité de l’article de Wikipedia…
Ce qui irait plutôt dans le sens de l’hypothèse : on pourrait qualifier l’utilisateur : la Watchlist de l’utilisateur, pages de contribution de l’utilisateur…
Par ailleurs, il existe un label de qualité. Cependant, même s’il existe un label « article de qualité », la communauté Wikipedia n’aime pas le processus du label (plus pour désigner aux journalistes de bons articles).

- Question sur les prérequis en lecture sur certains articles.



Diverses choses à faire…

Séance de co-conception avec comme public des contributeurs (pas des administrateurs, pas de simples utilisateurs) : Jean-Daniel organise


Regarder la base des photos commons, photos mal catégorisées – Proposition de David Monniaux.


Faire rapidement un graphe bi-partite… et commencer des traitements simples sur la base de données.


Faire une page Autograph dans Wikimédia tools


Trouver d’autres bases de données pour traiter dans Autograph…


Il faudrait une version anglophone du projet, traduire une page pour le wiki…



Réunion de travail sur la base : 7 mars (10h)


Réunion de co-conception avec Wikipédiste (6, 10, 13 mai / date à proposer)

Répondre à cet article