Auto-organisation et visualisation des graphes

Page principale - S'identifier

Gouvernance des grands collectifs

Cette page concerne l'approche sociologique de la gouvernance des grands collectifs sur Internet. Elle sert à la fois de table de réflexions concernant les phénomènes que nous souhaitons étudier, et à présenter l'approche sociologique aux autres participants au .

 1. Généralités
 2. Bibliographie
 3. Terrains

 * Le
 * Le

 * Le

  1. Généralités

La formation de collectifs sur Internet a été fortement étudiée par les sciences sociales, elle comprend de nombreuses voies de recherches portant principalement sur la nature des "communautés" et sur les pratiques d'écriture.

Aux Etats-Unis, les premières études sur les « communautés » s’attachent à décrire les situations d’interaction et le travail identitaire (J.S Donath, 1998), les phénomènes de transgression et de maintien des règles, ainsi que les motivations individuelles à participer à la coopération en ligne. Cette dernière thématique a été l’occasion de lancer de larges questionnaires, plus ou moins ciblés sur des collectifs de développeurs de logiciel libre (Lakhani et Wolf, 2005). L’émergence du concept de « capital social » dans l’étude des communautés a fortement marqué les récents développements de l’approche sociologique américaine de ce phénomène (Wellman, Kiesler, …). Marc Smith (Microsoft Research) est l'un des sociologues les plus prolifiques concernant l'étude de ces collectifs dont la visualisation des interactions semble être la clé pour comprendre, interpréter et proposer (des services).

 En France, les thématiques de recherche sur les phénomènes sociaux en ligne ont porté sur les pratiques d’écriture et l’analyse des situations d’interaction (Velkovska 2004, Revillard 2000), sur les pratiques d’autoproduction individuelle inscrites en réseau (Beaudouin, Velkovska 2001, Allard), sur la médiation des outils dans les formes d’interaction (De Fornel, Akrich, Jouet), et enfin sur la notion de « communauté épistémique » (Conein, Auray, Gensollen) concernant leurs travaux avec la communauté de développeurs Debian. L’émergence de ces « collectifs » ou « individus en réseau » sur Internet, ainsi que leur travail de négociation dans la construction des règles et d’un cadre de référence commun reste peu étudié. C’est dans un contexte éminemment différent, celui de l’entreprise et de la gestion des Intranets, que des études font converger créativité des usagers et contraintes organisationnelles au sein d’une même grille d’analyse (Beaudouin, Cardon, Mallard 2002), mais elles reflètent un caractère fortement contraignant du terrain d’analyse qui laisse peu de place à la négociation concernant les usages de l’Intranet.

Dans le cadre du projet Autograph, nous visons l'étude des grands collectifs sur Internet. Dans certains cas (Wikipedia), ce collectif est lié par un projet commun (construire une encyclopédie universelle). Il s'agit, pour reprendre la classification de Michel Gensollen, d'une "communauté blackboard" au sens où le contenu "mis en commun" médiatise les interactions (s'il y a) entre participants. La gouvernance peut donc être abordée quant à la manière de construire un référentiel commun, de produire des accords, de réinsérer de l'autorité dans un contexte interactionnel horizontal. Dans d'autres cas (blog), les logiques relationnelles sont également médiatisées par les contenus, mais celui-ci ne possède pas de cadre contraignant par une "mise en commun" ; le contenu identifie un individu.

2. Bibliographie


3. Terrains
  • Approche sociologique de la gouvernance wikipédienne

 Objectifs :

 - Identifier des catégories d’analyse pour la gouvernance de grands collectifs

- Présenter des indicateurs pertinents pour une approche socio de la gouvernance

- Constituer une bibliographie proche de nos interrogations

 Notre angle d’approche :

Nous avons identifié 2 principaux points concernant l’approche du phénomène auto-organisé spécifique à Wikipedia. Nous souhaitons traiter ces points en parallèle puisqu’ils interrogent la gouvernance du projet selon deux entrées qui sont, à notre sens, extrêmement liées.

1. Le profil individuel des contributeurs

 Par rapport aux données issues de la base téléchargée, c’est le point faible. La base de données ne comporte aucune indication concernant le profil des contributeurs, à part l’user_id, qui correspond à un identifiant unique et chiffré d’un contributeur enregistré. On peut dépasser cette limite par 2 possibilités ; l’une revient à parcourir le Wikitext à la recherche des signatures des contributeurs pour lier user_id et pseudo. L’autre revient à utiliser les « Catégories » de Wikipedia pour identifier des groupes d’utilisateurs. Il existe, par exemple, une « Catégorie : Administrateur », une « Bureaucrate », etc … une pour l’ensemble des statuts techniques ayant cours au sein du projet.

 Une fois, les user_id liés à l’une ou l’autre catégorie, nous souhaiterions opérer 2 types d’enquête. La première concerne l’activité des « Administrateurs » et convoque une méthodologie plutôt qualitative que quantitative. Néanmoins, Julien Levrel aimerait pouvoir opérer des requêtes concernant ce groupe à part (composé d’environ 82 contributeurs pour le francophone). Le second type d’enquête rejoint les objectifs clés du projet Autograph, il concerne l’identification des pratiques des contributeurs les plus nombreux, ceux qui n’ont pas de statut distinctif. Ce corpus comprend donc tous les user_id n’étant pas liés aux « Catégories Statuts » dans la base de données.

2. La qualification des engagements et des « aires d’interventions » 

Pour éviter de se lancer dans l’inconnu, la méthodologie à adopter est celle que le LIMSI a opéré concernant la « Catégorie : Philosophie », une réduction de la complexité à quelques « Catégories » pour se familiariser aux données et être capable de comparer sans généraliser trop hâtivement. L’hypothèse est qu’il existe des structurations internes différentes des thématiques selon le nombre de contributeurs, l’existence ou non d’un sous-projet et d’un « Portail », … On peut également réduire la complexité en s’intéressant aux contributions d’un contributeur. Il existe déjà plusieurs outils permettant de visualiser l’activité d’un contributeur : « Suivi d’un contributeur » disponible sur sa page personnelle dans le Wiki, « Edit User Counter » permettant de visualiser l’activité chronologiquement selon le type de page éditée : Article, Discussion d’article, Utilisateur, Discussion d’utilisateur, … (les « types de page » répondent d’une distinction technique et ne prennent pas en compte la thématique).

 Le premier effort est donc destiné à visualiser l’activité des contributeurs selon les thématiques. Le premier point est de visualiser cette activité à partir des « Catégories », il ne restera plus qu’à les différencier : « thématique », « statut », « prise de décision », …

Visualiser le rapport Contributeur / Thématique est le plus important pour nous mais également pour les utilisateurs, c’est un outil non disponible actuellement qui pourrait servir de vitrine au projet (sexy si possible).

 Voici une proposition de visualisation à plusieurs niveaux. L’idée serait de pouvoir choisir sa focale et de pouvoir naviguer dedans pour approcher plus ou moins finement l’activité du contributeur.



Pour revenir à notre premier problème, à savoir un travail sur les « profils individuels », il s’agirait de faire remonter ce qui peut être structurant pour un contributeur, ses dispositions à faire telle ou telle tâche, à s’engager d’une manière ou d’une autre, de tenir un rôle. C’est principalement un travail qualitatif impossible à réaliser dans le cadre d’Autograph. Mais ce travail nécessite une méthodologie complémentaire au profil individuel ; la qualification des modes d’engagement et les « aires d’intervention » qui serait une « autre » facette que la présentation de soi ; la réalisation de soi, ce que autrui peut reconnaître en se basant sur l’action, le « faire » archivé.

 Qu’est-ce que nous recouvrons sous le « profil individuel » ?

 - Les données de la page personnelle (présentation de soi)

- Les entretiens réalisés avec les contributeurs

- La construction de « rôles » à partir d’observations des discussions et des historiques sur certains articles

Qu’est-ce que nous recouvrons sous la « qualification des modes d’engagement » et « aires d’interventions » ?

 - Nombre d’éditions (de « contenu », « mineures » déclarées) => peut-on inclure un filtre sur la taille de l’édition (en Ko ou en lignes) ?

- Nombre d’éditions tous les mois (séquençage temporel de l’engagement)

- Caractériser les arêtes qui relient contributeur et thématique (on peut se baser sur le déclaratif des acteurs, mais il faudrait trouver des indicateurs pertinents dans la base de données pour caractériser de manière « brutale » / créer des filtres, …)

- Répartition thématique des éditions / tous les mois : permet d’identifier des carrières ou trajectoires dans l’engagement des individus.

3. Essais typologiques concernant différents rôles identifiés dans la rédaction d’articles

D’après quelques essais sur certains articles, le traitement des historiques montre la prédominance éditoriale d’un ou deux contributeurs. A partir de ces observations, on aimerait interroger la carrière des articles en termes de controverses, de conflits entre contributeurs. Les « rôles » que nous mettons en avant dans cet essai ne sont que des hypothèses de travail qu’il convient d’infirmer ou de confirmer avec un traitement plus quantitatif. Il faut également prendre conscience que les contributeurs peuvent endosser successivement plusieurs rôles selon les thématiques auxquelles ils participent. L’intérêt serait de déceler des généralités, des invariants dans la manière de s’engager.

Pour réaliser cette étude sur les conflits d’éditeurs, il faut prendre en compte d’une part le traitement des historiques des articles pour identifier la structure coopérative de rédaction des contenus, et d’autre part le traitement des pages de discussion pour caractériser les « rôles » endossés par les rédacteurs des articles. Nous avons, donc, un premier travail d’ordre statistique et un second d’ordre sémantique ou syntaxique. L’analyse sémantique des pages de discussion répond à une structure particulière puisque les contributions de chacun sont distinctes (comme dans un fil de discussion), horodatées dans la plupart des cas, et surtout identifiées (signature avec le pseudo du contributeur).

Voici un essai de caractérisation des "rôles" que j'ai rencontré au cours de mon exploration des pages de discussion sur Wikipedia. Y a-t-il moyen de vérifier la consistance de ces "rôles" grâce à nos efforts communs ?

 « L’initiateur auto-centré »

 Celui qui écrit les principales parties de l’article et refuse la modification de ses écrits. Il adopte un engagement protecteur de ses écrits, de sa connaissance, attitude rejetée par la communauté lorsqu’elle n’est pas fondée sur l’apport de preuve, de sources validant ses contributions. Dans les pages de discussion, le vocabulaire employé par ces « auto-centrés » correspond à certains mots clés qu’il serait pertinent d’interroger sémantiquement ; « contre », « désaccord », « non », …

La dénomination « initiateur » peut être faussée, le contributeur pouvant reprendre la rédaction d’une ébauche par exemple. De manière générale, ce n’est pas une remise en question des contenus que le contributeur apporte, mais une « mise en scène » de son attitude réfractaire à l’un des principes fondateurs du projet : la non coopération.

 => Forte tendance à entrer en conflit avec tout le monde / attitude de protection de ses éditions

 « L’initiateur centré-contenu »

Cette figure de l’initiateur est très proche de « l’initiateur auto-centré », il se distingue principalement par une ouverture à la modification de son texte. En ce sens, il correspond à un individu bien socialisé aux principes fondateurs de modification. Néanmoins, ces modifications doivent répondre à sa critique et donc posséder des sources vérifiables. Il ne tient pas à l’intégrité de ses éditions mais principalement à la cohérence de l’article qu’il a initié ou repris en main.

 => Forte tendance à intervenir dans les pages de discussion : résolution de conflit, critique, justification, … / attitude de construction de l’article.

 « L’initiateur décentré »

Celui-ci répond de l’expression jeter une bouteille à la mer. On trouve régulièrement son pseudo dans le début des historiques d’articles puis s’efface dans la temporalité lorsque celui-ci est repris. Il propose soit des ébauches soit des articles structurés en fonction de ses connaissances. Une des stratégies qu’il adopte est la « lutte contre les liens rouges », il lance la machine coopérative sur un grand nombre d’articles. Il ne rentre pas dans les conflits dans les pages de discussion mais peut intervenir en tant que médiateur, il endosse dès lors une autre casquette.

 => 2 tendances : ignorer les conflits ou tenter de les résoudre

 « Le médiateur »

 La figure du médiateur est très éphémère quand on se situe à l’échelle d’un article, elle peut être endossée par un n’importe quel contributeur qui identifie un conflit entre éditeurs. Vu les dispositifs techniques de contrôle (« liste de suivi individuelle », « modifications récentes » et « unwatchlist »), les 2 principaux types d’acteurs impliqués dans la résolution de conflits sont (a) les initiateurs, (b) les administrateurs. Les initiateurs interviennent principalement concernant le « contenu » des articles, les administrateurs plus sur la « forme » du débat entre les contributeurs, voire l’absence de discussion. « L’initiateur auto-centré » est incompatible avec la figure du médiateur puisqu’il est principalement à l’origine ou parti pris des conflits d’éditeurs.

 => N’intervient pas dans les articles mais sur les pages de discussion. Interventions courtes et ciblées et non dans la durée de construction de l’article.

 « Le lisseur » - « Correcteur » - « Vérificateur » - « Connecteur »

 Comme nous le voyons dans le traitement des historiques, il existe une multitude de « petites éditions » qu’il convient de caractériser pour comprendre le rôle de chacune.

 Les petites éditions de contenus peuvent être considérées comme des activités de « lissage », ou « d’homogénéisation » du style de l’article. Peut-on, sémantiquement parlant, construire des indicateurs de « style » d’écriture ? Il existe bien un « style encyclopédique », il serait intéressant de comparer la stabilité d’un article en construisant des marqueurs sémantiques concernant le style d’écriture des articles. Ceux qui possèdent plusieurs styles seraient en cours de construction, les autres, au style plus « lissé », serait plus stable ou plus difficile à modifier pour un nouvel utilisateur (hypothèse).

 => Courtes éditions, refontes de parties d’article, reformulations sans dénaturer le contenu, justifications sur la page de discussion.

 La figure du « correcteur » est différente de celle du « lisseur », elle opère principalement des corrections orthographiques dans le corps de l’article. Considérées comme « mineures », ces éditions sont tout de même l’apanage non exclusif de quelques contributeurs (bibliothécaires, professeur de français, étudiants prompts à respecter les codes de la francophonie, …) qui se sont spécialisés dans ce type d’éditions ou dans la programmation de robots automatiques (« Orthogaffe ») pour traiter les fautes courantes listées pour devenir une base d’apprentissage pour les robots .

 => Courtes éditions, sans dénaturer le contenu, pas de conflits, présence dans les débats concernant les « Conventions typographiques », « bibliographiques », …

 La figure du « vérificateur » est plus dure à modéliser sur le projet francophone et est également moins mise en avant que dans le projet anglophone. Le « vérificateur » s’intéresse aux contenus des articles et à l’ajout de sources vérifiables, disponibles attestant des informations contenues dans les articles. En France, on marche à la « confiance » tout en faisant un travail d’ajout de liens en bas des articles ou de justifications dans les pages de discussion, en anglais la justification par la preuve est plus forte, elle est même institutionnalisée. Un sous-projet de contributeurs bénévoles traque les fausses informations ou du moins la validité de celles-ci dans les articles. Dans le francophone, on peut s’intéresser aux sous-projets « Correction des liens externes », ou encore identifier dans les conflits ceux qui portent sur la validité des informations.

 => Forte tendance à entrer en conflit car cette activité est directement confrontée à la validité des informations contenues dans les articles. Fort engagement dans les pages de discussion ; avertissement de l’auteur, justifications, …

 La figure du « connecteur » assume le rôle d’interconnexion des articles entre eux ou à des catégories, projets, portails, circuits éditoriaux (« ébauche », « Article de qualité », « page à supprimer », …). Il intervient uniquement dans le champ réservé aux liens hypertextes et ses modifications font principalement appel à des modèles facilement identifiables par le traitement sémantique du LIMSI (dans le Wikitext : )

 => Peu de conflit, peu de discussion, juste des contributions mineures déclarée dans les historiques par une syntaxe particulière : (-> Catégorie).

Conclusion

 Comme énoncé dans l’introduction à ces « rôles », ils ne correspondent pas à des activités exclusives de certains contributeurs, on retrouve l’ensemble de ces rôles dans les contributions des participants engagés (un minimum socialisés à la vie du projet). Ces rôles sont issus de situations (d’article) et objectivés par les interactions (discussions).

 A travers cet essai de typologie, nous souhaitons « voir », de manière plus générale, lesquels se retrouve en conflit avec lesquels ? Quelles casquettes prennent les contributeurs dans les conflits ? Malgré l’hétérogénéité des manières de s’engager, existe-t-il des invariants structurels dans la vie des articles ? Comment les individus, caractérisés par leur « profil individuel », choisissent de privilégier tel ou tel rôle dans leur manière de s’engager ? Quelles trajectoires ont suivi ceux qui font carrière (administrateur par exemple) ? Ont-ils privilégié un rôle ou l’autre ? Au contraire, doivent-ils faire preuve de flexibilité et rencontrer différentes situations pour développer des capacités de résolution de conflits ?

J'essaye de mettre en ligne quelques traitements des historiques d'article pour que vous puissiez voir les observations que j'ai réalisé quant à la construction des articles.

Bibliographie spécifique à Wikipedia et aux collectifs auto-organisés