Présents : Pascal Pons (LIAFA), Fabien de Montgolfier (LIAFA), Bernard Desgraupes (LIMSI), Benoît Habert (LIMSI), Christophe Martinetto (FT R&D), Jean-Daniel Fekete (INRIA), Sylvain Loiseau (Limsi), Camille Roth (CREA), Clémence Magnien (CREA), Matthieu Latapy (LIAFA), Lionel Tabourier (LIAFA), Christophe Prieur (LIAFA), Dominique Cardon (FT R&D),


1. Séance de co-conception participative Wikipedia (Jean-Daniel)

 Séance à la Mutualité (samedi 13 mai). Les résultats de la séance seront mis en ligne (JDF)
Présents : 3 wiképidistes très actifs dans la communauté seulement + 5-6 utilisateurs/producteurs réguliers de Wikipédia.
Le principal besoin identifié est de faire des petites choses sur les pages (indices de confiance, évolution de la page dans le temps)…
Les administrateurs réclament des fonctionnalités sophistiquées… (N’entrent pas forcément dans le spectre d’Autograph).
Pour les prochaines séances de co-conception, il faut absolument que les gens confirment leur présence…
Faire un serveur INRIA comme démonstrateur d’expérimentation des propositions de visualisation…
Martin Wattenberg (IBM Boston) travaille toujours sur Wikipédia est prêt à collaborer avec nous pour faire des visualisations.

 
2. Point sur la visualisation des forums sociaux (Dominique)
Présentation le mois prochain de l’ensemble du processus.
Du point de vue d'autograph, dans tous les collectifs étudiés on va devoir produire des indicateurs qui concourent aux formes d’organisation en ligne. Trouver des résultats génériques, respecter la dynamique des différents collectifs…

Discussion autour de la possibilité pour Autograph d’apporter une contribution au développement des outils de visualisation qui vont être implémenté dans le workspace du forum social mondial qui se prépare pour Nairobi. Le besoin des utilisateurs est d’avoir un outil web interactif permettant de visualiser en temps réels les coordinations qui ont lieu sur le site. D’une certaine manière, utiliser quelque chose comme Vizter pour représenter les liens entre organisations.

Voir avec l’INRIA pour voir s’il est possible de travailler sur ce projet (Dominique organise une réunion avec Jean-Daniel, Christophe A., Christophe P. et des acteurs du groupe Mémoire).
 

3. Communautés de savoirs (Camille)
Travail sur les communautés épistémiques (reconnaissance de motifs de haut niveau)
Treillis de Galois rassemble groupes structurellement équivalent
Communauté épistémique : Ensemble d’agents qui utilisent les mêmes concepts
Voir les transparents de la présentation de Camille (cf. aussi le contexte de la méthode ici)

4. Point Limsi (Benoît)
Le Limsi a installé une version actuelle des pages. Création d’un table qui résume l’information des 50 gigas de révision (révision, nombre de révision, estampille temporelle, poids de la révision, avec le commentaire de la révision). Table en ligne. Elie a travaillé sur cette table

  • Continuation de ce qui a été présenté le 21 mars. Travail sur les expressions régulières à partir des titres des pages pour retrouver des ensembles de pages (Philosophie, Biologie et Mathématique). Possibilité de faire des échantillons aléatoires de pages. Faire des classifications automatiques, tirer des échantillons…
  • Autre direction. Extraire le texte de façon moins violente. Parseur qui extraie les textes de façon plus fine…
  • Extraire le graphe des catégories pour faire les graphes des liens entre catégories.
  • Le LIMSI propose un mode d’emploi pour installation d’une base Wikipedia en local

5. Analyse de l’historique de Wikipedia : calculs de diffs (Pascal)
Fichier de présentation de Pascal : transparents et les données et plus d'information
Travail sur le fichier des révisions pour étudier les diffs entre versions.
Trois opérations d’éditions : insertion, suppression, déplacement.
Distinguer des profils de contribution :

  • Ajout d’un gros paragraphe
  • Correction/mise en forme (nombreuses et petites modification)
  • Rupture

Relier les blocs de textes à leurs auteurs : montrer un camembert des contributeurs d’un article ou faire un texte en harlequin (textes colorés par auteur)

Évaluer la qualité d’une bonne contribution :

  • une bonne contribution reste longtemps
  • une mauvaise contribution est rapidement supprimée
  • Identifier si la disparition d’un gros bloc correspond à une forme identification de vandalisme. Qui sont les auteurs qui surveillent les vandalismes ?

Pascal doit sortir une table et coordonner les sorties avec les bases construites par Benoît et Elie

6 Communautés (Liafa)

Deux outils d’identification des communautés au Liafa, celui de Pascal (marche aléatoire) et celui de Fabien (gravitationnel).
On récupère 800 fichiers lorsqu’on utilise ces outils. Exploration dans chaque communauté pour regarder ce qui a été fait.
A partir du graphe bipartite auteur/article.
- enlever les communautés uniquement d’un seul contributeur
- après on arrive à trouver des communautés (par exemple Egypte).
Les algos de reconnaissance de communautés ne sont pas fait a priori pour des graphes bipartites (disons que ça se discute).
Possibilité de pondérer les personnes en fonction de leurs actions.

Article d’Andreas Noak (?) : pondérer l’activité des auteurs pour améliorer la reconnaissance des communautés.

Travail sur le graphe des pages ou graphe des auteurs.

Regarder si la décomposition en communautés a du sens (vérifier notamment si cela correspond aux portails dans Wikipedia).

7 Centralisation des questions / réponses

Réfléchir à une structure efficace pour la page sur le wiki pour centraliser les questions wikipedia.
Par exemple, ajouter une page pour les idées d'indicateurs (cf. séance co-conception et discussions sur l'exposé de Pascal), et une autre pour une synthèse des pages de questions soumises par les uns et les autres.

Deux dates soumises pour la prochaine réunion 21 et 26 juin…

programme de la prochaine réunion :
Présentation de Smiophore (Elie)
Questions de gouvernance (Nicolas et al.)
Point sur les graphes alters (Dominique)

Répondre à cet article