Données synthétiques sur les révisions de Wikipedia FR
Fichier de données
Un "résumé" de ces archives, élagué du texte des révisions, comprend les informations suivantes (en un fichier tabulé) :
<namespace><titre><page_id><n°révision><date révision><contributeur sur 2 colonnes><contribution mineure ou non : 0|1><commentaire><changements en caractères par rapport à la révision précédente><taille version courante><n° révision de cette page><dernière révision de la page ou non : 0|1>
Article Avignon 1 1 2002-07-26T08:25:43Z Pog -1 0 init 360 360 1 0
Article Avignon 1 2 2002-07-26T10:36:02Z Mokona -1 1 Orth. -3 357 2 0
Article Avignon 1 9300 2002-10-31T10:11:31Z script de conversion -1 1 Conversion automatique 0 357 3 0
Article Avignon 1 45888 2002-10-31T12:31:45Z Shaihulud 4 1 liens vers wiki anglais 22 379 4 0
Avec :
<contributeur sur 2 colonnes> := <contributeur à IP><contributeur à username>
<contributeur à IP> := <IP> -1
<contributeur à username> := <username><user_id>
NB : les informations sur les "contributeurs à IP" ne correspondent pas toujours à l'image qu'on se fait d'une IP.
Ce résumé permet déjà de :
- construire un graphe bipartite articles vs contributeurs ;
- disposer d'informations sur les contributeurs
- volume en caractères
- période(s) d'activité
- ...
- disposer d'informations sur les pages
- évolution de la taille
- classes de taille
- évolution dans le temps
- ...
Par Benoît Habert
|
| 05/05/2006 15:58
| Actualités
|
5 commentaires
| Lu 11081 fois
|
par yann, le Vendredi 19 Mai 2006, 15:23
> Le wiki d'autograph est totalement non-intuitif et rebutant !!Répondre à ce commentaire
Je crois que ça vient du fait que c'est plutot un blog qui intègre des fonctions de wiki. Peut-être qu'une solution type overcrowded serait plus adaptée, d'autant plus que nos problématiques sont très proches.
En tous les cas, vous y serez les bienvenus pour nous tenir informés de l'avancement de vos travaux, même si nous les suivons déjà à distance ;-). --yann
Commentaires
1 - Calcul des diffs des révisionspar pons, le Lundi 15 Mai 2006, 14:06 Répondre à ce commentaire