Intelligence artificielle : la « machine learning » au service de Wikipédia
Le 15 décembre 2015La fondation Wikimedia déploie tous ses moyens pour encourager les internautes à contribuer à l'encyclopédie de la génération future. Grâce à la nouvelle technologie ORES, chacun peut aisément apporter sa brique à l'édifice.
Des contrôles intransigeants
Tous les jours, de nombreux contributeurs produisent des milliers d'articles destinés à être publiés sur la fameuse encyclopédie libre en ligne : « Wikipédia ». Avec seulement deux cents modérateurs, la gestion de cette dernière implique une véritable course contre la montre. Ainsi, pour faciliter les vérifications tout en conservant la qualité des articles édités, la censure devient sévère et moins conciliante. Cela est dû au fait que les wikipédiens se montrent très exigeants.
À cause de ce mode de contrôle rapide, une seule et simple erreur détectée par l'éditeur constitue déjà une raison suffisante pour supprimer un article. Ainsi, nombreuses sont les pages qui disparaissent de la plateforme sans aucune explication.
Un tout nouveau système d'analyse pour un apprentissage automatique
Dissuasives, les suppressions répétitives ont fait chuter le nombre des contributeurs ces dernières années. D'après les statistiques, on a pu observer que depuis 2007, la participation a diminué presque de moitié soit 40 %. Pour mieux gérer la situation, la fondation a mis au point un instrument doté d'une intelligence artificielle appelé: « ORES ou Objective Revision Evaluation Service ». Grâce à ce nouvel outil, les participants connaitront les raisons pour lesquelles on a supprimé leurs modifications.
Basé sur des technologies open source de machine learning, le système ORES a été spécialement programmé pour détecter les erreurs de modifications. Pour cela, les éditeurs ont classifié dans ce programme toutes erreurs envisageables selon leur nature. Ainsi, cet instrument pourrait reconnaître les erreurs intentionnelles ou involontaires. Il a été déjà conçu pour évaluer automatiquement la qualité des articles en faisant la comparaison avec des modèles de base déjà établis. De plus, cet instrument a la faculté d'identifier les chaines de caractères faisant preuve d'acte de vandalisme. Actuellement, ce nouveau système est seulement disponible en version anglaise, turque, portugaise et perse.