Bellingcat a développé un modèle d'apprentissage automatique pour identifier et hiérarchiser les messages Telegram pouvant contenir des preuves de dommages civils pendant les conflits, en particulier en Ukraine depuis février 2022. L'organisation a recueilli plus de 2 500 incidents vérifiés de dommages civils et a construit un ensemble de données utilisant 5 848 messages confirmés contenant des dommages et 48 545 messages sans dommages pour former le modèle. L'approche réduit le temps nécessaire pour passer au crible de vastes quantités de contenu des médias sociaux, permettant aux chercheurs de se concentrer sur la vérification plutôt que sur la découverte. Le modèle utilise des techniques de traitement du langage naturel comme les transformateurs multilingues et la similitude cosine pour analyser le texte, tout en tenant compte des métadonnées telles que le calendrier des publications et l'engagement. Le projet met en évidence à la fois le potentiel de l'IA dans la recherche humanitaire et les défis liés à l'organisation de grands volumes de contenu généré par les utilisateurs.
Lecture du biais (Centre): L'article fournit une explication technique d'une innovation méthodologique dans la recherche open-source sur les dommages civils, en se concentrant sur le développement d'un outil d'IA. Il ne prend pas position sur les questions politiques, ni ne favorise un côté dans un débat.




