Bellingcat ha desarrollado un modelo de aprendizaje automático para identificar y priorizar las publicaciones de Telegram que pueden contener evidencia de daños civiles durante los conflictos, particularmente en Ucrania desde febrero de 2022. La organización recopiló más de 2,500 incidentes verificados de daños civiles y construyó un conjunto de datos utilizando 5,848 publicaciones confirmadas que contienen daños y 48,545 publicaciones sin daños para entrenar el modelo. El enfoque reduce el tiempo necesario para revisar vastas cantidades de contenido de redes sociales, lo que permite a los investigadores centrarse en la verificación en lugar de en el descubrimiento. El modelo utiliza técnicas de procesamiento de lenguaje natural como transformadores multilingües y similitud cosino para analizar texto, al tiempo que considera metadatos como el tiempo de publicación y el compromiso. El proyecto destaca tanto el potencial de la IA en la investigación humanitaria como los desafíos de organizar grandes volúmenes de contenido generado por los usuarios.
Lectura del sesgo (Centro): El artículo proporciona una explicación técnica de una innovación metodológica en la investigación de código abierto sobre daños civiles, centrándose en el desarrollo de una herramienta de IA.




