Bellingcat je razvio model strojnog učenja kako bi identificirao i prioritizirao poruke na Telegramu koje mogu sadržavati dokaze o civilnoj šteti tijekom sukoba, osobito u Ukrajini od veljače 2022. godine. Organizacija je prikupila više od 2.500 potvrđenih incidenata o civilnoj šteti i izgradila skup podataka koristeći 5.848 potvrđenih poruka koje sadrže štetu i 48.545 poruka bez štete za obuku modela. Pristup smanjuje vrijeme potrebno za pretraživanje ogromnih količina sadržaja na društvenim medijima, omogućujući istraživačima da se usredotoče na provjeru umjesto otkrića. Model koristi tehnike obrade prirodnog jezika poput višejezičnih transformatora i sličnosti kosinusa za analizu teksta, uz uzimanje u obzir metapodataka kao što su vrijeme objavljivanja i angažman.
Procjena pristranosti (Sredina): Članak pruža tehničko objašnjenje metodološke inovacije u istraživanju otvorenog koda o civilnoj šteti, fokusirajući se na razvoj alata za umjetnu inteligenciju.




