Raziskovalci so preizkusili pet glavnih chatbotov ChatGPT, Gemini, Grok, Meta AI in DeepSeek z 50 vprašanji, povezanimi z zdravjem, in ugotovili, da je bila skoraj petina odgovorov zelo problematična, polovica problematična, 30% pa je bilo nekoliko problematičnih. Izvedba se je razlikovala glede na vrsto vprašanja, odprta vprašanja pa so bila bolj zahtevna. Noben od chatbotov ni zagotovil popolnoma točnih referenčnih seznamov. Ločena študija je pokazala, da so bili uporabniki, ki so se zanašali na chatbotove, manj učinkoviti pri prepoznavanju pravilnih diagnoz in določanju ustrezne oskrbe v primerjavi s tistimi, ki so uporabljali tradicionalne metode.
Ocena pristranskosti (Sredina): Članek predstavlja ugotovitve iz več študij, ne da bi očitno zagovarjal nobeno posebno politično stališče. Čeprav poudarja zaskrbljenost zaradi zanesljivosti umetne inteligence v zdravstvenem varstvu - teme s potencialnimi regulativnimi in etičnimi posledicami - ne zavzema jasnega ideološkega stališča.






