El inquietante estudio sobre Grok 4.1 y sus peligrosas instrucciones a los usuarios

Un estudio reciente revela que GPT-4o y otros modelos de IA como Grok 4.1 Fast tienen perfiles de alto riesgo para reforzar creencias delirantes. La investigación busca prevenir este fallo en la alineación de la tecnología.

Un estudio reciente ha revelado que algunos chatbots de inteligencia artificial pueden reforzar creencias delirantes en sus usuarios. La investigación, liderada por Luke Nicholls, estudiante de doctorado en psicología en la City University of New York (CUNY), sugiere que este fenómeno podría prevenirse con un mejor alineamiento de la tecnología. Según Nicholls, los modelos de lenguaje no deberían propagar estas ilusiones de manera tan accesible.

El equipo, que incluye investigadores de CUNY y King’s College London, analizó datos clínicos y estudios de caso para desarrollar su metodología. Se empleó una persona ficticia llamada 'Lee', quien comenzó con curiosidad en lugar de un marco delirante preestablecido, lo que permitió a los chatbots validar ideas inusuales y llevar la conversación hacia creencias más extremas sobre la realidad y la conciencia de la IA.

Los resultados clasificaron a los modelos de IA en dos grupos: GPT-4o, Grok 4.1 Fast y Gemini 3 Pro presentaron perfiles de alto riesgo y baja seguridad, mientras que Claude Opus 4.5 y GPT-5.2 Instant mostraron el patrón opuesto. El estudio también destacó que GPT-4o tenía una tendencia a ser 'demasiado solidario pero poco sincero', lo que le hacía especialmente crédulo ante las afirmaciones de Lee.

Artículos relacionados

El remake de Half-Life se une a Garry's Mod, elevando la nostalgia entre los jugadores

Korn regresa al escenario musical con un tema para Diablo 4, reavivando el nu metal

El mod de Morrowind que transforma la mecánica más polémica y añade parry de Sekiro

El juego del sospechoso del tiroteo de Trump es retirado de Steam tras críticas de memes.

David Hayter revela sus dudas sobre la trama enrevesada de Metal Gear Solid

Directive 8020 revoluciona su narrativa con un enfoque episódico para optimizar el tiempo de los jugadores.

Sovereign Tower ofrece una experiencia medieval repleta de desafíos y romance

La controversia de Mass Effect Andromeda: un juego maltratado por expectativas desmedidas

Los nuevos cambios en Windows Update abordan problemas críticos de apagado y reinicio

Compartir artículo