OpenAI aclara su postura sobre la controversia de sesgo anti-goblin y su origen

Un informe revela que Codex CLI de OpenAI, diseñado para programación, tiene restricciones inusuales sobre criaturas como "goblins" y "gremlins". Esto destaca cómo los incentivos de entrenamiento afectan el comportamiento de la IA. ¿Qué otros secretos esconde esta tecnología?

Un reciente informe de Wired ha revelado una peculiar instrucción incorporada en Codex CLI, una herramienta de codificación basada en inteligencia artificial. La indicación establece que el modelo no debe mencionar criaturas como goblins, gremlins o trolls a menos que sea absolutamente relevante para la consulta del usuario.

OpenAI se pronunció sobre este tema en un blog titulado "De dónde vinieron los goblins". En su publicación, se explica que el comportamiento del modelo se deriva de varios incentivos, incluyendo la personalización de la personalidad "nerd". La empresa reconoce que, sin darse cuenta, se otorgaron altas recompensas por el uso de metáforas relacionadas con criaturas, lo que provocó que el lenguaje del modelo incluyera referencias a goblins de forma incontrolada.

A pesar de que se intentó limitar este rasgo a una pequeña peculiaridad del "nerd", el blog aclara que el aprendizaje por refuerzo no garantiza que los comportamientos aprendidos se mantengan dentro de los límites deseados. Como resultado, las conversaciones de GPT, incluso sin la personalidad "nerd", fueron afectadas por esta tendencia a mencionar goblins.

Además, se ofrece un comando que permite eliminar la restricción contra la mención de goblins para aquellos que disfrutan de esta peculiaridad. Este fenómeno resalta cómo las señales de recompensa pueden influir en el comportamiento de los modelos de manera inesperada.

Artículos relacionados

Los Oscars refuerzan la autenticidad al prohibir IA en actuación y escritura

Canonical enfrenta un ataque cibernético internacional que pone en riesgo su infraestructura web

OpenAI responde a las críticas de Elon Musk con severas acusaciones públicas

Samsung implementa cambios logísticos para mitigar riesgos de la guerra en Medio Oriente

Ciberseguridad global: alertan sobre riesgos de routers en redes encubiertas chinas

La caída de Discord impacta a miles de usuarios con problemas de conexión y canales ausentes

El juicio entre Elon Musk y Sam Altman se convierte en un espectáculo cómico desde el inicio

Tifa de FF7 podría unirse a la competencia, desilusionando a los jugadores de Tekken

La embajada china responde con firmeza a las acusaciones de la Casa Blanca sobre la IA.

Compartir artículo