OpenAI aclara su postura sobre la controversia de sesgo anti-goblin y su origen

Un informe revela que Codex CLI de OpenAI, diseñado para programación, tiene restricciones inusuales sobre criaturas como "goblins" y "gremlins". Esto destaca cómo los incentivos de entrenamiento afectan el comportamiento de la IA. ¿Qué otros secretos esconde esta tecnología?

OpenAI aclara su postura sobre la controversia de sesgo anti-goblin y su origen
NeboAI Te resumo la noticia con datos, cifras y contexto
EN 30 SEGUNDOS

EN 1 ORACIÓN

SENTIMIENTO
Neutro

𒀭
NeboAI está trabajando, aguarda un instante...
Preparando análisis detallado
Resumen rápido completado
Extrayendo datos, cifras y citas...
Identificando protagonistas y contexto
ANÁLISIS DETALLADO
COMPARTIR

NeboAI produce ediciones automáticas de textos periodísticos en forma de resúmenes y análisis. Sus resultados experimentales están basados en inteligencia artificial. Por tratarse de una edición de IA, los textos eventualmente pueden contener errores, omisiones, establecer relaciones equivocadas entre datos y otras inexactitudes imprevistas. Recomendamos chequear la edición.

Un reciente informe de Wired ha revelado una peculiar instrucción incorporada en Codex CLI, una herramienta de codificación basada en inteligencia artificial. La indicación establece que el modelo no debe mencionar criaturas como goblins, gremlins o trolls a menos que sea absolutamente relevante para la consulta del usuario.

OpenAI se pronunció sobre este tema en un blog titulado "De dónde vinieron los goblins". En su publicación, se explica que el comportamiento del modelo se deriva de varios incentivos, incluyendo la personalización de la personalidad "nerd". La empresa reconoce que, sin darse cuenta, se otorgaron altas recompensas por el uso de metáforas relacionadas con criaturas, lo que provocó que el lenguaje del modelo incluyera referencias a goblins de forma incontrolada.

A pesar de que se intentó limitar este rasgo a una pequeña peculiaridad del "nerd", el blog aclara que el aprendizaje por refuerzo no garantiza que los comportamientos aprendidos se mantengan dentro de los límites deseados. Como resultado, las conversaciones de GPT, incluso sin la personalidad "nerd", fueron afectadas por esta tendencia a mencionar goblins.

Además, se ofrece un comando que permite eliminar la restricción contra la mención de goblins para aquellos que disfrutan de esta peculiaridad. Este fenómeno resalta cómo las señales de recompensa pueden influir en el comportamiento de los modelos de manera inesperada.

¿Quieres leer la nota completa? Accede al artículo original con todos los detalles.
Leer Artículo Original
TL;DR

Este artículo es un resumen original con fines informativos. Créditos de imagen y cobertura completa en la fuente original. · Ver Política de contenidos

Redacción
Redacción Equipo EsportsAMA

El equipo de redacción de EsportsAMA está formado por apasionados del gaming competitivo y los esports. Cubrimos a diario las principales noticias del sector, desde fichajes y torneos hasta novedades de tus juegos favoritos, con foco en la escena española y latinoamericana.

Presiona Enter para buscar o ESC para cerrar