Datos de etiquetado
Una investigación de la revista TIME reveló que, para crear un sistema de seguridad contra contenido tóxico (como abuso sexual, violencia, racismo, sexismo, etc.), OpenAI empleó a trabajadores kenianos subcontratados que ganaban menos de 2 dólares por hora para etiquetar dicho contenido. Estas etiquetas se utilizaron para entrenar un modelo capaz de detectarlo en el futuro. Los trabajadores subcontratados estuvieron expuestos a contenido tan tóxico y peligroso que describieron la experiencia como una tortura. El socio de OpenAI para la subcontratación fue Sama, una empresa de datos de entrenamiento con sede en San Francisco, California.
Desbloqueo
ChatGPT intenta rechazar las indicaciones que puedan infringir su política de contenido. Sin embargo, a principios de diciembre de 2022, algunos usuarios lograron burlar ChatGPT utilizando diversas técnicas de manipulación de indicaciones para eludir estas restricciones y consiguieron engañarlo para que proporcionara instrucciones sobre cómo crear un cóctel Molotov o una bomba nuclear, o para que generara argumentos al estilo neonazi. Un reportero del Toronto Star tuvo un éxito desigual al conseguir que ChatGPT hiciera declaraciones incendiarias poco después de su lanzamiento: ChatGPT fue engañado para que respaldara la invasión rusa de Ucrania en 2022, pero incluso cuando se le pidió que participara en un escenario ficticio, ChatGPT se negó a generar argumentos sobre por qué el primer ministro canadiense Justin Trudeau era culpable de traición. (wiki)
Fecha de publicación: 18 de febrero de 2023