Operai Patches Chatgpt después de que comenzó a aplaudir malas ideas

OpenAi tiene publicado Un postmortem sobre los problemas de la skoting recientes con el modelo AI predeterminado que alimenta el CHATGPT, GPT-4O, después de que los usuarios informaron que el modelo se volvió demasiado validado y agradable después de una actualización la semana pasada. La compañía retrocedió la actualización durante el fin de semana y anunció que estaba trabajando en «soluciones adicionales» a la personalidad del modelo.

Los usuarios en las redes sociales notaron que ChatGPT comenzó a responder de una manera demasiado halagadora, con algunas capturas de pantalla del modelo aplaudiendo decisiones e ideas problemáticas y peligrosas. CEO Sam Altman admitido El problema el domingo, afirmando que OpenAi funcionaría en las correcciones «lo antes posible». Según OpenAI, la actualización tenía la intención de hacer que la personalidad predeterminada del modelo «se sintiera más intuitiva y efectiva», pero fue influenciada demasiado por «comentarios a corto plazo» y no contabilizó cómo las interacciones de los usuarios con ChatGPT evolucionan con el tiempo.

Openai declaró en una publicación de blog que «GPT-4O se sesgó hacia las respuestas que eran demasiado de apoyo pero falsas» como resultado de la actualización. La compañía reconoció que las interacciones sycofánticas pueden ser «incómodas, inquietantes y causar angustia», y admitió haber alcanzado sus objetivos. Para abordar el problema, OpenAI está refinando sus técnicas básicas de capacitación de modelos y las indicaciones del sistema para alejar a GPT-4O de la sycophancy.

6 técnicas para arreglar los molestos hábitos de Chatgpt

La compañía también está implementando barandillas de seguridad adicionales para aumentar la honestidad y la transparencia del modelo, y ampliando sus evaluaciones para identificar problemas más allá de la skicancia. Además, Openai está experimentando con formas de permitir a los usuarios dar «comentarios en tiempo real» para influir directamente en sus interacciones con ChatGPT y elegir entre múltiples personalidades de ChatGPT.

Operai está explorando nuevas formas de incorporar comentarios más amplios y democráticos en los comportamientos predeterminados de ChatGPT, con el objetivo de reflejar diversos valores culturales en todo el mundo y comprender cómo los usuarios quieren que ChatGPT evolucione. La compañía cree que los usuarios deberían tener más control sobre cómo se comporta el chatgpt y hacer ajustes si no están de acuerdo con el comportamiento predeterminado.

Crédito de imagen destacado