OpenAi parece estar deprimiendo el contenido de Reddit para capacitar a ChatGPT, lo que indica un género hacia fuentes de información más confiables y verificables. Esta decisión refleja un cambio fundamental en cómo se está desarrollando el modelo AI, priorizando la precisión sobre los datos de conversación de crowdsourcing.
La razón del cambio
Durante años, Reddit fue un recurso valioso para la capacitación de IA porque su amplia gama de discusiones proporcionó un estilo natural y conversacional que ayudó a los modelos a aprender el diálogo. Sin embargo, estos datos también incluyeron inconvenientes significativos, como información errónea, contenido de baja calidad y usuarios que intentan activamente manipular las discusiones para influir en las respuestas de la IA. Este cambio reportado es parte de una tendencia de la industria más amplia que presenta el uso de fuentes de datos confiables y verificables. El objetivo es mejorar la precisión del contenido generado por IA, reducir la propagación de la información errónea y hacer que los modelos sean más difíciles de manipular.
Lo que esto significa para los usuarios
El cambio de Reddit implica una compensación. Los usuarios pueden esperar recibir respuestas más consistentes y basadas en hechos de Chatgpt. Por otro lado, la extraña personalidad impulsada por la comunidad que el contenido diverso de Reddit aportó a las respuestas del modelo puede desvanecerse con el tiempo. Este enfoque en la credibilidad subraya el futuro del desarrollo de la IA, donde la transparencia y la confianza en los datos de capacitación se están volviendo esenciales. A medida que los modelos de IA están cada vez más integrados en los entornos profesionales, académicos y empresariales, la demanda de confiabilidad tiene prioridad sobre la naturaleza caótica e impredecible de los foros en línea no vetidos.