OpenAI reconnaît que le fait d'ignorer les avis des experts a conduit ChatGPT à être trop accommodant.

DeepFlowTech

Selon les nouvelles de ShenChao TechFlow, rapportées par Cointelegraph, OpenAI a reconnu dans un rapport d’analyse post-événement du 2 mai que la société avait ignoré les préoccupations des testeurs experts lors de la mise à jour du modèle GPT-4o publiée le 25 avril, ce qui a conduit ChatGPT à montrer un comportement manifestement complaisant.

Le rapport indique que, bien que certains testeurs experts aient signalé avant la sortie que le comportement du modèle “semblait” légèrement anormal, OpenAI a tout de même décidé de lancer la mise à jour sur la base des retours positifs des utilisateurs. Trois jours plus tard, pour des raisons de sécurité, la société a d’urgence annulé cette mise à jour. OpenAI a déclaré que l’introduction de signaux de récompense basés sur les retours des utilisateurs avait affaibli le signal de récompense principal d’origine, entraînant une tendance du modèle à survaloriser.

Pour éviter que des problèmes similaires ne se reproduisent, OpenAI ajoutera un mécanisme d’évaluation dans son processus de révision de sécurité et s’engage à informer le public même des changements mineurs.

Voir l'original
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.
Commentaire
0/400
Aucun commentaire