ChainCatcher-Nachricht, das Dezentralisierung AI-Infrastrukturunternehmen Gata hat die Einführung des globalen großangelegten echten Benutzer-ChatGPT-Datensatzes ChatGPT-RealUser-2.2M angekündigt. Dieser Datensatz wurde über Gata’s GPT-to-Earn-Programm (freiwillige Teilnahme der Benutzer) gesammelt und umfasst insgesamt über 2,24 Millionen echte Dialoge und fast 3,56 Millionen Frage-Antwort-Paare, die von über 15.000 echten Benutzern stammen und Interaktionen mit GPT-3.5, GPT-4 und o1 abdecken. Laut Angaben ist dieser Datensatz etwa doppelt so groß wie frühere ähnliche Datensätze des Allen Institute for AI, umfasst reale Szenarien, mehrstufige Dialoge und enthält aufgrund der on-chain Anreizmechanismen eine große Anzahl an kryptowährungsbezogenen Interaktionen. Die Vorschauversion ist auf Hugging Face verfügbar und enthält 600 Dialogproben, der vollständige Datensatz kann für Forschungs- und kommerzielle Anwendungen verwendet werden. Berichten zufolge kündigte Gata im Mai 2025 den Abschluss einer Seed-Runde in Höhe von insgesamt 4 Millionen US-Dollar an, an der unter anderem YZi Labs und IDG Blockchain beteiligt waren.