06:38
影の図書館であるAnna's Archivesは、359テラバイトの電子書籍を受け取り、大規模な言語モデル企業への独占的な早期アクセスを提供しています
IT Houseによると、影の図書館「Anna's Archive」の公式ブログは現地時間の10月4日、同サイトが合計359テラバイトの7億5000万冊以上の「ユニークな」電子書籍を入手し、高品質の書籍OCR(光学式文字認識)とテキスト抽出を取得するために、一連の大規模言語モデル企業への独占的な早期アクセスを提供する意向を表明したと発表しました。
「Anna's Archive」はブログで、Reading ShowはSuperstar Digital Libraryが作成した大量のスキャン図書(主に学術書)のデータベースであり、大学や図書館がデジタル形式で利用できるようになっていると説明しています。 「アンナのアーカイブ」は、大量に入手することを望んでいたと述べており、数か月のフルタイムの仕事を割り当てられました。
- 2

