アリババ、新しい特許を公開 推論能力を向上させるモデル

robot
概要作成中

企查查アプリによると、最近、アリババ(中国)有限公司が「データ処理方法および装置、ターゲット質問応答モデルの訓練方法および装置」の特許を申請公開しました。特許の要約によると、そのデータ処理方法は以下を含みます:
初期テキストペアにおいて、初期テキストに対応する初期テキスト処理結果を調整し、更新されたテキスト処理結果を取得します。そして、初期テキストおよび更新されたテキスト処理結果に基づき、更新されたテキストペアを構築します;
更新されたテキストペアに基づき、初期テキスト処理モデルを更新し、参照テキスト処理モデルを取得します;
初期テキストペアに基づき、初期テキスト処理モデルおよび参照テキスト処理モデルを利用して、それぞれ複数の語元に対応する予測損失結果と参照損失結果を取得します;
予測損失結果および参照損失結果に基づき、各語元の損失変化結果を決定します;
各語元の損失変化結果に基づき、データ処理タスクを実行します;
語元の区別を実現し、語元の区別に基づいて重点推論を行える監督微調整を行うことで、モデルの推論能力を向上させます。(人民財訊)

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン