最近、Anuttaconによるキャラクター表現AIの開発に関する興味深いニュースを見ました。Anuttaconは、miHoYoの創設者である蔡昊宇(Tsai Haoyu)が設立したAI企業です。



彼らは最近、LPM 1.0をリリースしました。これは、キャラクターの動画表現モデルで、かなり驚くべきものです。このシステムは、キャラクターが同時に話す、歌う、聞く、反応を示すことをリアルタイムで可能にします。さらに、口の動きや表情、身体の動きも非常に自然で、人工的に見えません。

技術的な観点から見ると、彼らは17億パラメータの基本モデルを使用し、低遅延のストリーミングバージョンに調整しています。良い点は、多様なキャラクタースタイルに対応していることです。リアルな外観、2Dアニメーション、3Dゲーム、さらには非人間の生き物まで、追加の調整なしで対応可能です。

私が気づいた点は、AnuttaconがLPM-Benchという評価基準を公開しており、市場の他のモデルと比較して多くの指標で最良の結果を出していることです。重要な違いは、LPM 1.0はコンテンツを無制限に出力できる点で、他の選択肢は30秒に制限されているのに対し、無制限です。

彼らの関心のある用途は非常に明確です。ゲーム内のNPC会話の代理やバーチャルライブ配信など、潜在的な応用例が多いです。特に、miHoYoや他のゲーム会社にとっては大きな可能性があります。

ただし、Anuttaconはこのリリースはあくまで学術交流のためであり、現時点ではオープンソース化やAPIの一般公開は予定していないと明言しています。コミュニティの大半は、主な目的はAI人材の獲得にあると考えています。

振り返ると、LPM 1.0は、AnuttaconのAIの進化における次のステップであり、ゲームエンジンやインテリジェントNPCの分野での進展を示しています。また、AnuNekoチャットツールから基本モデルの能力に至るまで、miHoYoのAI開発の成果の一つとも言えます。蔡昊宇と彼のチームは、AIキャラクターの分野で重要な何かを創り出そうとしているようです。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン