モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。

TAG LIST
CG機械学習CGへの扉ディープラーニング安藤幸央GAN月刊エンタメAIニュース河合律子OpenAI音楽NVIDIAニューラルネットワーク強化学習三宅陽一郎吉本幸記Facebook人工知能学会自然言語処理大内孝子QA敵対的生成ネットワークGoogleGPT-3キャラクターAIスクウェア・エニックス森川幸人モリカトロンAIラボインタビュールールベースDeepMindシナリオAIと倫理グーグル映画倫理NFTDALL-E2StyleGAN自動生成デバッグゲームプレイAIメタAIロボット深層学習マイクロソフトCEDEC2019アートプロシージャルSIGGRAPH遺伝的アルゴリズムDALL-Eテキスト画像生成ビヘイビア・ツリーディープフェイクCEDEC2021CEDEC2020ゲームAIデジタルツインメタバース不完全情報ゲームVRナビゲーションAINPC畳み込みニューラルネットワークCLIPGDC 2021JSAI2022VFXGDC 2019マルチエージェントCEDEC2022ボードゲーム画像生成ファッション懐ゲーから辿るゲームAI技術史toioCNNAdobeテストプレイモリカトロンStable DiffusionUnity著作権AIアート小説鴫原盛之HTN階層型タスクネットワークJSAI2020TensorFlowBERTMicrosoftイベントレポート対話型エージェントロボティクス水野勇太アニメーションGenvid Technologiesガイスター画像生成AIStyleGAN2GTC2022教育ソニーJSAI2021スポーツ研究シムピープルマンガ汎用人工知能マーケティングGDC SummerインタビューバーチャルヒューマンブロックチェーンMidjourneyアストロノーカキャリアNVIDIA OmniverseeスポーツAmazoneSportsDQNBLUE PROTOCOLシーマンMinecraftアバターOmniverseUbisoftメタAlphaZeroTransformerGPT-2AIりんなカメラ環世界中島秀之哲学理化学研究所DARPAドローンシムシティImagenバイアスMCS-AI動的連携モデルモーションキャプチャーTEZUKA2020AI美空ひばり手塚治虫バンダイナムコ研究所スパーシャルAIElectronic ArtsメタデータLEFT 4 DEAD通しプレイOpenAI Five本間翔太CMピクサープラチナエッグイーサリアム作曲ボエダ・ゴティエビッグデータ中嶋謙互Amadeus Codeデータ分析Microsoft AzureMILEナラティブアーケードゲームOmniverse ReplicatorWCCFレコメンドシステムNVIDIA DRIVE SimWORLD CLUB Champion FootballNVIDIA Isaac Simセガ柏田知大軍事サイバーエージェント田邊雅彦トレーディングカードトレカ音声認識PyTorch眞鍋和子バンダイナムコスタジオaibo合成音声Meta齊藤陽介マインクラフトお知らせMagic Leap Oneチャットボットサルでもわかる人工知能VAE3DCGリップシンキングUbisoft La Forge自動運転車ワークショップ知識表現ウォッチドッグス レギオンIGDA秋期GTC2022どうぶつしょうぎEpic Gamesジェイ・コウガミ音楽ストリーミングMITAIロボ「迷キュー」に挑戦野々下裕子徳井直生マシンラーニング5GRival Peakクラウド対話エンジン斎藤由多加リトル・コンピュータ・ピープルコンピューティショナル・フォトグラフィーゴブレット・ゴブラーズ絵画rinnaシミュレーションデジタルヒューマン完全情報ゲーム坂本洋典釜屋憲彦ウェイポイントパス検索対談藤澤仁生物学GTC 2022画像認識SiemensStyleCLIPDeNA長谷洋平masumi toyota宮路洋一OpenSeaGDC 2022TextWorldSIGGRAPH ASIAEarth-2MagentaSFELYZA PencilGTC2021CycleGANデータマイニングNetHackはこだて未来大学キャラクターモーションフェイクニュースエージェントRPGSIGGRAPH 2022AIボイスアクターNVIDIA CanvasGPUALifeZork人工生命オルタナティヴ・マシンサウンドスケープASBS栗原聡ぱいどんテキスト生成不気味の谷ナビゲーションメッシュ松井俊浩ELYZAフルコトELYZA DIGEST3D音声合成西成活裕Apex LegendsELIZA群衆マネジメントNinjaコンピュータRPGライブビジネスアップルタウン物語新型コロナKELDIC周済涛メロディ言語清田陽司ゲームTENTUPLAYサイバネティックスMARVEL Future FightAstro人工知能史タイムラプスEgo4DAI哲学マップバスキア星新一日経イノベーション・ラボStyleGAN-XL敵対的強化学習StyleGAN3階層型強化学習GOSU Data LabGANimatorWANNGOSU Voice AssistantVoLux-GAN竹内将SenpAI.GGProjected GANMobalyticsSelf-Distilled StyleGAN馬淵浩希Cygamesニューラルレンダリング岡島学AWS SagemakerPLATO映像セリア・ホデント形態素解析frame.ioUXAWS LambdaFoodly誤字検出森山和道認知科学中川友紀子ゲームデザインSentencePieceアールティLUMINOUS ENGINELuminous ProductionsBlenderBot 3パターン・ランゲージ竹村也哉Meta AIちょまどマーク・ザッカーバーグGOAPWACULAdobe MAX 2021自動翻訳模倣学習AIライティングOmniverse AvatarAIのべりすとFPSNVIDIA RivaQuillBotマルコフ決定過程NVIDIA MegatronCopysmithNVIDIA MerlinJasperスタンフォード大学NVIDIA Metropolisパラメータ設計テニスバランス調整協調フィルタリング人狼知能テキサス大学AlphaDogfight TrialsAI Messenger VoicebotエージェントシミュレーションOpenAI CodexStarCraft IIHyperStyleMax CooperFuture of Life InstituteRendering with StyleメディアアートIntelDisney類家利直LAIKADisneyリサーチヴィトゲンシュタインRotomationGauGAN論理哲学論考GauGAN2京都芸術大学ドラゴンクエストライバルズ画像言語表現モデル不確定ゲームSIGGRAPH ASIA 2021PromptBaseDota 2モンテカルロ木探索ディズニーリサーチMitsuba2バンダイナムコネクサスソーシャルゲームEmbeddingワイツマン科学研究所ユーザーレビューGTC2020CG衣装mimicNVIDIA MAXINEVRファッションBaidu淡路滋ビデオ会議ArtflowERNIE-ViLGグリムノーツEponym古文書ゴティエ・ボエダ音声クローニング凸版印刷Gautier Boeda階層的クラスタリングGopherAI-OCR画像判定JuliusSIE鑑定ラベル付けTPRGOxia Palus大澤博隆バーチャル・ヒューマン・エージェントtoio SDK for UnityArt RecognitionSFプロトタイピングクーガー田中章愛実況パワフルサッカー石井敦銭起揚NHC 2021桃太郎電鉄茂谷保伯池田利夫桃鉄GDMC新刊案内パワサカマーベル・シネマティック・ユニバースコナミデジタルエンタテインメント成沢理恵MITメディアラボMCU岩倉宏介アベンジャーズPPOマジック・リープDigital DomainMachine Learning Project CanvasMagendaMasquerade2.0国立情報学研究所ノンファンジブルトークンDDSPフェイシャルキャプチャー石川冬樹サッカーモリカトロン開発者インタビュースパコン里井大輝Kaggle宮本茂則スーパーコンピュータバスケットボール山田暉松岡 聡Assassin’s Creed OriginsAI会話ジェネレーターTSUBAME 1.0Sea of ThievesTSUBAME 2.0GEMS COMPANYmonoAI technologyLSTMABCIモリカトロンAIソリューション富岳初音ミクOculusコード生成AISociety 5.0転移学習テストAlphaCode夏の電脳甲子園Baldur's Gate 3Codeforces座談会Candy Crush Saga自己増強型AItext-to-imageSIGGRAPH ASIA 2020COLMAPtext-to-3DADOPNVIDIA GET3DデバッギングBigGANGANverse3DDreamFusionMaterialGANRNNグランツーリスモSPORTAI絵師ReBeLグランツーリスモ・ソフィーUGCGTソフィーPGCVolvoFIAグランツーリスモチャンピオンシップStability AINovelAIRival PrakDGX A100NovelAI DiffusionVTuberユービーアイソフトWebcam VTuberモーションデータ星新一賞北尾まどかHALO市場分析ポーズ推定将棋メタルギアソリッドVフォートナイトメッシュ生成FSMメルセデス・ベンツRobloxMagic Leapナップサック問題Live NationEpyllion汎用言語モデルWeb3.0マシュー・ボールAIOpsムーアの法則SpotifyスマートコントラクトReplica StudioAWSamuseChitrakarQosmoAdobe MAX 2022巡回セールスマン問題Adobe MAXジョルダン曲線メディアAdobe ResearchMuZero政治Galacticaクラウドゲーミングがんばれ森川君2号pixiv和田洋一リアリティ番組映像解析Stadiaジョンソン裕子セキュリティMILEsNightCafe東芝デジタルソリューションズインタラクティブ・ストリーミングLuis RuizSATLYS 映像解析AIインタラクティブ・メディアポケモン3DスキャンCodexPFN 3D Scanシーマン人工知能研究所東京工業大学Ludo博報堂Preferred NetworksラップPFN 4D ScanSIGGRAPH 2019ArtEmisZ世代DreamUpAIラッパーシステムDeviantArtARWaifu DiffusionGROVERプラスリンクス ~キミと繋がる想い~元素法典FAIRSTCNovel AIチート検出Style Transfer ConversationOpen AIオンラインカジノRCPMicrosoft DesignerアップルRealFlowRinna Character PlatformイラストiPhoneCALADeep FluidsSoul Machines柿沼太一MeInGameAmeliaELSIAIGraphブレイン・コンピュータ・インタフェースバーチャルキャラクター大規模言語モデルBCIGateboxアフォーダンスLearning from VideoANIMAKPaLM-SayCan予期知能逢妻ヒカリPaLMセコムGitHub Copilotユクスキュルバーチャル警備システムCode as Policiesカント損保ジャパンCaP上原利之ドラゴンクエストエージェントアーキテクチャアッパーグラウンドPAIROCTOPATH TRAVELER西木康智OCTOPATH TRAVELER 大陸の覇者アルスエレクトロニカ2019品質保証StyleRigAutodesk逆転オセロニアBentley Systemsワールドシミュレーター奥村エルネスト純いただきストリートH100齋藤精一大森田不可止COBOL高橋智隆DGX H100ロボユニザナックDGX SuperPOD泉幸典仁井谷正充クラウドコンピューティングロボコレ2019Instant NeRFartonomousbitGANsぎゅわんぶらあ自己中心派Azure Machine Learning意思決定モデル脱出ゲームHybrid Reward Architectureコミュニティ管理ウロチョロスSuper PhoenixSNSProject Malmoオンラインゲーム気候変動Project PaidiaProject Lookoutマックス・プランク気象研究所Watch Forビョルン・スティーブンスBing気象モデルLEFT ALIVE気象シミュレーション長谷川誠ジミ・ヘンドリックス環境問題Baby Xカート・コバーンエコロジーロバート・ダウニー・Jr.エイミー・ワインハウスSDGsYouTubeダフト・パンクメモリスタGlenn MarshallThe Age of A.I.Story2Hallucination音声変換レコメンデーションJukebox松尾豊Veap JapanEAPテンセントSIFT福井千春DCGAN医療MOBADANNCEメンタルケア人事ハーバード大学Edgar Handy研修デューク大学Netflixmynet.aiローグライクゲーム東京大学東京理科大学人工音声NeurIPS 2021産業技術総合研究所リザバーコンピューティングプレイ動画ヒップホップソニーマーケティングサイレント映画もじぱNBA環境音暗号通貨現代アートFUZZLEAlteration粒子群最適化法進化差分法オープンワールド群知能下川大樹AIFAウィル・ライト高津芳希P2E大石真史BEiTStyleGAN-NADAレベルデザインDETRゲームエンジンSporeUnreal Engineデノイズ南カリフォルニア大学Unity for Industry画像処理SentropyGLIDECPUDiscordAvatarCLIPSynthetic DataCALMプログラミングサム・アルトマンソースコード生成LaMDAGMAIシチズンデベロッパーSonanticTRPGGitHubCohereウィザードリィMCN-AI連携モデルマジック:ザ・ギャザリングAI DungeonUrzas.ai介護西川善司並木幸介Kikiサムライスピリッツ森寅嘉Zoetic AIゼビウスSIGGRAPH 2021ペットストリートファイター半導体Digital Dream LabsTopaz Video Enhance AICozmoDLSSタカラトミー山野辺一記NetEaseLOVOT大里飛鳥DynamixyzMOFLINRomiU-Netミクシィ13フェイズ構造アドベンチャーゲームユニロボットADVユニボXLandGatoAGI手塚眞DEATH STRANDINGマルチモーダルEric Johnson汎用強化学習AIデザインOculus Questコジマプロダクションロンドン芸術大学生体情報デシマエンジンGoogle BrainインディーゲームSound Control写真高橋ミレイSYNTH SUPER照明Maxim PeterKarl SimsJoshua RomoffArtnomeハイパースケープICONATE山崎陽斗深層強化学習立木創太松原仁浜中雅俊ミライ小町武田英明テスラ福井健策GameGANパックマンTesla BotNEDOTesla AI DayWikipediaソサエティ5.0SphereSIGGRAPH 2020バズグラフXaver 1000ニュースタンテキ養蜂東芝BeewiseDIB-R倉田宜典フィンテック投資韻律射影MILIZE広告韻律転移三菱UFJ信託銀行

【秋期GTC2022】3Dポーズ推定とメッシュ生成に関するNVIDIA最新研究を紹介

2022.10.28先端技術

【秋期GTC2022】3Dポーズ推定とメッシュ生成に関するNVIDIA最新研究を紹介

2022年9月19日から22日にかけてNVIDIA主催の技術カンファレンス「GTC 2022 Fall」が開催されました。22日には「NVIDIAのコンピュータビジョン研究:AIを使って人間を認識する」と題されたセッションが行われました。本稿ではこのセッションを要約することで、ポーズ推定とメッシュ生成に関するNVIDIAの最新研究を紹介します。

2.5Dからの3Dポーズ推定

以上のセッションの発表者であるNVIDIAでラーニング&パーセプション・リサーチ担当バイスプレジデントを務めるジャン・カウツ(Jan Kautz)氏は、画像認識における研究領域のひとつであるポーズ推定を解説することから発表を始めました。ポーズ推定とは、人間が立っている、歩いている、座っているといった姿勢を認識するAIに関する研究を意味します。この研究の応用範囲はロボット工学、自動運転時の歩行者検出、見守りカメラなどにおける転倒検出、スポーツにおける動作分析と多岐に及びます。

ポーズ推定の従来研究では、XY座標で構成された2D画像からXYZ座標で表現される3Dの姿勢を推定することに取り組んでいました。しかし、このアプローチでは推定過程で欠落する情報が多いため、高精度の推定は実現できませんでした。こうしたなかカウツ氏が試みたのが、2.5D画像からの3Dポーズ推定でした。2.5D画像とは、xy座標に(ポーズ推定研究ではキージョイントと呼ばれる)肩や頭のようなポーズを構成する重要な身体部位のあいだの相対的な位置関係に関する座標情報を加えたものです。2.5Dという言わば2Dと3Dの中間的な処理過程を加えると、2Dからの推定と比較して情報の欠落が少なくなります。

2.5D画像から3Dポーズを推定するAIモデルの訓練に使う学習データとして、カウツ氏はキージョイントに関するラベルを付与した2D画像とモーションキャプチャ等によって収集した3Dポーズデータを用意しました。2種類の学習データを用意したのは、2D画像データだけでは奥行に関する学習が不足するからでした。

以上のような学習データによって訓練したAIモデルはポーズ全体を推定できる一方で、キージョイントの正確な位置を推定できないという難点がありました。この難点を克服するために、カウツ氏はキージョイントの位置をその確率分布に対応したヒートマップで算出する処理を加えました。

2.5D画像から3Dポーズを精確に推定できるようになっても、推定されたポーズの奥行に関する情報はキージョイント間の相対的位置に留まります。相対的な奥行情報から3D空間内の絶対的座標への変換は、カメラの位置情報とキージョイント間の相対的位置情報を使って算出できます。こうして2.5D画像から3Dポーズを推定するAIモデルは完成したのでした。

ポーズ推定モデルの発展

以上に解説したポーズ推定モデルには、前述したように2種類の学習データを用いました。そのうち3Dポーズデータは、収集するのにコストがかかるという難点があります。より安価にモデルを開発するためには、可能であれば2D学習データのみで訓練できるのが望ましいです。

カウツ氏は、3Dポーズデータを用いない訓練方法としてマルチビュー画像を使った訓練を試みました。マルチビュー画像とは、単一の動作を複数のカメラから撮影した画像データセットを指します。このデータセットは複数の固定カメラを設置して日々の動作を撮影すれば収集できるので、モーションデータより簡単に用意できます。こうして用意した画像を使えば、2D画像であっても精確に奥行情報を推定できるようになるのです。

3Dポーズ推定モデルを活用すれば、任意のポーズに関する3Dメッシュを生成できます。例えばフェンシングの剣技のひとつである「突き」と推定されたポーズから、突きをしている競技者に関するメッシュを生成できるのです。こうしたメッシュ生成は、ポーズを推定後、標準的な身体に関するメッシュを使って言わばポーズに肉付けすることで実現します。

以上のメッシュ生成は標準的な身体メッシュにもとづいているため、極端に太っていたり痩せていたりするメッシュを直接的に生成できないという制約があります。標準から外れた体格のメッシュを制作するには、標準的なメッシュを生成後に手作業で体格を修正する必要があるでしょう。

移動カメラで撮影したオクルージョンのある動画からのメッシュ生成

カウツ氏は、移動カメラで撮影した動画から複雑な動作に関するメッシュを連続的に生成するAIモデルの開発過程についても発表しました。このAIモデルに対する入力動画として想定されているのは、複数のダンサーが複雑にダンスしている様子を移動カメラによって撮影したものです。ダンスパートの多いミュージックビデオを典型例としたこうした入力動画では、腕や脚によって身体の一部が見えなくなったり、あるダンサーがほかのダンサーの陰になって見えなくなったりする「オクルージョン(occlusion:「遮蔽」と訳せる)」が頻繁に起こるので、連続的なポーズ推定が非常に困難となります。

以上のようなオクルージョンに対応した連続的メッシュ生成モデルを開発するにあたって、以下のような複数の処理を実行するアーキテクチャが考案されました。

  • 個々のポーズを推定する処理
  • オクルージョンが生じて見えなくなったポーズを生成する処理
  • 推定したポーズと生成したポーズを整合的につなぎ合わせる処理
  • つなぎ合わせたポーズにカメラの位置移動に関する情報を加味する処理

3つ目の処理にあたる推定したポーズと生成したポーズをつなぎ合わせる処理には、任意のポーズから次の動作を予測できるという知見が活用されています。例えば以下の画像のようなポーズが与えられると、地面が描画されていなくても後ろ歩きをしている途中にあると推定できます。

カウツ氏が開発した連続的メッシュ生成モデルと同様のタスクを実行する既存モデルを比較したところ、同氏開発モデルが既存モデルを大きく上回る結果となりました。同氏開発モデルが生成したメッシュを表示している以下の左側画像はダンサーのダンスが忠実に再現されているのに対して、既存モデルの生成結果を表示した右側画像ではダンサーの脚が地面にめり込むという明らかな不具合が生じています。

手先のポーズ推定

以上に紹介したポーズ推定とメッシュ生成は、いずれも身体全体を対象としたものでした。ポーズ推定に関しては、手先のような特定の身体部位を対象とした場合にも前述の3Dポーズ推定モデルが流用できます。手先のポーズ推定についての学習データでも、2D画像と3Dポーズデータの2種類が必要となります。もっとも、3Dポーズデータはフィジカルな手から採取するのでなく、手先を再現した3Dシミュレーションから人工的に生成して収集できます。

しかしながら、3Dポーズ推定モデルの流用だけでは複雑な形状をしている手先を高精度に推定できません。というのも、手先の複雑な形状を推定するのに必要な奥行情報が不足してしまうからです。高精度に手先のポーズを推定するためにカウツ氏が追加した処理は、手先の生体力学的メカニズムから推定されるポーズを限定するというものでした。具体的には標準的な指の相対的な位置関係や関節の可動域にもとづいて、推定されるポーズを絞り込みました。

以上に紹介したポーズ推定とメッシュ生成に関するNVIDIAの最新研究は、いずれもその研究領域における最高水準を実現しています。こうした研究成果は、Omniverseをはじめとする同社の製品やソリューションにおいて実用化されることでしょう。

Writer:吉本幸記

RELATED ARTICLE関連記事

【JSAI2022】創作が人間の特権でなくなった世界における著作権の行方

2022.7.19先端技術

【JSAI2022】創作が人間の特権でなくなった世界における著作権の行方

AIキャラ育成やAI生成クエスト制覇で稼ぐ。AI駆動型NFTゲームの試み

2022.5.24先端技術

AIキャラ育成やAI生成クエスト制覇で稼ぐ。AI駆動型NFTゲームの試み

サッカーからドローンレースまで。各社が開発するフィジカルスポーツプレイAIを紹介

2020.10.30先端技術

サッカーからドローンレースまで。各社が開発するフィジカルスポーツプレイAIを紹介

RANKING注目の記事はこちら