モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。
- TAG LIST
- CGCGへの扉機械学習安藤幸央ディープラーニング月刊エンタメAIニュースGAN河合律子OpenAINVIDIA音楽吉本幸記ニューラルネットワーク三宅陽一郎強化学習GoogleQAグーグルDeepMindGPT-3Facebook自然言語処理人工知能学会大内孝子森川幸人敵対的生成ネットワークシナリオキャラクターAIスクウェア・エニックスモリカトロンAIラボインタビューマイクロソフトルールベースStable DiffusionAIと倫理アート映画デバッグNFTDALL-E2StyleGAN倫理ゲームプレイAI自動生成SIGGRAPHモリカトロンメタAIテキスト画像生成ロボット深層学習ファッションCEDEC2019プロシージャルVFXデジタルツイン遺伝的アルゴリズムテストプレイNPCDALL-ECLIP画像生成大規模言語モデルChatGPTビヘイビア・ツリーディープフェイクCEDEC2021CEDEC2020ゲームAIメタバース不完全情報ゲームVRナビゲーションAI画像生成AIボードゲーム畳み込みニューラルネットワークGDC 2021JSAI2022生成系AIAdobeGDC 2019マルチエージェントCEDEC2022著作権AIアート懐ゲーから辿るゲームAI技術史toioジェネレーティブAICNNMicrosoftNVIDIA OmniverseUnity小説アニメーション鴫原盛之HTN階層型タスクネットワークマンガ汎用人工知能JSAI2020GTC2023TensorFlowインタビューバーチャルヒューマンBERTMidjourneyイベントレポート対話型エージェントAmazonロボティクスMetaMinecraft水野勇太アバターOmniverse3DCGUbisoftGenvid TechnologiesガイスターStyleGAN2GTC2022教育ソニーJSAI2021スポーツ研究シムピープルMCS-AI動的連携モデルマーケティングGDC SummerLLMブロックチェーン作曲アストロノーカキャリアeスポーツスタンフォード大学サイバーエージェント音声認識eSportsDQNBLUE PROTOCOLシーマンStability AIメタAlphaZeroTransformerGPT-2rinnaAIりんなデジタルヒューマンカメラ環世界中島秀之PaLM哲学ベリサーブPlayable!理化学研究所SIGGRAPH ASIANetflix東京大学DARPAドローンシムシティImagenZorkバイアスモーションキャプチャーTEZUKA2020AI美空ひばり手塚治虫テキスト生成バンダイナムコ研究所スパーシャルAIElectronic Arts3DメタデータLEFT 4 DEAD通しプレイOpenAI Five本間翔太CMAudio2Faceピクサープラチナエッグイーサリアムボエダ・ゴティエビッグデータ中嶋謙互Amadeus Codeデータ分析Microsoft AzureMILE模倣学習ナラティブNVIDIA RivaアーケードゲームOmniverse ReplicatorWCCFレコメンドシステムNVIDIA DRIVE SimWORLD CLUB Champion FootballNVIDIA Isaac Simセガ柏田知大軍事田邊雅彦トレーディングカードトレカメディアアートGPTPyTorch眞鍋和子バンダイナムコスタジオaibo合成音声齊藤陽介マインクラフトお知らせMagic Leap Oneチャットボットサルでもわかる人工知能VAEDreamFusionリップシンキングUbisoft La Forge自動運転車ワークショップ知識表現ウォッチドッグス レギオンIGDA秋期GTC2022市場分析どうぶつしょうぎEpic Gamesジェイ・コウガミ音楽ストリーミングMITAIロボ「迷キュー」に挑戦AWS野々下裕子徳井直生マシンラーニング5GMuZeroRival Peakpixivクラウド対話エンジン斎藤由多加リトル・コンピュータ・ピープルCodexコンピューティショナル・フォトグラフィーゴブレット・ゴブラーズ絵画ARMicrosoft Designerイラストシミュレーション完全情報ゲーム坂本洋典釜屋憲彦ウェイポイントパス検索対談藤澤仁生物学GTC 2022画像認識GPT-3.5SiemensStyleCLIPDeNA長谷洋平masumi toyota宮路洋一OpenSeaGDC 2022Gen-1TextWorldEarth-2BingMagenta音楽生成AISFELYZA Pencil松尾豊GTC2021CycleGANテンセントデータマイニングNetHackはこだて未来大学Bardキャラクターモーションフェイクニュース現代アートエージェントRPGSIGGRAPH 2022レベルデザインAIボイスアクターNVIDIA CanvasGPUALife人工生命オルタナティヴ・マシンサウンドスケープLaMDATRPGAI DungeonプロンプトASBS栗原聡ぱいどんアドベンチャーゲーム不気味の谷ナビゲーションメッシュ松井俊浩ELYZAフルコトELYZA DIGEST建築音声合成NeRF西成活裕Apex LegendsELIZA群衆マネジメントライブポートレイトNinjaコンピュータRPGライブビジネスWonder Studioアップルタウン物語新型コロナ土木KELDIC周済涛BIMメロディ言語清田陽司インフラゲームTENTUPLAYサイバネティックスMARVEL Future FightAstro人工知能史Amazon BedrockタイムラプスEgo4DAI哲学マップイーロン・マスクバスキア星新一X.AI日経イノベーション・ラボStyleGAN-XLX Corp.敵対的強化学習StyleGAN3Twitter階層型強化学習GOSU Data LabGANimatorXホールディングスWANNGOSU Voice AssistantVoLux-GANMagi竹内将SenpAI.GGProjected GANStable Diffusion XLMobalyticsSelf-Distilled StyleGANSDXL馬淵浩希CygamesニューラルレンダリングRTFKT岡島学AWS SagemakerPLATONIKE映像セリア・ホデント形態素解析frame.ioClone XUXAWS LambdaFoodly村上隆誤字検出森山和道認知科学中川友紀子Digital MarkゲームデザインSentencePieceアールティSnapchatLUMINOUS ENGINEクリエイターコミュニティLuminous ProductionsBlenderBot 3バーチャルペットパターン・ランゲージ竹村也哉Meta AINVIDIA NeMo Serviceちょまどマーク・ザッカーバーグヴァネッサ・ローザGOAPWACULVanessa A RosaAdobe MAX 2021陶芸自動翻訳Play.ht音声AIAIライティングLiDAROmniverse AvatarAIのべりすとPolycamFPSQuillBotdeforumマルコフ決定過程NVIDIA MegatronCopysmith動画生成AINVIDIA MerlinJasperハーベストNVIDIA MetropolisForGamesパラメータ設計テニスゲームマーケットバランス調整岡野翔太協調フィルタリング郡山喜彦人狼知能テキサス大学ジェフリー・ヒントンGoogle I/O 2023AlphaDogfight TrialsAI Messenger VoicebotGoogle I/OエージェントシミュレーションOpenAI Codex武蔵野美術大学StarCraft IIHyperStyleMax CooperBingAIFuture of Life InstituteRendering with StyleIntelDisney類家利直FireflyLAIKADisneyリサーチヴィトゲンシュタインPhotoshopRotomationGauGAN論理哲学論考LightroomGauGAN2京都芸術大学Canvaドラゴンクエストライバルズ画像言語表現モデルChatGPT4不確定ゲームSIGGRAPH ASIA 2021PromptBaseBOOTHDota 2モンテカルロ木探索ディズニーリサーチpixivFANBOXMitsuba2バンダイナムコネクサス虎の穴ソーシャルゲームEmbeddingワイツマン科学研究所ユーザーレビューFantiaGTC2020CG衣装mimicとらのあなNVIDIA MAXINEVRファッションBaidu集英社淡路滋ビデオ会議ArtflowERNIE-ViLG少年ジャンプ+グリムノーツEponym古文書ComicCopilotゴティエ・ボエダ音声クローニング凸版印刷コミコパGautier Boeda階層的クラスタリングGopherAI-OCRゲームマスター画像判定Inowrld AIJuliusSIE鑑定ラベル付けMODTPRGOxia Palus大澤博隆Ghostwriterバーチャル・ヒューマン・エージェントtoio SDK for UnityArt RecognitionSFプロトタイピングSkyrimクーガー田中章愛実況パワフルサッカースカイリム石井敦銭起揚NHC 2021桃太郎電鉄RPGツクールMZ茂谷保伯池田利夫桃鉄ChatGPT_APIMZGDMC新刊案内パワサカダンジョンズ&ドラゴンズマーベル・シネマティック・ユニバースコナミデジタルエンタテインメントOracle RPG成沢理恵MITメディアラボMCU岩倉宏介深津貴之アベンジャーズPPOxVASynthマジック・リープDigital DomainMachine Learning Project CanvasLaser-NVMagendaMasquerade2.0国立情報学研究所TencentノンファンジブルトークンDDSPフェイシャルキャプチャー石川冬樹MERFサッカーモリカトロン開発者インタビュースパコンAlibaba里井大輝Kaggle宮本茂則スーパーコンピュータVQRFバスケットボール山田暉松岡 聡nvdiffrecAssassin’s Creed OriginsAI会話ジェネレーターTSUBAME 1.0NeRFMeshingSea of ThievesTSUBAME 2.0LERFGEMS COMPANYmonoAI technologyLSTMABCIマスタリングモリカトロンAIソリューション富岳TikTok初音ミクOculusコード生成AISociety 5.0リアム・ギャラガー転移学習テストAlphaCode夏の電脳甲子園グライムスBaldur's Gate 3Codeforces座談会BoomyCandy Crush Saga自己増強型AItext-to-imageジョン・レジェンドSIGGRAPH ASIA 2020COLMAPtext-to-3Dザ・ウィークエンドADOPNVIDIA GET3DドレイクデバッギングBigGANGANverse3DMaterialGANRNNグランツーリスモSPORTAI絵師ReBeLグランツーリスモ・ソフィーUGCGTソフィーPGCVolvoFIAグランツーリスモチャンピオンシップNovelAIRival PrakDGX A100NovelAI DiffusionVTuberユービーアイソフトWebcam VTuberモーションデータ星新一賞北尾まどかHALOポーズ推定将棋メタルギアソリッドVフォートナイトメッシュ生成FSMメルセデス・ベンツRobloxMagic Leapナップサック問題Live NationEpyllion汎用言語モデルWeb3.0マシュー・ボールAIOpsムーアの法則SpotifyスマートコントラクトReplica StudioamuseChitrakarQosmoAdobe MAX 2022巡回セールスマン問題Adobe MAXジョルダン曲線メディアAdobe Research政治Galacticaクラウドゲーミングがんばれ森川君2号和田洋一リアリティ番組映像解析Stadiaジョンソン裕子セキュリティMILEsNightCafe東芝デジタルソリューションズインタラクティブ・ストリーミングLuis RuizSATLYS 映像解析AIインタラクティブ・メディアポケモン3DスキャンPFN 3D Scanシーマン人工知能研究所東京工業大学Ludo博報堂Preferred NetworksラップPFN 4D ScanSIGGRAPH 2019ArtEmisZ世代DreamUpAIラッパーシステムDeviantArtWaifu DiffusionGROVERプラスリンクス ~キミと繋がる想い~元素法典FAIRSTCNovel AIチート検出Style Transfer ConversationOpen AIオンラインカジノRCPアップルRealFlowRinna Character PlatformiPhoneCALADeep FluidsSoul Machines柿沼太一MeInGameAmeliaELSIAIGraphブレイン・コンピュータ・インタフェースバーチャルキャラクターBCIGateboxアフォーダンスLearning from VideoANIMAKPaLM-SayCan予期知能逢妻ヒカリセコムGitHub Copilotユクスキュルバーチャル警備システムCode as Policiesカント損保ジャパンCaP上原利之ドラゴンクエストエージェントアーキテクチャアッパーグラウンドコリジョンチェックPAIROCTOPATH TRAVELER西木康智OCTOPATH TRAVELER 大陸の覇者山口情報芸術センター[YCAM]アルスエレクトロニカ2019品質保証YCAMStyleRigAutodeskアンラーニング・ランゲージ逆転オセロニアBentley Systemsカイル・マクドナルドワールドシミュレーターローレン・リー・マッカーシー奥村エルネスト純いただきストリートH100鎖国[Walled Garden]プロジェクト齋藤精一大森田不可止COBOLSIGGRAPH ASIA 2022高橋智隆DGX H100VToonifyロボユニザナックDGX SuperPODControlVAE泉幸典仁井谷正充クラウドコンピューティング変分オートエンコーダーロボコレ2019Instant NeRFフォトグラメトリartonomous回帰型ニューラルネットワークbitGANsDeepJoinぎゅわんぶらあ自己中心派Azure Machine LearningAzure OpenAI Service意思決定モデル脱出ゲームDeepLHybrid Reward Architectureコミュニティ管理DeepL WriteウロチョロスSuper PhoenixSNSProject Malmoオンラインゲーム気候変動Project PaidiaシンギュラリティProject Lookoutマックス・プランク気象研究所レイ・カーツワイルWatch Forビョルン・スティーブンスヴァーナー・ヴィンジ気象モデルRunway ResearchLEFT ALIVE気象シミュレーションMake-A-Video長谷川誠ジミ・ヘンドリックス環境問題PhenakiBaby Xカート・コバーンエコロジーDreamixロバート・ダウニー・Jr.エイミー・ワインハウスSDGsText-to-ImageモデルYouTubeダフト・パンクメモリスタ音声生成AIGlenn MarshallScenarioThe Age of A.I.Story2Hallucination音声変換LatitudeレコメンデーションJukeboxAIピカソVeap JapanAI素材.comEAPneoAISIFT福井千春DreamIconDCGAN医療mignMOBADANNCEメンタルケアstudiffuse人事ハーバード大学Edgar HandyAndreessen Horowitz研修デューク大学AIQVE ONEQA Tech Nightmynet.aiローグライクゲーム松木晋祐東京理科大学下田純也人工音声NeurIPS 2021産業技術総合研究所桑野範久リザバーコンピューティングプレイ動画ヒップホップ対話型AIモデル詩ソニーマーケティングControlNetサイレント映画もじぱnoteNBA環境音暗号通貨note AIアシスタントFUZZLEKetchupAlterationAI News粒子群最適化法Art Selfie進化差分法オープンワールドArt Transfer群知能下川大樹AIFAPet Portraitsウィル・ライト高津芳希P2EBlob Opera大石真史クリムトBEiTStyleGAN-NADA世界モデルDETRゲームエンジンDreamerV3SporeUnreal Engineクリティックネットワークデノイズ南カリフォルニア大学Unity for Industryアクターネットワーク画像処理DMLabSentropyGLIDEControl SuiteCPUDiscordAvatarCLIPAtari 100kSynthetic DataAtari 200MCALMYann LeCunプログラミングサム・アルトマン鈴木雅大ソースコード生成コンセプトアートGMAIシチズンデベロッパーSonanticColie WertzGitHubCohereリドリー・スコットウィザードリィMCN-AI連携モデルマジック:ザ・ギャザリング絵コンテUrzas.aiストーリーボード介護大阪大学西川善司並木幸介KikiBlenderサムライスピリッツ森寅嘉Zoetic AIゼビウスSIGGRAPH 2021ペットGPT-4ストリートファイター半導体Digital Dream LabsPaLM APITopaz Video Enhance AICozmoMakerSuiteDLSSタカラトミーSkeb山野辺一記NetEaseLOVOTDreambooth-Stable-Diffusion大里飛鳥DynamixyzMOFLINゲーム背景RomiGoogle EarthU-NetミクシィGEPPETTO AI13フェイズ構造ユニロボットStable Diffusion web UIADVユニボPoint-EXLandGatoアパレルAGIAI model手塚眞DEATH STRANDINGマルチモーダルAI ModelsEric Johnson汎用強化学習AIZMO.AIデザインMOBBY’SOculus Questコジマプロダクションロンドン芸術大学モビーディック生体情報デシマエンジンGoogle BrainダイビングインディーゲームSound Controlアウトドア写真高橋ミレイSYNTH SUPERAIスキャニング照明Maxim PeterKarl Sims自動採寸Joshua RomoffArtnome3DLOOKハイパースケープICONATESizer山崎陽斗深層強化学習ワコール立木創太松原仁スニーカー浜中雅俊UNSTREETミライ小町武田英明Newelseテスラ福井健策CheckGoodsGameGAN二次流通パックマンTesla BotNEDO中古市場Tesla AI DayWikipediaDupe Killerソサエティ5.0Sphere偽ブランドSIGGRAPH 2020バズグラフXaver 1000配信ニュースタンテキ養蜂東芝Beewiseソニー・ピクチャーズ アニメーションDIB-R倉田宜典フィンテック投資Fosters+Partners韻律射影MILIZEZaha Hadid Architects広告韻律転移三菱UFJ信託銀行
【GDCSummer】多様なプレイスタイルを学習し、FPSを人間のようにテストプレイするAIの育て方
ゲーム開発にはテストプレイとバランス調整が欠かせません。近年、多くの企業が人工知能を用いたテストプレイの自動化を検証していますが、ゲームの複雑さや開発規模が増すにつれてスケーラビリティには限界が生じます。また、特定の行動を重視したゲームプレイをAIにテストさせるのは、決して容易ではありません。製品の品質管理をAIが担うためには、ゲーム内で人間のように振る舞えるエージェントが必要不可欠なのです。
8月4日から8月6日までオンライン開催されたGDC Summerにて、Electronic ArtsのAI研究者Igor Borovikov氏による、「Imitation Learning: Building Practical Agents to Test and Explore a First-Person Shooter」(模倣学習:FPSのテストプレイに役立つエージェントの構築)というセッションを取材しました。
このセッションでは、開発途中のFPSタイトルをAIにテストプレイさせることを想定して、攻撃重視やステルス重視といったプレイスタイルの導入を、強化学習と模倣学習による手法で技術検証しています。
強化学習と模倣学習を組み合わせたアプローチ
ビデオゲームにおけるキャラクターの意思決定は、強化学習におけるマルコフ決定過程で定式化できます。マルコフ決定過程は、状態遷移が確率的に生じる動的システムにおける確率モデルであり、遷移後の状態と報酬は直前の状態と行動のみに依存します。すなわち、エージェントが行動を選択するたびに環境は確率的に状態遷移し、その都度エージェントは環境から確率的に報酬を得ます。これらの確率を決定するのが、マルコフ決定過程です。
しかし、強化学習だけでは人間のように振る舞う自動プレイエージェントは実現できません。ゲーム開発の現場では、高速で反復できる処理能力が求められます。ビルドが変わるたびに数日から数週間を学習に費やしていては使い物になりません。また、学習の計算コストにも現実的な数字が求められます。何よりも、強化学習にプレイスタイルという制約を組み込むには、かなり繊細な報酬設計が必要になるため一筋縄では行きません。
一方で、模倣学習にもいくつかの課題があります。まず、仕様変更のたびにデモンストレーションを作り直さなければならないため、どうしてもリソースコストが大幅に増加してしまいます。また、ゲームプレイにおけるすべての性質をカバーできるとは限りません。くわえて、人間のデモンストレーションを模倣したエージェントに人間より優れたパフォーマンスを期待することはできません。
そこで今回の検証では、後述するマルコフアンサンブルによりデモンストレーションからベースモデルを構築し、観測不可能な状態における未定義の行動はヒューリスティクスを介して指定。マルコフアンサンブルとヒューリスティクスの統合モデルを使ってエージェントにゲームプレイを学習させるというアプローチが取られています。これをディープニューラルネットワークやビヘイビア・ツリーを用いて最適化することで実用化を目指します。
多様なプレイスタイルをいかに学習させるか
一般的なFPSタイトルでは、「前方に走る」「伏せる」「身を隠す」のような一連の行動が、キャラクターの状態やプレイスタイルに応じた確率で、「回復アイテムを使う」「武器を変える」「休む」といった異なる次の行動につながります。この時、それぞれの確率を決定して、次の行動を予想するためにマルコフモデルが使われます。
マルコフモデルは単一の行動に対しては効果的ですが、現実には多様な状態に対応しなければならず、そのすべてが観測できるとは限りません。また、デモンストレーションではカバーしきれていない行動もあるかもしれません。こうした課題を解決するために、検証ではスタイルを決定するNグラム、記録された状態の量子化、デモンストレーションの順序という3次元のアンサンブルモデルを構築しています。
デモンストレーションとなるエピソードは、記録されたNグラムの状態と行動の連続で構成されています。それぞれのマルコフモデルが各状態における遷移確率を定義します。ここでは、マルコフモデルのNグラムが高順位になるほど、特定のプレイスタイルをより忠実に実行できることを示しています。たとえば、「スコープを覗く」「撃つ」「伏せる」「グレネードを投げる」「位置を変える」といった一連の動作を正確に実行できるわけです。
前述した量子化とは、連続的な変数を離散化することを指します。信号処理や画像処理においては、信号の大きさを離散的な値で近似的に表す際に使われます。FPSではキャラクターの速度やターゲットまでの距離が連続的な変数に該当します。そこで距離という連続的な変数を、「遠すぎて何もできない」「スナイパーライフルが使える」「近接武器が使える」といった具合に離散的な値に変換する必要があるのです。なお、どの程度もとの状態に近似しているかは、量子化の閾値によって定義します。
すべての順位と量子化におけるマルコフモデルを組み合わせることで、2次元のマトリクスが形成されます。マトリクスの縦軸はマルコフモデルの順位、横軸は量子化の閾値を示しており、一番左上がもっとも忠実度が高いマルコフモデルとなります。ここにデモンストレーションを時系列順に指定することで、3次元からなるマルコフアンサンブルが構築されます。なお、エージェントの学習途中でプレイヤーに操作権限を移行すれば、デモンストレーションを修正しながらインタラクティブに学習させることも可能だということです。
このセッションでは、流し台の中をスプーンが移動しながら家庭用品と戦うというシンプルなゲームを用いて、マルコフアンサンブルにおけるエージェントの学習が検証されました。スプーンが他の家庭用品に接触すると戦闘状態になり、食べ物に接触すると消費して体力を回復できるという最低限のメカニクスのみが実装されています。それぞれのマルコフモデルは10秒間隔で更新されます。このサンプルはFPSではないものの、マルコフモデルにおけるエージェントの挙動を描写するには十分な役割を果たしています。
人間のような振る舞いをどう定義するか
人間とAIを隔てる大きな溝のひとつに、ゲームジャンルに応じた直感的な知識があります。例えば、人間がアクションゲームをプレイする際、破壊したり飛び越えたりできない壁に延々とぶつかり続けるといった支離滅裂な行動は取りません。このように人間は可視化された情報をもとに直感的な判断を下せるため、人間によるデモンストレーションは不完全だといえます。このデモンストレーションからAIが人間のように目標や報酬を推定することは至難の業です。そこで避けて通れないのが知識工学です。
観測不可能な状態における未定義の行動をヒューリスティクスで指定する例として、残り体力や残弾数をもとにウェイポイントを選択するという手法が挙げられます。例えば、デス数に対するキル数の比率を最大化したい場合、残り体力と残弾数が多い時は敵をウェイポイントに設定し、反対に瀕死状態の時は回復アイテムをウェイポイントに設定することで、エージェントは生存率を維持しつつもアグレッシブな行動を選択するようになります。
このように、マルコフアンサンブルによって定義されたスタイルだけでは通用しない状態においては、知識工学に基づいたヒューリスティクスが非常に役立ちます。これがマルコフアンサンブルとヒューリスティクスの統合モデルです。残された課題は、線形的に増加していく計算コストを最適化する方法です。
これには、マルコフアンサンブルとヒューリスティクスを統合するためのディープニューラルネットワーク(DNN)を構築する手法と、デモンストレーションのデータをビヘイビア・ツリーへ圧縮変換する手法があります。後者はDNNと異なり、人間によって改変できるという利点があります。また、データ構造がもともとツリーの性質を持っていることも有利な点といえるでしょう。実際の変換プロセスは、今後の研究課題だということでした。
Writer:Ritsuko Kawai / 河合律子