モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。

TAG LIST
CGCGへの扉安藤幸央機械学習月刊エンタメAIニュースディープラーニング生成AI河合律子吉本幸記OpenAIGAN音楽NVIDIAGoogleChatGPT強化学習三宅陽一郎グーグルニューラルネットワークStable Diffusion森川幸人大規模言語モデルDeepMindシナリオQAマイクロソフトAIと倫理人工知能学会GPT-3LLM自然言語処理Facebook大内孝子倫理モリカトロン映画著作権アートゲームプレイAIキャラクターAI敵対的生成ネットワークルールベースSIGGRAPHスクウェア・エニックスモリカトロンAIラボインタビュー画像生成MinecraftNPCNFTプロシージャルMidjourneyデバッグDALL-E2音楽生成AIStyleGAN遺伝的アルゴリズム画像生成AIロボットファッション自動生成ディープフェイクVFXAdobeテストプレイメタAIアニメーションテキスト画像生成深層学習CEDEC2019デジタルツインメタバースVR小説ボードゲームDALL-ECLIPビヘイビア・ツリーマンガCEDEC2021CEDEC2020ゲームAI作曲Microsoft不完全情報ゲームナビゲーションAIマインクラフト畳み込みニューラルネットワークtoioスポーツエージェントGDC 2021汎用人工知能JSAI2022バーチャルヒューマンNVIDIA OmniverseGDC 2019マルチエージェントロボティクスCEDEC2022MetaAIアート3DCGStability AIメタデジタルヒューマン懐ゲーから辿るゲームAI技術史教育ジェネレーティブAIプロンプトGPT-4栗原聡手塚治虫マルチモーダルCNNNeRFDALL-E 3BERTMicrosoft AzureUnityOmniverseJSAI2023ELSI鴫原盛之HTN階層型タスクネットワークソニーRed RamJSAI2020GTC20233DマーケティングTensorFlowインタビューブロックチェーンイベントレポート動画生成AI対話型エージェントAmazonメディアアートDQN合成音声水野勇太アバターUbisoftGenvid TechnologiesガイスターStyleGAN2ARGTC2022SIGGRAPH ASIANetflixJSAI2021東京大学はこだて未来大学Bard研究シムピープルMCS-AI動的連携モデルモーションキャプチャーTEZUKA2020CEDEC2023AGIテキスト生成インディーゲームElectronic Arts音声合成メタデータGDC Summerイーロン・マスクStable Diffusion XLCMアストロノーカキャリア模倣学習eスポーツスタンフォード大学アーケードゲームテニスサイバーエージェントトレーディングカード音声認識類家利直eSportsBLUE PROTOCOLシーマンaiboチャットボットGeminiブラック・ジャックワークショップEpic GamesAIロボ「迷キュー」に挑戦AWS徳井直生クラウド斎藤由多加AlphaZeroTransformerGPT-2rinnaAIりんなカメラ環世界中島秀之PaLMGitHub Copilot哲学ベリサーブPlayable!GPT-3.5ハリウッド理化学研究所Gen-1SoraSFテキスト画像生成AI松尾豊AIQVE ONEデータマイニング現代アートDARPAドローンシムシティ世界モデルゲームエンジンImagenZorkバイアスマーダーミステリーASBSぱいどんアドベンチャーゲームAI美空ひばり手塚眞バンダイナムコ研究所スパーシャルAIELYZANEDO広告FSM-DNNMindAgentLEFT 4 DEAD通しプレイ論文OpenAI Five本間翔太馬淵浩希Cygames森山和道Audio2Faceピクサープラチナエッグイーサリアム効果音ボエダ・ゴティエビッグデータ中嶋謙互Amadeus Codeデータ分析MILENVIDIA ACEナラティブNVIDIA RivaOmniverse ReplicatorWCCFレコメンドシステムNVIDIA DRIVE SimWORLD CLUB Champion FootballNVIDIA Isaac Simセガ柏田知大軍事田邊雅彦Google I/OトレカMax CooperGPTDisneyFireflyPyTorch京都芸術大学ChatGPT4高橋力斗眞鍋和子バンダイナムコスタジオヒストリアAI Frog Interactive新清士SIE大澤博隆SFプロトタイピング齊藤陽介成沢理恵お知らせMagic Leap OneTencentサッカーモリカトロン開発者インタビュー宮本茂則バスケットボールTikTokSuno AItext-to-imageサルでもわかる人工知能text-to-3DVAEDreamFusionTEZUKA2023リップシンキングRNNUbisoft La Forge自動運転車知識表現ウォッチドッグス レギオンVTuberIGDA立教大学秋期GTC2022市場分析フォートナイトどうぶつしょうぎRobloxジェイ・コウガミ音楽ストリーミングMIT野々下裕子Adobe MAXマシンラーニング村井源5GMuZeroRival Peakpixivオムロン サイニックエックスGPTs電気通信大学対話エンジン稲葉通将ポケモン3Dスキャン橋本敦史リトル・コンピュータ・ピープルCodexシーマン人工知能研究所コンピューティショナル・フォトグラフィーPreferred Networksゴブレット・ゴブラーズ絵画Open AI3D Gaussian SplattingMicrosoft DesignerアップルイラストシミュレーションSoul Machines柿沼太一完全情報ゲームバーチャルキャラクター坂本洋典釜屋憲彦ウェイポイントLLaMAパス検索Hugging Face対談藤澤仁生物学GTC 2022xAIApple Vision Pro画像認識SiemensストライキStyleCLIPDeNAVoyager長谷洋平GDC 2024クラウドコンピューティングmasumi toyotaIBM宮路洋一OpenSeaGDC 2022SNSTextWorldEarth-2BingMagentaYouTube音声生成AIELYZA PencilScenarioSIGGRAPH2023AIピカソGTC2021AI素材.comCycleGANテンセントAndreessen HorowitzQA Tech Night松木晋祐NetHack下田純也桑野範久キャラクターモーションControlNet音源分離NBAフェイクニュースユニバーサルミュージックRPG法律Web3SIGGRAPH 2022レベルデザインDreamerV3AIボイスアクターUnreal Engine南カリフォルニア大学NVIDIA CanvasGPUALife人工生命オルタナティヴ・マシンサム・アルトマンサウンドスケープLaMDATRPGマジック:ザ・ギャザリングAI Dungeonゲーム背景アパレル不気味の谷ナビゲーションメッシュデザイン高橋ミレイ深層強化学習松原仁松井俊浩武田英明フルコトELYZA DIGEST建築西成活裕ハイブリッドアーキテクチャApex LegendsELIZA群衆マネジメントライブポートレイトNinjaコンピュータRPGライブビジネスWonder StudioAdobe Max 2023アップルタウン物語新型コロナ土木KELDIC周済涛BIMBing Chatメロディ言語清田陽司インフラBing Image CreatorゲームTENTUPLAYサイバネティックスMARVEL Future FightAstro人工知能史Amazon BedrockAssistant with BardタイムラプスEgo4DAI哲学マップThe Arcadeバスキア星新一X.AISearch Generative Experience日経イノベーション・ラボStyleGAN-XLX Corp.Dynalang敵対的強化学習StyleGAN3TwitterVLE-CE階層型強化学習GOSU Data LabGANimatorXホールディングスWANNGOSU Voice AssistantVoLux-GANMagiAI Act竹内将SenpAI.GGProjected GANEUMobalyticsSelf-Distilled StyleGANSDXLArs ElectronicaニューラルレンダリングRTFKTAI規制岡島学AWS SagemakerPLATONIKE欧州委員会映像セリア・ホデント形態素解析frame.ioClone X欧州議会UXAWS LambdaFoodly村上隆欧州理事会誤字検出MusicLM認知科学中川友紀子Digital MarkAudioLMゲームデザインSentencePieceアールティSnapchatMusicCapsLUMINOUS ENGINEクリエイターコミュニティAudioCraftLuminous ProductionsBlenderBot 3バーチャルペットパターン・ランゲージ竹村也哉Meta AINVIDIA NeMo ServiceMubertちょまどマーク・ザッカーバーグヴァネッサ・ローザMubert RenderGOAPWACULVanessa A RosaGen-2Adobe MAX 2021陶芸Runway AI Film Festival自動翻訳Play.htPreViz音声AIAIライティングLiDARCharacter-LLMOmniverse AvatarAIのべりすとPolycam復旦大学FPSQuillBotdeforumChat-Haruhi-Suzumiyaマルコフ決定過程NVIDIA MegatronCopysmith涼宮ハルヒNVIDIA MerlinJasperハーベストEmu VideoNVIDIA MetropolisForGamesNianticパラメータ設計ゲームマーケットペリドットバランス調整岡野翔太Dream Track協調フィルタリング郡山喜彦Music AI Tools人狼知能テキサス大学ジェフリー・ヒントンLyriaGoogle I/O 2023Yahoo!知恵袋AlphaDogfight TrialsAI Messenger VoicebotインタラクティブプロンプトAIエージェントシミュレーションOpenAI Codex武蔵野美術大学慶應義塾大学StarCraft IIHyperStyleBingAI石渡正人Future of Life InstituteRendering with Style手塚プロダクションIntel林海象LAIKADisneyリサーチヴィトゲンシュタインPhotoshop古川善規RotomationGauGAN論理哲学論考Lightroom大規模再構成モデルGauGAN2CanvaLRMドラゴンクエストライバルズ画像言語表現モデルObjaverse不確定ゲームSIGGRAPH ASIA 2021PromptBaseBOOTHMVImgNetDota 2モンテカルロ木探索ディズニーリサーチpixivFANBOXOne-2-3-45Mitsuba2バンダイナムコネクサス虎の穴3DガウシアンスプラッティングソーシャルゲームEmbeddingワイツマン科学研究所ユーザーレビューFantiaワンショット3D生成技術GTC2020CG衣装mimicとらのあなNVIDIA MAXINEVRファッションBaidu集英社FGDC淡路滋ビデオ会議ArtflowERNIE-ViLG少年ジャンプ+Future Game Development ConferenceグリムノーツEponym古文書ComicCopilot佐々木瞬ゴティエ・ボエダ音声クローニング凸版印刷コミコパGautier Boeda階層的クラスタリングGopherAI-OCRゲームマスター画像判定Inowrld AIJulius鑑定ラベル付けMODAniqueTPRGOxia PalusGhostwriter中村太一バーチャル・ヒューマン・エージェントtoio SDK for UnityArt RecognitionSkyrimエグゼリオクーガー田中章愛実況パワフルサッカースカイリムCopilot石井敦銭起揚NHC 2021桃太郎電鉄RPGツクールMZComfyUI茂谷保伯池田利夫桃鉄ChatGPT_APIMZserial experiments lainGDMC新刊案内パワサカダンジョンズ&ドラゴンズAI lainマーベル・シネマティック・ユニバースコナミデジタルエンタテインメントOracle RPGPCGMITメディアラボMCU岩倉宏介深津貴之PCGRLアベンジャーズPPOxVASynthDungeons&Dragonsマジック・リープDigital DomainMachine Learning Project CanvasLaser-NVビートルズMagendaMasquerade2.0国立情報学研究所ザ・ビートルズ: Get BackノンファンジブルトークンDDSPフェイシャルキャプチャー石川冬樹MERFDemucsスパコンAlibaba音楽編集ソフト里井大輝KaggleスーパーコンピュータVQRFAdobe Audition山田暉松岡 聡nvdiffreciZotopeAssassin’s Creed OriginsAI会話ジェネレーターTSUBAME 1.0NeRFMeshingRX10Sea of ThievesTSUBAME 2.0LERFMoisesGEMS COMPANYmonoAI technologyLSTMABCIマスタリングモリカトロンAIソリューション富岳レベルファイブ初音ミクOculusコード生成AISociety 5.0リアム・ギャラガー転移学習テストAlphaCode夏の電脳甲子園グライムスKaKa CreationBaldur's Gate 3Codeforces座談会BoomyVOICEVOXCandy Crush Saga自己増強型AIジョン・レジェンドGenie AISIGGRAPH ASIA 2020COLMAPザ・ウィークエンドSIGGRAPH Asia 2023ADOPNVIDIA GET3DドレイクC·ASEデバッギングBigGANGANverse3DFLAREMaterialGANダンスグランツーリスモSPORTAI絵師エッジワークスMagicAnimateReBeLグランツーリスモ・ソフィーUGC日本音楽作家団体協議会Animate AnyoneGTソフィーPGCFCAインテリジェントコンピュータ研究所VolvoFIAグランツーリスモチャンピオンシップVoiceboxアリババNovelAIさくらインターネットDreaMovingRival PrakDGX A100NovelAI DiffusionVISCUITぷよぷよScratchユービーアイソフトWebcam VTuberモーションデータスクラッチ星新一賞大阪公立大学ビスケット北尾まどかHALOポーズ推定TCGプログラミング教育将棋メタルギアソリッドVメッシュ生成KLabFSMメルセデス・ベンツQRコードVALL-EMagic Leap囲碁Deepdub.aiナップサック問題Live NationEpyllionデンソーAUDIOGEN汎用言語モデルWeb3.0マシュー・ボールデンソーウェーブEvoke MusicAIOpsムーアの法則原昌宏AutoFoleySpotifyスマートコントラクト日本機械学会Colourlab.AiReplica Studioロボティクス・メカトロニクス講演会ディズニーamuseChitrakarQosmoAdobe MAX 2022トヨタ自動車Largo.ai巡回セールスマン問題かんばん方式Cinelyticジョルダン曲線メディアAdobe ResearchTaskade政治Galacticaプロット生成Pika.artクラウドゲーミングがんばれ森川君2号AI Filmmaking Assistant和田洋一リアリティ番組映像解析FastGANStadiaジョンソン裕子セキュリティ4コママンガAI ScreenwriterMILEsNightCafe東芝デジタルソリューションズ芥川賞インタラクティブ・ストリーミングLuis RuizSATLYS 映像解析AI文学インタラクティブ・メディア恋愛PFN 3D ScanElevenLabsタップル東京工業大学HeyGenAbema TVLudo博報堂After EffectsNECラップPFN 4D Scan絵本木村屋SIGGRAPH 2019ArtEmisZ世代DreamUp出版GPT StoreAIラッパーシステムDeviantArtAmmaar Reshi生成AIチェッカーWaifu DiffusionStoriesユーザーローカルGROVERプラスリンクス ~キミと繋がる想い~元素法典StoryBird九段理江FAIRSTCNovel AIVersed東京都同情塔チート検出Style Transfer ConversationProlificDreamerオンラインカジノRCPUnity Sentis4Dオブジェクト生成モデルRealFlowRinna Character PlatformUnity MuseAlign Your GaussiansiPhoneCALACaleb WardAYGDeep Fluids宮田龍MAV3DMeInGameAmelia清河幸子ファーウェイAIGraphブレイン・コンピュータ・インタフェース西中美和4D Gaussian SplattingBCIGateboxアフォーダンス安野貴博4D-GSLearning from VideoANIMAKPaLM-SayCan斧田小夜Glaze予期知能逢妻ヒカリ宮本道人WebGlazeセコムLLaMA 2NightShadeユクスキュルバーチャル警備システムCode as PoliciesSpawningカント損保ジャパンCaPHave I Been Trained?CM3leonFortnite上原利之Stable DoodleUnreal Editor For FortniteドラゴンクエストエージェントアーキテクチャアッパーグラウンドコリジョンチェックT2I-AdapterXRPAIROCTOPATH TRAVELER西木康智VolumetricsOCTOPATH TRAVELER 大陸の覇者山口情報芸術センター[YCAM]AIワールドジェネレーターアルスエレクトロニカ2019品質保証YCAM日本マネジメント総合研究所Rosebud AI GamemakerStyleRigAutodeskアンラーニング・ランゲージLayer逆転オセロニアBentley Systemsカイル・マクドナルドLily Hughes-RobinsonCharisma.aiワールドシミュレーターローレン・リー・マッカーシーColossal Cave Adventure奥村エルネスト純いただきストリートH100鎖国[Walled Garden]​​プロジェクトAdventureGPT調査齋藤精一大森田不可止COBOLSIGGRAPH ASIA 2022リリー・ヒューズ=ロビンソンMeta Quest高橋智隆DGX H100VToonifyBabyAGIIPロボユニザナックDGX SuperPODControlVAEGPT-3.5 Turbo泉幸典仁井谷正充変分オートエンコーダーカーリング強いAIロボコレ2019Instant NeRFフォトグラメトリウィンブルドン弱いAIartonomous回帰型ニューラルネットワークbitGANsDeepJoin戦術分析ぎゅわんぶらあ自己中心派Azure Machine LearningAzure OpenAI Serviceパフォーマンス測定Lumiere意思決定モデル脱出ゲームDeepLIoTUNetHybrid Reward Architectureコミュニティ管理DeepL WriteProFitXImageFXウロチョロスSuper PhoenixWatsonxMusicFXProject MalmoオンラインゲームAthleticaTextFX気候変動コーチングProject Paidiaシンギュラリティ北見工業大学KeyframerProject Lookoutマックス・プランク気象研究所レイ・カーツワイル北見カーリングホールAppleWatch Forビョルン・スティーブンスヴァーナー・ヴィンジ画像解析Gemini 1.5気象モデルRunway ResearchじりつくんAI StudioLEFT ALIVE気象シミュレーションMake-A-VideoNTT SportictVertex AI長谷川誠ジミ・ヘンドリックス環境問題PhenakiAIカメラChat with RTXBaby Xカート・コバーンエコロジーDreamixSTADIUM TUBESlackロバート・ダウニー・Jr.エイミー・ワインハウスSDGsText-to-ImageモデルPixelllot S3Slack AIソフトバンクPokémon Battle Scopeダフト・パンクメモリスタAIスマートコーチポケットモンスターGlenn MarshallkanaeruThe Age of A.I.Story2Hallucination音声変換Latitude占いレコメンデーションJukeboxDreambooth行動ロジック生成AIVeap Japanヤン・ルカンConvaiEAPneoAIPerfusionNTTドコモSIFT福井千春DreamIconニューラル物理学EmemeDCGAN医療mign毛髪GenieMOBADANNCEメンタルケアstudiffuse荒牧英治汎用AIエージェント人事ハーバード大学Edgar Handy中ザワヒデキAIファッションウィーク研修デューク大学大屋雄裕インフルエンサー中川裕志Grok-1mynet.aiローグライクゲームAdreeseen HorowitzMixture-of-Experts東京理科大学NVIDIA Avatar Cloud EngineMoE人工音声NeurIPS 2021産業技術総合研究所Replica StudiosClaude 3リザバーコンピューティングSmart NPCsClaude 3 Haikuプレイ動画ヒップホップ対話型AIモデルRoblox StudioClaude 3 SonnetソニーマーケティングPromethean AIClaude 3 Opusサイレント映画もじぱnote森永乳業環境音暗号通貨note AIアシスタントMusiioC2PAFUZZLEKetchupEndelゲーミフィケーションAlterationAI NewsTomo Kihara粒子群最適化法Art SelfiePlayfool進化差分法オープンワールドArt TransferSonar遊び群知能下川大樹AIFAPet PortraitsSonar+D​​tsukurunウィル・ライト高津芳希P2EBlob Opera地方創生大石真史クリムトDolby Atmos吉田直樹BEiTStyleGAN-NADASonar Music Festival素材DETRライゾマティクスSIMASporeクリティックネットワーク真鍋大度OpenAI JapanデノイズUnity for Industryアクターネットワーク花井裕也Voice Engine画像処理DMLabRitchie HawtinCommand R+SentropyGLIDEControl SuiteErica SynthOracle Cloud InfrastructureCPUDiscordAvatarCLIPAtari 100kUfuk Barış MutluGoogle WorkspaceSynthetic DataAtari 200MJapanese InstructBLIP AlphaUdioCALMYann LeCun日本新聞協会立命館大学プログラミング鈴木雅大AIいらすとや京都精華大学ソースコード生成コンセプトアートAI PicassoTacticAIGMAIシチズンデベロッパーSonanticColie WertzEmposyNPMPGitHubCohereリドリー・スコットAIタレントFOOHウィザードリィMCN-AI連携モデル絵コンテAIタレントエージェンシーGPT-4oUrzas.aiストーリーボードmodi.aiProject Astra介護大阪大学BitSummitGoogle I/O 2024西川善司並木幸介KikiBlenderBitSummit Let’s Go!!Gemma 2サムライスピリッツ森寅嘉Zoetic AIVeoゼビウスSIGGRAPH 2021ペット感情認識ストリートファイター半導体Digital Dream LabsPaLM APIデジタルレプリカ音声加工Topaz Video Enhance AICozmoMakerSuiteGOT7マルタ大学DLSSタカラトミーSkebsynthesia田中達大山野辺一記NetEaseLOVOTDreambooth-Stable-DiffusionHumanRFInworld AI大里飛鳥DynamixyzMOFLINActors-HQMove AIRomiGoogle EarthSAG-AFTRAU-NetミクシィGEPPETTO AIWGA13フェイズ構造ユニロボットStable Diffusion web UIチャーリー・ブルッカーADVユニボPoint-EXLandGato岡野原大輔AI model自己教師あり学習DEATH STRANDINGAI ModelsIn-Context Learning(ICL)Eric Johnson汎用強化学習AIZMO.AILoRAMOBBY’SファインチューニングOculus Questコジマプロダクションロンドン芸術大学モビーディックグランツーリスモ生体情報デシマエンジンGoogle Brainダイビング量子コンピュータSound Controlアウトドアqubit写真SYNTH SUPERAIスキャニングIBM Quantum System 2照明Maxim PeterKarl Sims自動採寸北野宏明Joshua RomoffArtnome3DLOOKダリオ・ヒルハイパースケープICONATESizerジェン・スン・フアン山崎陽斗ワコールHuggingFace立木創太スニーカーStable Audio浜中雅俊UNSTREET宗教ミライ小町Newelse仏教テスラ福井健策CheckGoodsコカ・コーラGameGAN二次流通食品パックマンTesla Bot中古市場Coca‑Cola Y3000 Zero SugarTesla AI DayWikipediaDupe KillerCopilot Copyright Commitmentソサエティ5.0Sphere偽ブランドテラバースSIGGRAPH 2020バズグラフXaver 1000配信京都大学ニュースタンテキ養蜂立福寛東芝Beewiseソニー・ピクチャーズ アニメーション音声解析DIB-R倉田宜典フィンテック感情分析投資Fosters+Partners周 済涛韻律射影MILIZEZaha Hadid Architectsステートマシン韻律転移三菱UFJ信託銀行ディープニューラルネットワーク

汎用3Dゲームプレイエージェント「SIMA」の仕組みと進化の方向を解説

2024.4.22ゲーム

汎用3Dゲームプレイエージェント「SIMA」の仕組みと進化の方向を解説

近年のゲームプレイAI研究は、ハイスコアを達成することから自然言語理解機能を組み込んで汎用的かつヒューマンライクなAIを実現することに目標がシフトしています。こうしたなかDeepMindは、人間の自然言語による指示に従って9つの3DゲームをプレイできるAIを開発しました。本稿ではこのAIについて解説したうえで、ゲームプレイAIの進化の方向性について考察します。

人間がプレイした9つのゲームから学習

DeepMindが開発したゲームプレイAI「SIMA」(Scalable Instructable Multiworld Agent:拡張可能かつ指導可能なマルチワールドエージェント)は、9つのゲームを人間の自然言語による指示にしたがってプレイします。プレイ可能なゲームにはヤギが登場する『Goat Simulator 3』、惑星探索ゲーム『No Man’s Sky』、工場建設ゲーム『Satisfactory』などが挙げられます。プレイするゲームの選定基準は豊かなビジュアルと複雑なインタラクションをそなえると同時に、極端な暴力や偏見をふくまないものとしました。さらに開発と評価を効率的に進めるために、4つの3D研究環境も用意しました。

SIMAの開発にあたっては、自然言語による指示と各ゲームにおけるプレイの関係を学習するために教師あり学習を行いました。学習データを作成するために、人間のプレイヤーが2人1組になって、1人が指示を出し、もう1人がプレイするデータを収集しました。プレイの指示は、テキストデータとして学習データに格納しました。

SIMAのアーキテクチャは、ゲーム画面と自然言語による指示が入力となり、その入力がテキストを処理するテキストエンコーダー、ゲーム画面を認識する画像エンコーダー、次に表示される画面を予測する動画エンコーダーに渡されてから、マルチモーダルTransformerでこれらのエンコーダーの出力が統合されます。そして、統合された情報にもとづいて指示にふさわしいプレイが選択されます。なお、それぞれのエンコーダーは事前学習済みであり、前述の学習データを使って追加学習しています。

SIMAが学習したプレイは、その成否を評価しやすいように約10秒以内に完了できるタスクに限定しました。プレイ対象となった9つのゲームはルールもビジュアルも異なりますが、「見る」「道具を使う」「戦う」といった基本的なタスクは共通しています。最終的には、以下の画像のような階層構造をもった600のタスクを習得しました。

人間には及ばないものの特化型エージェントを凌駕

以上のように開発したSIMAについて、ゲームごとに指示にもとづいたタスクの成功率をまとめると以下のグラフのようになります。グラフにおける色の違いは評価方法の違いであり、青は研究環境に実装した評価機能を用いた評価、赤は人間による評価、黄色はタスク成功メッセージなどの画像認識と人間による確認を組み合わせた評価を意味します。研究環境より実際の3Dゲームのほうが、SIMAにとって難易度が高いことがグラフから読み取れます。

タスクの成功率をカテゴリーごとにまとめると、以下のグラフのようになります。移動カテゴリーには「止まる」「動く」「見る」のタスクがふくまれますが、これらのなかでは「見る」がもっとも難しいことがわかります。「見る」タスクが相対的に難しいのは、見る対象に関する知識が必要だからと考えられます。興味深いのは、食料カテゴリーでは「調理する」より「食べる」ほうが難しいという直感に反する結果となったところです。一般に「戦闘する」や「建設する」のような正確な動きや空間認識を伴うタスクが難しい傾向にあります。

SIMAの評価では、9つのゲームすべてを学習した場合と、1つのゲームのみ学習した場合も比較しました。以下のグラフにおける「SIMA」は全ゲームを学習した場合、「Zero-Shot」は評価するゲームのみ学習していない初見プレイの場合、「No Pretraining」は各種エンコーダーに事前学習済みのものを使わない場合、「No Language」は意図的に言語理解を低下させた場合を意味します。このグラフより、特定のゲームに特化して学習するよりさまざまなゲームを学習するほうが、タスク成功率が向上することがわかります。

さらにNo Man’s Skyに関して、学習条件を変えてタスク成功率を比較した結果が以下のグラフとなります。全ゲームを学習した場合でも、人間プレイヤーには遠く及ばないことがわかります。

以上の評価結果より、今後SIMAの性能を向上させるにはさらに多くのゲームを学習することが得策と考えられます。

近年のゲームプレイAI研究から導かる進化の傾向

ゲームプレイAI研究におけるSIMAの意義を考察するには、この研究分野における近年の成果を振り返る必要があるでしょう。そうした振り返りの起点は、DeepMindが開発した囲碁プレイAIのAlphaGoがふさわしいでしょう。強化学習とディープラーニングを活用してトッププロ囲碁棋士に勝利したこのAIは、まさに第三次AIブームにおけるゲームプレイAIの嚆矢となりました。その後、学習データを活用しないAlphaZero、そして学習データもゲームルールに関する事前知識もなしで囲碁をはじめとしたボードゲームに加えてレトロゲームでもハイスコアを達成したMuZeroが開発されました。

参考記事:学習の秘訣は計画性にあり。ルールの知識なしで学習するゲームプレイAI「MuZero」の到達点と可能性

対戦型ボードゲームやレトロゲームはゲーム内で生じるインタラクションが比較的単純であるという限界があるため、ゲームプレイAIの新たなテーマとしてオープンワールド3DゲームのMinecraftが選ばれるようになりました。このテーマにおける最初の著名な成果はOpenAIが2022年6月に発表した、VPT(Video PreTraining:動画事前訓練)を活用してダイヤモンドのつるはしの作成に成功したAIでした。このAIは、Minecraftプレイ動画を見て操作方法に関するラベルを付けるAIモデルを開発したうえで、このモデルによって7万時間の学習データを用意したことで実現しました。2023年1月には、DeepMindが学習データなしでダイヤモンドのつるはしを作るだけではなく、レトロゲームでもハイスコアを達成するDreamerV3を発表しました。同AIには環境の変化を予測する世界モデルが実装されていました。

参考記事:ダイヤモンドのつるはしを作ったOpenAIのMinecraftプレイAIが持つ射程とは?

学習データなしでMinecraftのダイヤモンド採取に成功。世界モデルを採用したDreamerV3の意義

AlphaGoからMuZeroまでの進化と、MinecraftプレイAIの進化には共通した傾向が認められます。どちらの進化も、学習データが必要な段階からそれが不要な段階を経て、さまざまなゲームプレイが可能となる汎用性を獲得しているのです。こうした進化の傾向は、「ゲームプレイAIの定向進化」と呼べるでしょう。

次なる進化はLLMと世界モデルの融合か?

LLMが飛躍した2023年には、ゲームプレイAIとLLMの融合が試みられました。例えばスタンフォード大学の研究チームは2023年4月、ChatGPTで駆動する多数のNPCが暮らす村のシミュレーション実験を発表し、5月にはNVIDIAがGPT-4をアーキテクチャの中心に据えたMinecraftプレイAI「Voyager」を発表しました。そしてMicrosoft Researchは9月、人間プレイヤーとNPCが自然言語によって協力してMinecraftをプレイするLLM統合型ゲームエンジン「MindAgent」を発表しました。

参考記事:大規模言語モデルがNPCやゲームマスターを演じる最新事例を紹介

大規模言語モデル駆動型ゲームプレイAIが登場

LLM統合型ゲームエンジンとしてのMindAgentの可能性

MindAgentからSIMAへの進化をゲームプレイAIの定向進化から見ると、Minecraftからさまざまな3Dゲームをプレイする「汎用性の獲得」が実現したと言えます。定向進化にもとづけば、SIMAが進化する方向も見えてきます。次なる進化は「学習データなしで」(つまりはゲームプレイ自体からの学習のみで)プレイすること、となるでしょう。

学習データなしで自然言語による指示にもとづいてさまざまな3DゲームをプレイするAIを実現するには、SIMAのコアアーキテクチャに世界モデルを採用することで実現するかもしれません。というのも、学習データなしで3Dゲームプレイを習得するには、DreamerV3で実証されたように世界モデルが有効だからです。そして、汎用的な言語理解を実現するためにはSIMAで採用したテキストエンコーダーではなく、LLMを活用するのが妥当でしょう。まとめるとSIMAの先にあるパラダイムとは、「LLMと世界モデルが融合したゲームプレイAI」と言えるのです。

LLM世界モデル融合型ゲームプレイAIが実現した場合、それはさまざまな3D環境で複雑なタスクを解決できるものとなるでしょう。こうしたAIはもはや「LLM搭載万能型ゲームプレイAI」という立ち位置を超えて、AGI開発に役立つエージェントとなるでしょう。実際、DeepMindはSIMAの論文でこのAIの進化が「AGI の根本的な課題への取り組みに役立つ」と述べています。同社が一貫してゲームプレイAIを研究しているのは、AGIの実現というAI業界ひいては人類の究極目標を達成するためなのです。

Writer:吉本幸記

RELATED ARTICLE関連記事

【GDC2021】『DEATH STRANDING』のNPCがプレイヤーを追跡する仕組み

2021.9.06ゲーム

【GDC2021】『DEATH STRANDING』のNPCがプレイヤーを追跡す...

【GDC 2022】キャラクターAIが感じるままにお絵かきできたら

2022.5.09ゲーム

【GDC 2022】キャラクターAIが感じるままにお絵かきできたら

【CEDEC2022】AIでモーションスタイル変換〜バンダイナムコ研究所の取り組み〜

2022.10.26ゲーム

【CEDEC2022】AIでモーションスタイル変換〜バンダイナムコ研究所の取り組...

RANKING注目の記事はこちら