モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。

TAG LIST
CGCGへの扉生成AI安藤幸央吉本幸記月刊エンタメAIニュース河合律子機械学習OpenAIディープラーニングLLM大規模言語モデル音楽GoogleNVIDIAグーグルモリカトロンGAN森川幸人ChatGPT三宅陽一郎強化学習DeepMindStable Diffusion人工知能学会ニューラルネットワークシナリオQAマイクロソフトAIと倫理GPT-3自然言語処理SIGGRAPHFacebook倫理大内孝子映画スクウェア・エニックスルールベースアート著作権音楽生成AIキャラクターAI敵対的生成ネットワークゲームプレイAIMinecraftNPC3DCG動画生成AIデバッグモリカトロンAIラボインタビューアニメーションNFT画像生成VFXロボットファッションStyleGANプロシージャルディープフェイクDALL-E2マルチモーダル遺伝的アルゴリズム自動生成MidjourneyRed RamAdobeVRメタAIマンガテストプレイMeta画像生成AIインタビューゲームAI小説ボードゲーム深層学習CEDEC2019toio教育MicrosoftマインクラフトCLIPテキスト画像生成NeRF不完全情報ゲームビヘイビア・ツリーDALL-ECEDEC2021デジタルツインメタバースStability AIPlayable!高橋力斗GeminiSora作曲アストロノーカロボティクスナビゲーションAI畳み込みニューラルネットワークARアップルスポーツ手塚治虫汎用人工知能3D広告CEDEC2020AIアートはこだて未来大学エージェントGDC 2021バーチャルヒューマンメタデジタルヒューマンJSAI2022ELSIプロンプトGPT-4GDC 2019マルチエージェントHTNソニー栗原聡CNN懐ゲーから辿るゲームAI技術史鴫原盛之NVIDIA Omniverse市場分析東京大学CEDEC2022ジェネレーティブAIDALL-E 3言霊の迷宮CM音声認識UbisoftSIGGRAPH ASIA階層型タスクネットワークJSAI2020マーケティングMicrosoft AzureUnityアドベンチャーゲームインディーゲーム音声合成BERTOmniverseRobloxがんばれ森川君2号AIQVE ONE世界モデルGTC2023JSAI2023電気通信大学AppleGPT-4oJSAI2024ブロックチェーンイベントレポート対話型エージェントシーマン水野勇太ガイスター斎藤由多加YouTubeSF研究シムシティシムピープルTEZUKA2020スパーシャルAIElectronic ArtsメタデータTensorFlowキャリア模倣学習AmazonDQNSIEアバターGenvid TechnologiesStyleGAN2JSAI2021ZorkMCS-AI動的連携モデルモーションキャプチャーAGICygamesサイバーエージェント合成音声モリカトロン開発者インタビュー宮本茂則AWS徳井直生GTC2022NetflixUnreal Engineテキスト生成トレーディングカードメディアアートOpen AIベリサーブGPT-3.5音声生成AI松木晋祐Bardブラック・ジャック村井源稲葉通将マーダーミステリーCEDEC2023RunwayAmadeus Code人狼知能eSportsワークショップクラウドAlphaZeroAIりんなカメラ環世界中島秀之宮路洋一理化学研究所人事DARPAドローン人工生命ASBSぱいどんAI美空ひばり手塚眞GDC Summer岡島学eスポーツスタンフォード大学テニスBLUE PROTOCOLaibo銭起揚自動運転車TransformerGPT-2哲学現代アートバンダイナムコ研究所ELYZANVIDIA RivaチャットボットEpic GamesrinnaSNS松尾豊データマイニングゲームエンジンImagenバイアスサム・アルトマンデザインNEDO森山和道自動翻訳アーケードゲームセガ類家利直大澤博隆SFプロトタイピングコナミデジタルエンタテインメントtext-to-imagetext-to-3DDreamFusionAIロボ「迷キュー」に挑戦Adobe MAXPreferred NetworksPaLMGitHub CopilotGen-1ControlNet建築イーロン・マスクStable Diffusion XLAudio2FaceGoogle I/OFireflyTikTok立教大学KLabLLaMAハリウッドテキスト画像生成AI法律LoRA論文NianticXRApple Vision ProVeoCEDEC2024Runway Gen-3 AlphaスーパーマリオブラザーズWhiskSIGGRAPH Asia 2024GDC 2025JSAI2025CEDEC2025OpenAI Fiveピクサービッグデータナラティブ眞鍋和子齊藤陽介成沢理恵お知らせMagic Leap Oneサルでもわかる人工知能リップシンキングUbisoft La Forge知識表現IGDAどうぶつしょうぎジェイ・コウガミ音楽ストリーミングマシンラーニング5G対話エンジンシーマン人工知能研究所ゴブレット・ゴブラーズ完全情報ゲームウェイポイントパス検索藤澤仁画像認識DeNA長谷洋平ぎゅわんぶらあ自己中心派ウロチョロステンセントNBAフェイクニュースウィル・ライトレベルデザインGPUALifeオルタナティヴ・マシンサウンドスケープTRPGAI Dungeonゼビウス不気味の谷写真松井俊浩パックマン通しプレイ本間翔太馬淵浩希中嶋謙互レコメンドシステム軍事PyTorchモンテカルロ木探索バンダイナムコスタジオ田中章愛サッカーバスケットボールVAERNNウォッチドッグス レギオンHALOMITMuZeroRival Peakリトル・コンピュータ・ピープルコンピューティショナル・フォトグラフィー絵画シミュレーション坂本洋典釜屋憲彦生物学StyleCLIPmasumi toyotaTextWorldBingMagentaGTC2021CycleGANNetHackAIボイスアクター南カリフォルニア大学NVIDIA CanvasNetEaseナビゲーションメッシュ高橋ミレイ深層強化学習ELYZA DIGESTELIZALEFT 4 DEADプラチナエッグイーサリアムボエダ・ゴティエOmniverse ReplicatorNVIDIA DRIVE SimNVIDIA Isaac SimDisneyAI会話ジェネレーターグランツーリスモ・ソフィーVTuberフォートナイトQosmoポケモンCodexSoul Machinesバーチャルキャラクター対談GTC 2022SiemensクラウドコンピューティングOpenSeaGDC 2022Earth-2エコロジーELYZA Pencil医療キャラクターモーションRPGSIGGRAPH 2022LaMDAマジック:ザ・ギャザリング介護松原仁武田英明フルコトデータ分析MILEWCCFWORLD CLUB Champion Football柏田知大田邊雅彦トレカMax Cooper京都芸術大学ラベル付け秋期GTC2022野々下裕子pixivセキュリティ3DスキャンMicrosoft Designerイラスト柿沼太一ScenarioAIピカソAI素材.comAndreessen HorowitzQA Tech Night下田純也桑野範久DreamerV3大阪大学Blenderゲーム背景Point-EアパレルBIMGPTPhotoshopChatGPT4コミコパTencentTEZUKA2023大阪公立大学オムロン サイニックエックス橋本敦史宮本道人LLaMA 2Hugging FacexAIストライキVoyagerIBMソフトバンクSIGGRAPH2023音源分離ユニバーサルミュージックWeb3BitSummitファインチューニンググランツーリスモ北野宏明立福寛FSM-DNNMindAgent効果音NVIDIA ACE慶應義塾大学ヒストリアAI Frog Interactive新清士ComfyUISuno AIKaKa CreationVOICEVOXGPTs3D Gaussian SplattingGDC 2024ポケットモンスターSIMAGemma 2Inworld AIIEEE早稲田大学Apple IntelligenceWWDCWWDC 2024Perplexityくまうた濱田直希ソニー・インタラクティブエンタテインメント遊戯王佐竹空良九州大学伊藤黎Sakana AIByteDanceLINEヤフーDOOMGameNGen社員インタビューMovie GenPlayable!MobilePeridot早瀬悠真Veo 2SONYDeepSeekGDCCube 3DモリカトロンAIコネクトベンチマークHao AI LabClaudeモリカコミックジョージア工科大学MeshyVeo 3ゲーム映像パラメータ設計バランス調整エージェントシミュレーションDota 2ソーシャルゲーム淡路滋グリムノーツゴティエ・ボエダGautier BoedaJuliusTPRGバーチャル・ヒューマン・エージェントクーガー石井敦茂谷保伯マジック・リープノンファンジブルトークン里井大輝GEMS COMPANY初音ミク転移学習デバッギング北尾まどか将棋ナップサック問題SpotifyReplica Studioamuseクラウドゲーミング和田洋一StadiaSIGGRAPH 2019iPhoneAIGraph予期知能ドラゴンクエストPAIRアルスエレクトロニカ2019逆転オセロニア奥村エルネスト純齋藤精一高橋智隆ロボユニ泉幸典ロボコレ2019意思決定モデルLEFT ALIVE長谷川誠Baby Xロバート・ダウニー・Jr.The Age of A.I.レコメンデーションMOBA研修mynet.ai人工音声プレイ動画群知能Sporeデノイズ画像処理CPUGMAIウィザードリィ西川善司サムライスピリッツストリートファイター山野辺一記大里飛鳥13フェイズ構造Oculus Quest生体情報照明山崎陽斗立木創太GameGANソサエティ5.0SIGGRAPH 2020DIB-RApex LegendsNinjaTENTUPLAYMARVEL Future Fightタイムラプスバスキア階層型強化学習WANN竹内将セリア・ホデントUX認知科学ゲームデザインLUMINOUS ENGINELuminous Productionsパターン・ランゲージちょまどFPSマルコフ決定過程協調フィルタリングAlphaDogfight TrialsStarCraft IIFuture of Life InstituteIntelLAIKARotomationドラゴンクエストライバルズ不確定ゲームEmbeddingGTC2020NVIDIA MAXINEビデオ会議階層的クラスタリングtoio SDK for UnityGDMCMITメディアラボMagendaDDSPKaggleAssassin’s Creed OriginsSea of ThievesmonoAI technologyOculusテストBaldur's Gate 3Candy Crush SagaSIGGRAPH ASIA 2020BigGANMaterialGANReBeLVolvoRival PrakユービーアイソフトメタルギアソリッドVFSM汎用言語モデルChitrakar巡回セールスマン問題ジョルダン曲線リアリティ番組ジョンソン裕子MILEsインタラクティブ・ストリーミングインタラクティブ・メディアLudoArtEmisGROVERFAIRチート検出オンラインカジノRealFlowDeep FluidsMeInGameブレイン・コンピュータ・インタフェースBCILearning from VideoユクスキュルカントエージェントアーキテクチャOCTOPATH TRAVELER西木康智OCTOPATH TRAVELER 大陸の覇者StyleRigいただきストリート大森田不可止ザナック仁井谷正充Azure Machine Learning脱出ゲームHybrid Reward ArchitectureSuper PhoenixProject MalmoProject PaidiaProject LookoutWatch Forジミ・ヘンドリックスカート・コバーンエイミー・ワインハウスダフト・パンクGlenn MarshallStory2HallucinationJukeboxSIFTDCGANDANNCEハーバード大学デューク大学ローグライクゲームNeurIPS 2021ヒップホップサイレント映画環境音粒子群最適化法進化差分法下川大樹高津芳希大石真史BEiTDETRSentropyDiscordCALMプログラミングソースコード生成シチズンデベロッパーGitHubMCN-AI連携モデル並木幸介森寅嘉SIGGRAPH 2021半導体Topaz Video Enhance AIDLSSDynamixyzU-NetADVXLandDEATH STRANDINGEric JohnsonコジマプロダクションデシマエンジンMaxim PeterJoshua Romoffハイパースケープミライ小町テスラTesla BotTesla AI Dayバズグラフニュースタンテキ東芝倉田宜典韻律射影韻律転移コンピュータRPGアップルタウン物語KELDICメロディ言語AstroEgo4D日経イノベーション・ラボ敵対的強化学習GOSU Data LabGOSU Voice AssistantSenpAI.GGMobalyticsAWS Sagemaker形態素解析AWS Lambda誤字検出SentencePiece竹村也哉GOAPAdobe MAX 2021Omniverse AvatarNVIDIA MegatronNVIDIA MerlinNVIDIA Metropolisテキサス大学AI Messenger VoicebotOpenAI CodexHyperStyleRendering with StyleDisneyリサーチGauGANGauGAN2画像言語表現モデルSIGGRAPH ASIA 2021ディズニーリサーチMitsuba2ワイツマン科学研究所CG衣装VRファッションArtflowEponym音声クローニングGopher鑑定Oxia PalusArt RecognitionNHC 2021池田利夫新刊案内マーベル・シネマティック・ユニバースMCUアベンジャーズDigital DomainMasquerade2.0フェイシャルキャプチャー山田暉LSTMモリカトロンAIソリューションコード生成AIAlphaCodeCodeforces自己増強型AICOLMAPADOPGANverse3DグランツーリスモSPORTGTソフィーFIAグランツーリスモチャンピオンシップDGX A100Webcam VTuber星新一賞Live NationWeb3.0AIOpsスマートコントラクトメディア政治NightCafeLuis Ruiz東京工業大学博報堂ラップZ世代AIラッパーシステムプラスリンクス ~キミと繋がる想い~STCStyle Transfer ConversationRCPRinna Character PlatformAmeliaGateboxANIMAK逢妻ヒカリセコムバーチャル警備システム損保ジャパン上原利之アッパーグラウンド品質保証AutodeskBentley SystemsワールドシミュレーターH100COBOLDGX H100DGX SuperPODInstant NeRFartonomousbitGANsコミュニティ管理オンラインゲーム気候変動マックス・プランク気象研究所ビョルン・スティーブンス気象モデル気象シミュレーション環境問題SDGsメモリスタ音声変換Veap JapanEAP福井千春メンタルケアEdgar Handy東京理科大学産業技術総合研究所リザバーコンピューティングソニーマーケティングもじぱ暗号通貨FUZZLEAlterationオープンワールドAIFAP2EStyleGAN-NADAUnity for IndustryGLIDEAvatarCLIPSynthetic DataSonanticCohereUrzas.aiKikiZoetic AIペットDigital Dream LabsCozmoタカラトミーLOVOTMOFLINRomiミクシィユニロボットユニボGato汎用強化学習AIロンドン芸術大学Google BrainSound ControlSYNTH SUPERKarl SimsArtnomeICONATE浜中雅俊福井健策WikipediaSphereXaver 1000養蜂Beewiseフィンテック投資MILIZE三菱UFJ信託銀行西成活裕群衆マネジメントライブビジネス新型コロナ周済涛清田陽司サイバネティックス人工知能史AI哲学マップ星新一StyleGAN-XLStyleGAN3GANimatorVoLux-GANProjected GANSelf-Distilled StyleGANニューラルレンダリングPLATOframe.ioFoodly中川友紀子アールティBlenderBot 3Meta AIマーク・ザッカーバーグWACULAIライティングAIのべりすとQuillBotCopysmithJasperヴィトゲンシュタイン論理哲学論考PromptBaseバンダイナムコネクサスユーザーレビューmimicBaiduERNIE-ViLG古文書凸版印刷AI-OCR画像判定実況パワフルサッカー桃太郎電鉄桃鉄パワサカ岩倉宏介PPOMachine Learning Project Canvas国立情報学研究所石川冬樹スパコンスーパーコンピュータ松岡 聡TSUBAME 1.0TSUBAME 2.0ABCI富岳Society 5.0夏の電脳甲子園座談会NVIDIA GET3DAI絵師UGCPGCNovelAINovelAI Diffusionモーションデータポーズ推定メッシュ生成メルセデス・ベンツMagic LeapEpyllionマシュー・ボールムーアの法則Adobe MAX 2022Adobe ResearchGalactica映像解析東芝デジタルソリューションズSATLYS 映像解析AIPFN 3D ScanPFN 4D ScanDreamUpDeviantArtWaifu Diffusion元素法典Novel AICALAアフォーダンスPaLM-SayCanCode as PoliciesCaPコリジョンチェック山口情報芸術センター[YCAM]YCAMアンラーニング・ランゲージカイル・マクドナルドローレン・リー・マッカーシー鎖国[Walled Garden]​​プロジェクトSIGGRAPH ASIA 2022VToonifyControlVAE変分オートエンコーダーフォトグラメトリ回帰型ニューラルネットワークDeepJoinAzure OpenAI ServiceDeepLDeepL Writeシンギュラリティレイ・カーツワイルヴァーナー・ヴィンジRunway ResearchMake-A-VideoPhenakiDreamixText-to-ImageモデルLatitudeneoAIDreamIconmignstudiffuse対話型AIモデルnotenote AIアシスタントKetchupAI NewsArt SelfieArt TransferPet PortraitsBlob OperaクリムトクリティックネットワークアクターネットワークDMLabControl SuiteAtari 100kAtari 200MYann LeCun鈴木雅大コンセプトアートColie Wertzリドリー・スコット絵コンテストーリーボードPaLM APIMakerSuiteSkebDreambooth-Stable-DiffusionGoogle EarthGEPPETTO AIStable Diffusion web UIAI modelAI ModelsZMO.AIMOBBY’SモビーディックダイビングアウトドアAIスキャニング自動採寸3DLOOKSizerワコールスニーカーUNSTREETNewelseCheckGoods二次流通中古市場Dupe Killer偽ブランド配信ソニー・ピクチャーズ アニメーションFosters+PartnersZaha Hadid ArchitectsライブポートレイトWonder Studio土木インフラAmazon BedrockX.AIX Corp.TwitterXホールディングスMagiSDXLRTFKTNIKEClone X村上隆Digital MarkSnapchatクリエイターコミュニティバーチャルペットNVIDIA NeMo Serviceヴァネッサ・ローザVanessa A Rosa陶芸Play.ht音声AILiDARPolycamdeforumハーベストForGamesゲームマーケット岡野翔太郡山喜彦ジェフリー・ヒントンGoogle I/O 2023武蔵野美術大学BingAILightroomCanvaBOOTHpixivFANBOX虎の穴Fantiaとらのあな集英社少年ジャンプ+ComicCopilotゲームマスターInowrld AIMODGhostwriterSkyrimスカイリムRPGツクールMZChatGPT_APIMZダンジョンズ&ドラゴンズOracle RPG深津貴之xVASynthLaser-NVMERFAlibabaVQRFnvdiffrecNeRFMeshingLERFマスタリングリアム・ギャラガーグライムスBoomyジョン・レジェンドザ・ウィークエンドドレイクエッジワークス日本音楽作家団体協議会FCAVoiceboxさくらインターネットぷよぷよTCGQRコード囲碁デンソーデンソーウェーブ原昌宏日本機械学会ロボティクス・メカトロニクス講演会トヨタ自動車かんばん方式プロット生成FastGAN4コママンガElevenLabsHeyGenAfter Effects絵本出版Ammaar ReshiStoriesStoryBirdVersedProlificDreamerUnity SentisUnity MuseCaleb Ward宮田龍清河幸子西中美和安野貴博斧田小夜CM3leonStable DoodleT2I-Adapter日本マネジメント総合研究所Lily Hughes-RobinsonColossal Cave AdventureAdventureGPTリリー・ヒューズ=ロビンソンBabyAGIGPT-3.5 Turboカーリングウィンブルドン戦術分析パフォーマンス測定IoTProFitXWatsonxAthleticaコーチング北見工業大学北見カーリングホール画像解析じりつくんNTT SportictAIカメラSTADIUM TUBEPixelllot S3AIスマートコーチDreamboothヤン・ルカンPerfusionニューラル物理学毛髪荒牧英治中ザワヒデキ大屋雄裕中川裕志Adreeseen HorowitzNVIDIA Avatar Cloud EngineReplica StudiosSmart NPCsRoblox StudioPromethean AIMusiioEndelSonarSonar+DDolby AtmosSonar Music Festivalライゾマティクス真鍋大度花井裕也Ritchie HawtinErica SynthUfuk Barış MutluJapanese InstructBLIP Alpha日本新聞協会AIいらすとやAI PicassoEmposyAIタレントAIタレントエージェンシーmodi.aiBitSummit Let’s Go!!デジタルレプリカGOT7synthesiaHumanRFActors-HQSAG-AFTRAWGAチャーリー・ブルッカー岡野原大輔自己教師あり学習In-Context Learning(ICL)量子コンピュータqubitIBM Quantum System 2ダリオ・ヒルジェン・スン・フアンHuggingFaceStable Audio宗教仏教コカ・コーラ食品Coca‑Cola Y3000 Zero SugarCopilot Copyright Commitmentテラバース京都大学音声解析感情分析周 済涛ステートマシンディープニューラルネットワークハイブリッドアーキテクチャAdobe Max 2023Bing ChatBing Image CreatorAssistant with BardThe ArcadeSearch Generative ExperienceDynalangVLE-CEAI ActEUArs ElectronicaAI規制欧州委員会欧州議会欧州理事会MusicLMAudioLMMusicCapsAudioCraftMubertMubert RenderGen-2Runway AI Film FestivalPreVizCharacter-LLM復旦大学Chat-Haruhi-Suzumiya涼宮ハルヒEmu VideoペリドットDream TrackMusic AI ToolsLyriaYahoo!知恵袋インタラクティブプロンプトAI石渡正人手塚プロダクション林海象古川善規大規模再構成モデルLRMObjaverseMVImgNetOne-2-3-453Dガウシアンスプラッティングワンショット3D生成技術FGDCFuture Game Development Conference佐々木瞬Anique中村太一エグゼリオCopilotserial experiments lainAI lainPCGPCGRLDungeons&Dragonsビートルズザ・ビートルズ: Get BackDemucs音楽編集ソフトAdobe AuditioniZotopeRX10MoisesレベルファイブGenie AISIGGRAPH Asia 2023C·ASEFLAREダンスMagicAnimateAnimate Anyoneインテリジェントコンピュータ研究所アリババDreaMovingVISCUITScratchスクラッチビスケットプログラミング教育VALL-EDeepdub.aiAUDIOGENEvoke MusicAutoFoleyColourlab.AiディズニーLargo.aiCinelyticTaskadePika.artAI Filmmaking AssistantAI Screenwriter芥川賞文学恋愛タップルAbema TVNEC木村屋GPT Store生成AIチェッカーユーザーローカル九段理江東京都同情塔4Dオブジェクト生成モデルAlign Your GaussiansAYGMAV3Dファーウェイ4D Gaussian Splatting4D-GSGlazeWebGlazeNightShadeSpawningHave I Been Trained?FortniteUnreal Editor For FortniteVolumetricsAIワールドジェネレーターRosebud AI GamemakerLayerCharisma.ai調査Meta QuestIP強いAI弱いAILumiereUNetImageFXMusicFXTextFXKeyframerGemini 1.5AI StudioVertex AIChat with RTXSlackSlack AIPokémon Battle Scopekanaeru占い行動ロジック生成AIConvaiNTTドコモEmemeGenie汎用AIエージェントAIファッションウィークインフルエンサーGrok-1Mixture-of-ExpertsMoEClaude 3Claude 3 HaikuClaude 3 SonnetClaude 3 Opus森永乳業C2PAゲーミフィケーションTomo KiharaPlayfool遊び​​tsukurun地方創生吉田直樹素材OpenAI JapanVoice EngineCommand R+Oracle Cloud InfrastructureGoogle WorkspaceUdio立命館大学京都精華大学TacticAINPMPFOOHProject AstraGoogle I/O 2024感情認識音声加工マルタ大学田中達大Move AIICRA2024大規模基盤モデルTorobo東京ロボティクスインピーダンス制御深層予測学習日立製作所尾形哲也AIREC汎用ロボットオムロンサイニックエックスViLaInPDDLニューサウスウェールズ大学Claude Sammutオックスフォード大学Lars Kunze杉浦孔明田向権VASA-1VoxCeleb2AniTalker上海大学LumaDream MachineNTTAI野々村真GPT-4-turbo佐藤恵助大道麻由物語構造分析慶応義塾大学渡邉謙吾ここ掘れ!プッカ大柳裕⼠加納基晴研究開発事例赤羽進亮UDI(Universal Duel Interface)第一工科大学小林篤史荻野宏実ビヘイビアブランチWPPGeneral Computer Control(GCC)CradleSpiral.AIItakoLLM-7b静岡大学明治大学北原鉄朗中村栄太日本大学ヤマハ前澤陽増田聡採用科学史AIサイエンティストTerraAI Overview電通AICO2BitSummit DriftOmega CrafterSPACE INVADIANS西島大介吉田伸一郎SIGGRAPH2024Motion-I2VToonify3D生成対向ネットワーク拡散モデルDiffusionうめ小沢高広ドリコムai andSaaSインサイトカスタマーサポートComfyUI-AdvancedLivePortraitGUIVideo to VideoiPhone 16OpenAI o1AIスマートリンクシャープウェアラブルCE-LLMCommunication Edge-LLMAIペットYahoo!ニュースAI Comic FactoryAI comic GeneratorComicsMaker.aiLlamaGen.aiGAZAIFlame Planner動画ゲーム生成モデルVirtuals ProtocolMarioVGG松原卓二Art Transfer 2Art Selfie 2Musical CanvasThe Forever LabyrinthRefik AnadolAlexander RebenRhizomatiksMolmoPixMoQwen2 72BDepth ProVARIETASAI面接官キリンホールディングス空間コンピューティングDream ScreenSynthIDFirefly Video ModelStable Video 4DAI受託開発事例田中志弥Playable!3DAdobe MAX 2024SneaksIllustratorMeta Quest 3XR-ObjectsOrion防犯O2Scam DetectionLive Threat Detection乗換NAVITIMEKaedim3DFY.aiLuma AIAvaturnBestatOasisDecartDejaboom!UnboundedEtched声優パブリシティ権日本俳優連合日本芸能マネージメント事業者協会日本声優事業社協議会IAPPTripo 2.0Meta 3D Genスマートシティ都市計画松本雄太Genie 2World LabsCybeverThird Dimension AI東北大学Gemini 2.0フロンティアワークス機械翻訳SimplifiedAI Voice over GeneratorAI Audio EnhancerエーアイAITalkコエステーションPlayStationVRMLTechno Magicゴーストバスターズスパイダーマンポリフォニー・デジタル荒牧伸志Project SidAlteraRobert YangRazerProject AVAStreamlabsIntelligent Streaming AssistantProject DIGITSスーパーコンピューターエージェンテックAI Shortsテルアビブ大学DiffUHaulTrailBlazerヴィクトリア大学ウェリントンzeroscopeQNeRFカーネギーメロン大学RALFグラフィックメイクCanvasProjectsDeepSeek-R1LoopyリップシンクCyber​​HostOmniHuman-1CSAMImagen 3Google LabsMicrosoft Museゲーム生成モデルWHAMデモンストレーターChatGPT Edu滋賀大学キリンビール桜AIカメラSolist-AIロームFactorioカリフォルニア大学GamingAgentAnthropicClaude 3.7 SonnetFactorio Learning EnvironmentFLEDeepseek-v3Gemini-2-FlashLlama-3.3-70BGPT-4o-MiniZOZO NEXTZOZOFashion Intelligence SystemPartial Visual-Semantic EmbeddingWEARGPT-4Vソイル大学AIパズルジェネレーターDolphinGemmaWild Dolphin ProjectSoundStreamトークナイザー音声処理技術GPT-4.1GPT-4.1 miniGPT-4.1 nanoLINE AILINE AIトークサジェストGTC2025Fuxi LabNaraka:Bladepoint MobileバトルロイヤルビヘイビアツリーSoftServeALNAIRAMRIBLADEGAGAQUEENRunway Gen-4SkyReelsStable Virtual CameraIntangibleブライアン・イーノEnoBrain OneAlphaEvolveContinuous Thought Machine(CTM)ArmStable Audio Open SmallWord2WorldSTORY2GAMEウィットウォーターランド大学森川の頭の中花森リドGoogle I/O 2025FlowLyra 2MusicFX DJAnimon.aiツインズひなひまMayaDeep Q-LearningAlphaGOスペースインベーダープリンス・オブ・ペルシャドラゴンクエストIV堀井雄二山名学タイトーカプコンUbi AnvilエンジンV1 Video ModelArtificial AnalysisVideo ArenaVideo Model LeaderboardClaude 3.5Mistral樋口恭介Claude 4小川 昴ホラーゲームStable Diffusion 1.5階層型物語構造夏目漱石漱石書簡京都情報大学院大学上野未貴ブラウザCometKiroAww Inc.Visual BankTHE PENFUJIYAMA AI SOUND富士通西浦めめヘッドウォータース下斗米貴之ディプロマシーOpenAI o3Cluade Opus 4ChatGPT o3カリフォルニア大学サンディエゴ校Everyテトリス逆転裁判Gemini 2.5-proGPT-5ロゼッタ広報MavericksNoLang 4.0gpt-oss金井大組織作りCygnusTaurus笠原達也バグチケット都築圭太仁木一順ライフレビューSIGGRAPH 2025Text-to-MotionMiegakure

世界内でタスクを遂行する「自己改善型マルチモーダルエージェント」の原初形態としてのDyanlangの紹介

2023.10.25ゲーム

世界内でタスクを遂行する「自己改善型マルチモーダルエージェント」の原初形態としてのDyanlangの紹介

代表的な大規模言語モデルであるGPT-4やBardは文章生成のみならず画像認識能力が実装されることで、テキスト情報と視覚情報を関連付けて所与の情報処理タスクを遂行できるようになりました。こうしたなか2023年7月末にカリフォルニア大学バークレー校の研究チームは、テキスト情報と視覚情報の新たな関連性を活用するAIモデルを発表しました。本稿ではこのAIモデルを紹介することで、テキストと視覚情報を統合して世界内でタスクを遂行する「自己改善型マルチモーダルエージェント」の可能性を明らかにします。

DremerV3を拡張

カリフォルニア大学バークレー校の研究チームが発表した論文「言語で世界をモデル化することを学習する(Learning to Model the World with Language)」は、テキスト情報によって視覚的世界の変化を予測できるAIモデル「Dynalang」を提案しています。このモデルは、例えば「玄関ドアを開けて右側に見えるドアから部屋に入って、その部屋にあるゴミ箱にゴミを捨てる」という言葉による指示を実行できるロボットに実装されるAIを想定して研究されています。言葉による指示を実行するには、指示で説明された通りに視覚的世界が変化することを予測したうえで、変化した世界のなかで適切に行動する能力が求められます。

言語による視覚的世界の予測を実現するために、研究チームはDeepMindらが発表したDreamerV3を拡張することにしました。このAIは、視覚的世界の変化を予測する世界モデルを実装することで、学習データなしでMinecraftのダイヤモンド採取に成功しました。こうした世界変化の予測能力を視覚情報だけではなく、テキスト情報を活用できるように進化させて誕生したのがDynalangなのです。

参考記事:学習データなしでMinecraftのダイヤモンド採取に成功。世界モデルを採用したDreamerV3の意義

Dynalangの開発にあたっては、(ゲームのような)学習空間における任意の時点に関するテキストと画像を統合した情報を入力として、入力時点に後続する学習空間情報を出力するように訓練しました(下のグラフの「(a) World Model Learning」参照)。同モデルをアーキテクチャ的観点から言えば、ある時間点に後続する状態を出力するリカレントニューラルネットワーク(Recurrent Neural Network、略称「RNN」)となります。

Dynalangは世界の変化を予測するだけではなく、変化する世界のなかで目標を達成できるようにも訓練されています。具体的には世界の変化を予測しながら、予測された世界において目標を達成する最適な行動を学習しました(上のグラフ「(b) Learning to Act by Latent Imagination」参照)。こうした学習には、DreamerV3に実装されている報酬を予測する「クリティック(批評者)ネットワーク」と報酬を最大化する行動を学習する「アクター(行動者)ネットワーク」が流用されました。このようにDynalangは、マルチモーダルな強化学習モデルという側面も認められます

4つのテストゲームで好成績

研究チームはDynalangの性能を実証するために、テキスト情報にもとづいた世界予測が重要となる4つのテストゲームを実施しました。なお、このテストでは既存マルチモーダル強化学習モデルであるIMPALAとR2D2を比較対象モデルとして選びました。

1つ目のゲーム「HomeGrid」は、グリッド(格子)座標上に描画された部屋のなかで「ゴミを拾ってゴミ箱に捨てる」のようなテキストによる指示を遂行するというものです。ゲームプレイ時には、指示の達成に役立つヒントがテキスト情報として与えられます。このヒントを生かすには、部屋の視覚的状態とヒントを統合する能力が求められます。このゲームでは、以下のグラフにようにDynalangがもっとも好成績をあげました。なお、グラフ中の「Task Only」はヒントなしのプレイを意味し、「With Future」はゴミの在り処に関するヒント、「With Correstions」はゴミから離れた場合に警告を発するヒント、「With Dynamics」はゴミ箱の開け方に関するヒントがある場合のプレイ成績を表しています。

2つ目のゲーム「Messenger」は、ゲームフィールド内にあるゲームアニュアルを取得して内容を理解したうえで、ゲームをクリアするというものです。マニュアルには避けるべき敵キャラクターやゴールの位置等が書かれています。このゲームを使ったテストでは、同ゲームのために訓練されたモデルであるEMMAも比較対象としました。テストの結果、それぞれのモデルが試行錯誤を経てゲームスコアを高めていくなか、Dynalangが最高成績を収めました。とくにもっとも難易度の高いフィールドでは、Dynalangだけがスコアを高めていきました。

3つ目は、3D表現されたバーチャルな屋内を言葉による指示にしたがって目的地まで移動する「VLE-CE(Vision-and-Language Navigation in Continuous Environments)」のテストを実施しました。このテストでは、Dynalangだけが試行錯誤を経て成功率を高められました。

4つ目は、「○○(○○には花瓶などの任意のオブジェクト名が入る)の色は何ですか」という質問に答えるためにAIエージェントがゲームフィールド内を探索する「LangRoom」でした。前述の3つのゲームは言葉を活用した世界の予測能力を問うものでしたが、LangRoomはゲーム世界を参照したうえでの文章生成能力を測定するものです。このテストによって、Dynalangはゲームプレイを通じて言わば拡張された文章生成能力を向上させられることがわかりました。

テキストのみから学習する「座学」も可能

研究チームは、Dynalangがテキストのみから学習可能などうかもテストしました。具体的には、前述のMessengerゲームで活用される大量のゲームマニュアルのみを学習しました(実際のMessengerでは、大量のマニュアルのうち1つがゲームプレイ時に設定される)。その結果、マニュアルを事前学習したDynalangは事前学習なしのそれに比べて高いスコアを達成するようになりました。

以上のテストによって実証されたゲームプレイを伴わない言わば「座学」による事前学習の有効性は、Dynalangに対して特定のゲームに限定されない汎用的な事前学習を実行できることを示唆しています。つまり、さまざまなゲームプレイに関するテキストや動画を学習すればするほど、あらゆるゲームのプレイがより上達する可能性が高いのです。

4つのテストゲームと事前学習によってその性能が実証されたDynalangの特徴をまとめると、言語にもとづいた世界予測と世界にもとづいた文章生成によってタスクを遂行するモデルだと言えます。そして、こうしたマルチモーダルな能力は、テキストあるいは動画を用いた学習によって向上させられるのです。ちなみに研究チームは、同モデルを「世界の人間と対話する自己改善型マルチモーダルエージェント」への道を拓くもの、と表現しています。

Dynalangは、画像認識と自然言語処理の最新統合形態であるGPT-4をはじめとする大規模言語モデルとは異なった系統の進化を遂げる可能性があります。というのも、前者は世界内でのタスク遂行を目標としているのに対して、後者はデジタル情報処理の高度化を目指しているように見なせるからです。こうした比較により、Dynalangは人間と生活するロボットに実装するAIとして進化するのではないか、とも考えられます。

現在AI研究開発の注目は大規模言語モデルに集まっていますが、Dynalangのようにそれらのモデルとは異なった進化を遂げるかも知れないマルチモーダルモデルの動向にも注意を向けるべきではないでしょうか。

Writer:吉本幸記

RELATED ARTICLE関連記事

【CEDEC2019】人工知能にテストプレイを丸投げできるか?

2019.9.24ゲーム

【CEDEC2019】人工知能にテストプレイを丸投げできるか?

【CEDEC2021】ゲームキャラクターの声を音声合成に置き換えるのは可能か

2021.10.15ゲーム

【CEDEC2021】ゲームキャラクターの声を音声合成に置き換えるのは可能か

TRPGのゲームマスターを演じるゲームAIの探求

2020.3.30ゲーム

TRPGのゲームマスターを演じるゲームAIの探求

RANKING注目の記事はこちら