モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。
- TAG LIST
- CGCGへの扉生成AI安藤幸央吉本幸記月刊エンタメAIニュース河合律子LLM機械学習OpenAI大規模言語モデルディープラーニングGoogleグーグル音楽NVIDIAモリカトロン森川幸人ChatGPTGANDeepMind三宅陽一郎強化学習Stable Diffusion人工知能学会ニューラルネットワークシナリオQAマイクロソフト自然言語処理AIと倫理GPT-3スクウェア・エニックス倫理映画SIGGRAPHFacebook大内孝子音楽生成AIルールベースアート著作権動画生成AIキャラクターAINPC3DCGデバッグ敵対的生成ネットワークロボットゲームプレイAIMinecraftモリカトロンAIラボインタビューアニメーションNFT画像生成VFXファッションStyleGANプロシージャルディープフェイクDALL-E2マルチモーダルAdobe遺伝的アルゴリズム自動生成テストプレイMidjourneyRed RamVRメタAI教育マンガMetaStability AI画像生成AIGeminiインタビューゲームAI小説ボードゲーム深層学習CEDEC2019toioMicrosoftマインクラフトCLIPテキスト画像生成NeRFSoraGPT-4o不完全情報ゲームビヘイビア・ツリーDALL-ECEDEC2021バーチャルヒューマンデジタルツインメタバースPlayable!高橋力斗作曲アストロノーカロボティクスナビゲーションAI畳み込みニューラルネットワークARアップルスポーツ手塚治虫汎用人工知能3D広告CEDEC2020AIアートはこだて未来大学エージェントGDC 2021メタ市場分析デジタルヒューマン東京大学JSAI2022ELSIプロンプトGPT-4GDC 2019マルチエージェントHTNソニー栗原聡CNNマーケティング懐ゲーから辿るゲームAI技術史鴫原盛之アドベンチャーゲームNVIDIA OmniverseCEDEC2022ジェネレーティブAIDALL-E 3言霊の迷宮CM音声認識UbisoftSIGGRAPH ASIA階層型タスクネットワークYouTubeJSAI2020Microsoft AzureUnityインディーゲーム音声合成BERTOmniverseRobloxがんばれ森川君2号NetflixGPT-3.5AIQVE ONE世界モデルGTC2023JSAI2023電気通信大学AppleJSAI2024ブロックチェーンイベントレポート対話型エージェント人狼知能シーマン水野勇太ガイスター斎藤由多加SF研究シムシティシムピープルTEZUKA2020スパーシャルAIElectronic ArtsメタデータTensorFlowキャリア模倣学習AmazonDQNSIEアバターGenvid TechnologiesStyleGAN2JSAI2021ZorkMCS-AI動的連携モデルモーションキャプチャーAGI高橋ミレイCygamesサイバーエージェント合成音声モリカトロン開発者インタビュー宮本茂則チャットボットAWS徳井直生GTC2022Unreal Engineテキスト生成トレーディングカードメディアアートAdobe MAXOpen AIベリサーブ音声生成AI松木晋祐Bardブラック・ジャック村井源稲葉通将マーダーミステリーCEDEC2023XRVeoRunwayGPT-5Amadeus CodeeSportsワークショップクラウドAlphaZeroAIりんなカメラ環世界中島秀之宮路洋一理化学研究所テンセント人事DARPAドローン人工生命ASBSぱいどんAI美空ひばり手塚眞GDC Summer岡島学eスポーツスタンフォード大学テニスBLUE PROTOCOLaibo銭起揚自動運転車TransformerGPT-2シミュレーション哲学現代アートバンダイナムコ研究所ELYZANVIDIA RivaEpic GamesrinnaSNS松尾豊データマイニングゲームエンジンImagenバイアスサム・アルトマンデザインNEDO森山和道自動翻訳アーケードゲームセガ類家利直大澤博隆SFプロトタイピングコナミデジタルエンタテインメントtext-to-imagetext-to-3DDreamFusionAIロボ「迷キュー」に挑戦Preferred NetworksPaLMGitHub CopilotGen-1ControlNet大阪大学建築イーロン・マスクStable Diffusion XLAudio2FaceGoogle I/OFireflyTikTok立教大学KLabLLaMAハリウッドテキスト画像生成AIユニバーサルミュージック法律LoRA論文NianticApple Vision ProCEDEC2024Runway Gen-3 AlphaスーパーマリオブラザーズWhiskSIGGRAPH Asia 2024DeepSeekGDC 2025Veo 3JSAI2025CEDEC2025OpenAI Fiveピクサービッグデータナラティブエージェントシミュレーション眞鍋和子齊藤陽介成沢理恵お知らせMagic Leap Oneサルでもわかる人工知能リップシンキングUbisoft La Forge知識表現IGDAどうぶつしょうぎジェイ・コウガミ音楽ストリーミングマシンラーニング5G対話エンジンシーマン人工知能研究所ゴブレット・ゴブラーズ完全情報ゲームウェイポイントパス検索藤澤仁画像認識DeNA長谷洋平ぎゅわんぶらあ自己中心派ウロチョロスNBAフェイクニュースウィル・ライトレベルデザインGPUALifeオルタナティヴ・マシンサウンドスケープTRPGAI Dungeonゼビウス不気味の谷写真松井俊浩パックマン通しプレイ本間翔太馬淵浩希中嶋謙互レコメンドシステム軍事PyTorchモンテカルロ木探索バンダイナムコスタジオ田中章愛サッカーバスケットボールVAERNNウォッチドッグス レギオンHALOMITMuZeroRival Peakリトル・コンピュータ・ピープルコンピューティショナル・フォトグラフィー絵画坂本洋典釜屋憲彦生物学StyleCLIPmasumi toyotaTextWorldBingMagentaGTC2021CycleGANNetHackAIボイスアクター南カリフォルニア大学NVIDIA CanvasNetEaseナビゲーションメッシュ深層強化学習ELYZA DIGESTELIZALEFT 4 DEADプラチナエッグイーサリアムボエダ・ゴティエOmniverse ReplicatorNVIDIA DRIVE SimNVIDIA Isaac SimDisneyAI会話ジェネレーターグランツーリスモ・ソフィーVTuberフォートナイトQosmoポケモンCodexSoul Machinesバーチャルキャラクター対談GTC 2022SiemensクラウドコンピューティングOpenSeaGDC 2022Earth-2エコロジーELYZA Pencil医療キャラクターモーションRPGSIGGRAPH 2022LaMDAマジック:ザ・ギャザリング介護Romi松原仁武田英明フルコトデータ分析MILEWCCFWORLD CLUB Champion Football柏田知大田邊雅彦トレカMax Cooper京都芸術大学ラベル付け秋期GTC2022野々下裕子pixivセキュリティ3DスキャンMicrosoft Designerイラスト柿沼太一ScenarioAIピカソAI素材.comAndreessen HorowitzQA Tech Night下田純也桑野範久DreamerV3Blenderゲーム背景Point-EアパレルBIMGPTPhotoshopChatGPT4コミコパTencentTEZUKA2023大阪公立大学オムロン サイニックエックス橋本敦史宮本道人LLaMA 2Hugging FacexAIストライキVoyagerIBMソフトバンクSIGGRAPH2023音源分離Web3BitSummitファインチューニンググランツーリスモ量子コンピュータ北野宏明立福寛FSM-DNNMindAgent効果音NVIDIA ACE慶應義塾大学ヒストリアAI Frog Interactive新清士ComfyUISuno AIKaKa CreationVOICEVOXGPTs3D Gaussian SplattingGDC 2024ポケットモンスターインフルエンサーSIMAGemma 2Inworld AIIEEE早稲田大学Apple IntelligenceWWDCWWDC 2024Perplexityくまうた濱田直希ソニー・インタラクティブエンタテインメント遊戯王佐竹空良九州大学伊藤黎Sakana AIByteDanceLINEヤフーDOOMGameNGen社員インタビューMovie GenSynthIDPlayable!MobileSneaksPeridot早瀬悠真Veo 2SONYProject SidRazerGDCCube 3DモリカトロンAIコネクトベンチマークHao AI LabClaudeモリカコミックジョージア工科大学MeshyFlowOpenAI o3Gemini 2.5-proGemini 2.5 Flash ImageKeep4oEXPO2025大阪・関西万博アトラクチャー中村政義森旭彦Sora 2Veo 3.1ゲーム映像パラメータ設計バランス調整Dota 2ソーシャルゲーム淡路滋グリムノーツゴティエ・ボエダGautier BoedaJuliusTPRGバーチャル・ヒューマン・エージェントクーガー石井敦茂谷保伯マジック・リープノンファンジブルトークン里井大輝GEMS COMPANY初音ミク転移学習デバッギング北尾まどか将棋ナップサック問題SpotifyReplica Studioamuseクラウドゲーミング和田洋一StadiaSIGGRAPH 2019iPhoneAIGraph予期知能ドラゴンクエストPAIRアルスエレクトロニカ2019逆転オセロニア奥村エルネスト純齋藤精一高橋智隆ロボユニ泉幸典ロボコレ2019意思決定モデルLEFT ALIVE長谷川誠Baby Xロバート・ダウニー・Jr.The Age of A.I.レコメンデーションMOBA研修mynet.ai人工音声プレイ動画群知能Sporeデノイズ画像処理CPUGMAIウィザードリィ西川善司サムライスピリッツストリートファイター山野辺一記大里飛鳥13フェイズ構造Oculus Quest生体情報照明山崎陽斗立木創太GameGANソサエティ5.0SIGGRAPH 2020DIB-RApex LegendsNinjaTENTUPLAYMARVEL Future Fightタイムラプスバスキア階層型強化学習WANN竹内将セリア・ホデントUX認知科学ゲームデザインLUMINOUS ENGINELuminous Productionsパターン・ランゲージちょまどFPSマルコフ決定過程協調フィルタリングAlphaDogfight TrialsStarCraft IIFuture of Life InstituteIntelLAIKARotomationドラゴンクエストライバルズ不確定ゲームEmbeddingGTC2020NVIDIA MAXINEビデオ会議階層的クラスタリングtoio SDK for UnityGDMCMITメディアラボMagendaDDSPKaggleAssassin’s Creed OriginsSea of ThievesmonoAI technologyOculusテストBaldur's Gate 3Candy Crush SagaSIGGRAPH ASIA 2020BigGANMaterialGANReBeLVolvoRival PrakユービーアイソフトメタルギアソリッドVFSM汎用言語モデルChitrakar巡回セールスマン問題ジョルダン曲線リアリティ番組ジョンソン裕子MILEsインタラクティブ・ストリーミングインタラクティブ・メディアLudoArtEmisGROVERFAIRチート検出オンラインカジノRealFlowDeep FluidsMeInGameブレイン・コンピュータ・インタフェースBCILearning from VideoユクスキュルカントエージェントアーキテクチャOCTOPATH TRAVELER西木康智OCTOPATH TRAVELER 大陸の覇者StyleRigいただきストリート大森田不可止ザナック仁井谷正充Azure Machine Learning脱出ゲームHybrid Reward ArchitectureSuper PhoenixProject MalmoProject PaidiaProject LookoutWatch Forジミ・ヘンドリックスカート・コバーンエイミー・ワインハウスダフト・パンクGlenn MarshallStory2HallucinationJukeboxSIFTDCGANDANNCEハーバード大学デューク大学ローグライクゲームNeurIPS 2021ヒップホップ詩サイレント映画環境音粒子群最適化法進化差分法下川大樹高津芳希大石真史BEiTDETRSentropyDiscordCALMプログラミングソースコード生成シチズンデベロッパーGitHubMCN-AI連携モデル並木幸介森寅嘉SIGGRAPH 2021半導体Topaz Video Enhance AIDLSSDynamixyzU-NetADVXLandDEATH STRANDINGEric JohnsonコジマプロダクションデシマエンジンMaxim PeterJoshua Romoffハイパースケープミライ小町テスラTesla BotTesla AI Dayバズグラフニュースタンテキ東芝倉田宜典韻律射影韻律転移コンピュータRPGアップルタウン物語KELDICメロディ言語AstroEgo4D日経イノベーション・ラボ敵対的強化学習GOSU Data LabGOSU Voice AssistantSenpAI.GGMobalyticsAWS Sagemaker形態素解析AWS Lambda誤字検出SentencePiece竹村也哉GOAPAdobe MAX 2021Omniverse AvatarNVIDIA MegatronNVIDIA MerlinNVIDIA Metropolisテキサス大学AI Messenger VoicebotOpenAI CodexHyperStyleRendering with StyleDisneyリサーチGauGANGauGAN2画像言語表現モデルSIGGRAPH ASIA 2021ディズニーリサーチMitsuba2ワイツマン科学研究所CG衣装VRファッションArtflowEponym音声クローニングGopher鑑定Oxia PalusArt RecognitionNHC 2021池田利夫新刊案内マーベル・シネマティック・ユニバースMCUアベンジャーズDigital DomainMasquerade2.0フェイシャルキャプチャー山田暉LSTMモリカトロンAIソリューションコード生成AIAlphaCodeCodeforces自己増強型AICOLMAPADOPGANverse3DグランツーリスモSPORTGTソフィーFIAグランツーリスモチャンピオンシップDGX A100Webcam VTuber星新一賞Live NationWeb3.0AIOpsスマートコントラクトメディア政治NightCafeLuis Ruiz東京工業大学博報堂ラップZ世代AIラッパーシステムプラスリンクス ~キミと繋がる想い~STCStyle Transfer ConversationRCPRinna Character PlatformAmeliaGateboxANIMAK逢妻ヒカリセコムバーチャル警備システム損保ジャパン上原利之アッパーグラウンド品質保証AutodeskBentley SystemsワールドシミュレーターH100COBOLDGX H100DGX SuperPODInstant NeRFartonomousbitGANsコミュニティ管理オンラインゲーム気候変動マックス・プランク気象研究所ビョルン・スティーブンス気象モデル気象シミュレーション環境問題SDGsメモリスタ音声変換Veap JapanEAP福井千春メンタルケアEdgar Handy東京理科大学産業技術総合研究所リザバーコンピューティングソニーマーケティングもじぱ暗号通貨FUZZLEAlterationオープンワールドAIFAP2EStyleGAN-NADAUnity for IndustryGLIDEAvatarCLIPSynthetic DataSonanticCohereUrzas.aiKikiZoetic AIペットDigital Dream LabsCozmoタカラトミーLOVOTMOFLINミクシィユニロボットユニボGato汎用強化学習AIロンドン芸術大学Google BrainSound ControlSYNTH SUPERKarl SimsArtnomeICONATE浜中雅俊福井健策WikipediaSphereXaver 1000養蜂Beewiseフィンテック投資MILIZE三菱UFJ信託銀行西成活裕群衆マネジメントライブビジネス新型コロナ周済涛清田陽司サイバネティックス人工知能史AI哲学マップ星新一StyleGAN-XLStyleGAN3GANimatorVoLux-GANProjected GANSelf-Distilled StyleGANニューラルレンダリングPLATOframe.ioFoodly中川友紀子アールティBlenderBot 3Meta AIマーク・ザッカーバーグWACULAIライティングAIのべりすとQuillBotCopysmithJasperヴィトゲンシュタイン論理哲学論考PromptBaseバンダイナムコネクサスユーザーレビューmimicBaiduERNIE-ViLG古文書凸版印刷AI-OCR画像判定実況パワフルサッカー桃太郎電鉄桃鉄パワサカ岩倉宏介PPOMachine Learning Project Canvas国立情報学研究所石川冬樹スパコンスーパーコンピュータ松岡 聡TSUBAME 1.0TSUBAME 2.0ABCI富岳Society 5.0夏の電脳甲子園座談会NVIDIA GET3DAI絵師UGCPGCNovelAINovelAI Diffusionモーションデータポーズ推定メッシュ生成メルセデス・ベンツMagic LeapEpyllionマシュー・ボールムーアの法則Adobe MAX 2022Adobe ResearchGalactica映像解析東芝デジタルソリューションズSATLYS 映像解析AIPFN 3D ScanPFN 4D ScanDreamUpDeviantArtWaifu Diffusion元素法典Novel AICALAアフォーダンスPaLM-SayCanCode as PoliciesCaPコリジョンチェック山口情報芸術センター[YCAM]YCAMアンラーニング・ランゲージカイル・マクドナルドローレン・リー・マッカーシー鎖国[Walled Garden]プロジェクトSIGGRAPH ASIA 2022VToonifyControlVAE変分オートエンコーダーフォトグラメトリ回帰型ニューラルネットワークDeepJoinAzure OpenAI ServiceDeepLDeepL Writeシンギュラリティレイ・カーツワイルヴァーナー・ヴィンジRunway ResearchMake-A-VideoPhenakiDreamixText-to-ImageモデルLatitudeneoAIDreamIconmignstudiffuse対話型AIモデルnotenote AIアシスタントKetchupAI NewsArt SelfieArt TransferPet PortraitsBlob OperaクリムトクリティックネットワークアクターネットワークDMLabControl SuiteAtari 100kAtari 200MYann LeCun鈴木雅大コンセプトアートColie Wertzリドリー・スコット絵コンテストーリーボードPaLM APIMakerSuiteSkebDreambooth-Stable-DiffusionGoogle EarthGEPPETTO AIStable Diffusion web UIAI modelAI ModelsZMO.AIMOBBY’SモビーディックダイビングアウトドアAIスキャニング自動採寸3DLOOKSizerワコールスニーカーUNSTREETNewelseCheckGoods二次流通中古市場Dupe Killer偽ブランド配信ソニー・ピクチャーズ アニメーションFosters+PartnersZaha Hadid ArchitectsライブポートレイトWonder Studio土木インフラAmazon BedrockX.AIX Corp.TwitterXホールディングスMagiSDXLRTFKTNIKEClone X村上隆Digital MarkSnapchatクリエイターコミュニティバーチャルペットNVIDIA NeMo Serviceヴァネッサ・ローザVanessa A Rosa陶芸Play.ht音声AILiDARPolycamdeforumハーベストForGamesゲームマーケット岡野翔太郡山喜彦ジェフリー・ヒントンGoogle I/O 2023武蔵野美術大学BingAILightroomCanvaBOOTHpixivFANBOX虎の穴Fantiaとらのあな集英社少年ジャンプ+ComicCopilotゲームマスターInowrld AIMODGhostwriterSkyrimスカイリムRPGツクールMZChatGPT_APIMZダンジョンズ&ドラゴンズOracle RPG深津貴之xVASynthLaser-NVMERFAlibabaVQRFnvdiffrecNeRFMeshingLERFマスタリングリアム・ギャラガーグライムスBoomyジョン・レジェンドザ・ウィークエンドドレイクエッジワークス日本音楽作家団体協議会FCAVoiceboxさくらインターネットぷよぷよTCGQRコード囲碁デンソーデンソーウェーブ原昌宏日本機械学会ロボティクス・メカトロニクス講演会トヨタ自動車かんばん方式プロット生成FastGAN4コママンガElevenLabsHeyGenAfter Effects絵本出版Ammaar ReshiStoriesStoryBirdVersedProlificDreamerUnity SentisUnity MuseCaleb Ward宮田龍清河幸子西中美和安野貴博斧田小夜CM3leonStable DoodleT2I-Adapter日本マネジメント総合研究所Lily Hughes-RobinsonColossal Cave AdventureAdventureGPTリリー・ヒューズ=ロビンソンBabyAGIGPT-3.5 Turboカーリングウィンブルドン戦術分析パフォーマンス測定IoTProFitXWatsonxAthleticaコーチング北見工業大学北見カーリングホール画像解析じりつくんNTT SportictAIカメラSTADIUM TUBEPixelllot S3AIスマートコーチDreamboothヤン・ルカンPerfusionニューラル物理学毛髪荒牧英治中ザワヒデキ大屋雄裕中川裕志Adreeseen HorowitzNVIDIA Avatar Cloud EngineReplica StudiosSmart NPCsRoblox StudioPromethean AIMusiioEndelSonarSonar+DDolby AtmosSonar Music Festivalライゾマティクス真鍋大度花井裕也Ritchie HawtinErica SynthUfuk Barış MutluJapanese InstructBLIP Alpha日本新聞協会AIいらすとやAI PicassoEmposyAIタレントAIタレントエージェンシーmodi.aiBitSummit Let’s Go!!デジタルレプリカGOT7synthesiaHumanRFActors-HQSAG-AFTRAWGAチャーリー・ブルッカー岡野原大輔自己教師あり学習In-Context Learning(ICL)qubitIBM Quantum System 2ダリオ・ヒルジェン・スン・フアンHuggingFaceStable Audio宗教仏教コカ・コーラ食品Coca‑Cola Y3000 Zero SugarCopilot Copyright Commitmentテラバース京都大学音声解析感情分析周 済涛ステートマシンディープニューラルネットワークハイブリッドアーキテクチャAdobe Max 2023Bing ChatBing Image CreatorAssistant with BardThe ArcadeSearch Generative ExperienceDynalangVLE-CEAI ActEUArs ElectronicaAI規制欧州委員会欧州議会欧州理事会MusicLMAudioLMMusicCapsAudioCraftMubertMubert RenderGen-2Runway AI Film FestivalPreVizCharacter-LLM復旦大学Chat-Haruhi-Suzumiya涼宮ハルヒEmu VideoペリドットDream TrackMusic AI ToolsLyriaYahoo!知恵袋インタラクティブプロンプトAI石渡正人手塚プロダクション林海象古川善規大規模再構成モデルLRMObjaverseMVImgNetOne-2-3-453Dガウシアンスプラッティングワンショット3D生成技術FGDCFuture Game Development Conference佐々木瞬Anique中村太一エグゼリオCopilotserial experiments lainAI lainPCGPCGRLDungeons&Dragonsビートルズザ・ビートルズ: Get BackDemucs音楽編集ソフトAdobe AuditioniZotopeRX10MoisesレベルファイブGenie AISIGGRAPH Asia 2023C·ASEFLAREダンスMagicAnimateAnimate Anyoneインテリジェントコンピュータ研究所アリババDreaMovingVISCUITScratchスクラッチビスケットプログラミング教育VALL-EDeepdub.aiAUDIOGENEvoke MusicAutoFoleyColourlab.AiディズニーLargo.aiCinelyticTaskadePika.artAI Filmmaking AssistantAI Screenwriter芥川賞文学恋愛タップルAbema TVNEC木村屋GPT Store生成AIチェッカーユーザーローカル九段理江東京都同情塔4Dオブジェクト生成モデルAlign Your GaussiansAYGMAV3Dファーウェイ4D Gaussian Splatting4D-GSGlazeWebGlazeNightShadeSpawningHave I Been Trained?FortniteUnreal Editor For FortniteVolumetricsAIワールドジェネレーターRosebud AI GamemakerLayerCharisma.ai調査Meta QuestIP強いAI弱いAILumiereUNetImageFXMusicFXTextFXKeyframerGemini 1.5AI StudioVertex AIChat with RTXSlackSlack AIPokémon Battle Scopekanaeru占い行動ロジック生成AIConvaiNTTドコモEmemeGenie汎用AIエージェントAIファッションウィークGrok-1Mixture-of-ExpertsMoEClaude 3Claude 3 HaikuClaude 3 SonnetClaude 3 Opus森永乳業C2PAゲーミフィケーションTomo KiharaPlayfool遊びtsukurun地方創生吉田直樹素材OpenAI JapanVoice EngineCommand R+Oracle Cloud InfrastructureGoogle WorkspaceUdio立命館大学京都精華大学TacticAINPMPFOOHProject AstraGoogle I/O 2024感情認識音声加工マルタ大学田中達大Move AIICRA2024大規模基盤モデルTorobo東京ロボティクスインピーダンス制御深層予測学習日立製作所尾形哲也AIREC汎用ロボットオムロンサイニックエックスViLaInPDDLニューサウスウェールズ大学Claude Sammutオックスフォード大学Lars Kunze杉浦孔明田向権VASA-1VoxCeleb2AniTalker上海大学LumaDream MachineNTTAI野々村真GPT-4-turbo佐藤恵助大道麻由物語構造分析慶応義塾大学渡邉謙吾ここ掘れ!プッカ大柳裕⼠加納基晴研究開発事例赤羽進亮UDI(Universal Duel Interface)第一工科大学小林篤史荻野宏実ビヘイビアブランチWPPGeneral Computer Control(GCC)CradleSpiral.AIItakoLLM-7b静岡大学明治大学北原鉄朗中村栄太日本大学ヤマハ前澤陽増田聡採用科学史AIサイエンティストTerraAI Overview電通AICO2BitSummit DriftOmega CrafterSPACE INVADIANS西島大介吉田伸一郎SIGGRAPH2024Motion-I2VToonify3D生成対向ネットワーク拡散モデルDiffusionうめ小沢高広ドリコムai andSaaSインサイトカスタマーサポートComfyUI-AdvancedLivePortraitGUIVideo to VideoiPhone 16OpenAI o1AIスマートリンクシャープウェアラブルCE-LLMCommunication Edge-LLMAIペットYahoo!ニュースAI Comic FactoryAI comic GeneratorComicsMaker.aiLlamaGen.aiGAZAIFlame Planner動画ゲーム生成モデルVirtuals ProtocolMarioVGG松原卓二Art Transfer 2Art Selfie 2Musical CanvasThe Forever LabyrinthRefik AnadolAlexander RebenRhizomatiksMolmoPixMoQwen2 72BDepth ProVARIETASAI面接官キリンホールディングス空間コンピューティングDream ScreenFirefly Video ModelStable Video 4DAI受託開発事例田中志弥Playable!3DAdobe MAX 2024IllustratorMeta Quest 3XR-ObjectsOrion防犯O2Scam DetectionLive Threat Detection乗換NAVITIMEKaedim3DFY.aiLuma AIAvaturnBestatOasisDecartDejaboom!UnboundedEtched声優パブリシティ権日本俳優連合日本芸能マネージメント事業者協会日本声優事業社協議会IAPPTripo 2.0Meta 3D Genスマートシティ都市計画松本雄太Genie 2World LabsCybeverThird Dimension AI東北大学Gemini 2.0フロンティアワークス機械翻訳SimplifiedAI Voice over GeneratorAI Audio EnhancerエーアイAITalkコエステーションPlayStationVRMLTechno Magicゴーストバスターズスパイダーマンポリフォニー・デジタル荒牧伸志AlteraRobert YangProject AVAStreamlabsIntelligent Streaming AssistantProject DIGITSスーパーコンピューターエージェンテックAI Shortsテルアビブ大学DiffUHaulTrailBlazerヴィクトリア大学ウェリントンzeroscopeQNeRFカーネギーメロン大学RALFグラフィックメイクCanvasProjectsDeepSeek-R1LoopyリップシンクCyberHostOmniHuman-1CSAMImagen 3Google LabsMicrosoft Museゲーム生成モデルWHAMデモンストレーターChatGPT Edu滋賀大学キリンビール桜AIカメラSolist-AIロームFactorioカリフォルニア大学GamingAgentAnthropicClaude 3.7 SonnetFactorio Learning EnvironmentFLEDeepseek-v3Gemini-2-FlashLlama-3.3-70BGPT-4o-MiniZOZO NEXTZOZOFashion Intelligence SystemPartial Visual-Semantic EmbeddingWEARGPT-4Vソイル大学AIパズルジェネレーターDolphinGemmaWild Dolphin ProjectSoundStreamトークナイザー音声処理技術GPT-4.1GPT-4.1 miniGPT-4.1 nanoLINE AILINE AIトークサジェストGTC2025Fuxi LabNaraka:Bladepoint MobileバトルロイヤルビヘイビアツリーSoftServeALNAIRAMRIBLADEGAGAQUEENRunway Gen-4SkyReelsStable Virtual CameraIntangibleブライアン・イーノEnoBrain OneAlphaEvolveContinuous Thought Machine(CTM)ArmStable Audio Open SmallWord2WorldSTORY2GAMEウィットウォーターランド大学森川の頭の中花森リドGoogle I/O 2025Lyra 2MusicFX DJAnimon.aiツインズひなひまMayaDeep Q-LearningAlphaGOスペースインベーダープリンス・オブ・ペルシャドラゴンクエストIV堀井雄二山名学タイトーカプコンUbi AnvilエンジンV1 Video ModelArtificial AnalysisVideo ArenaVideo Model LeaderboardClaude 3.5Mistral樋口恭介Claude 4小川 昴ホラーゲームStable Diffusion 1.5階層型物語構造夏目漱石漱石書簡京都情報大学院大学上野未貴ブラウザCometKiroAww Inc.Visual BankTHE PENFUJIYAMA AI SOUND富士通西浦めめヘッドウォータース下斗米貴之ディプロマシーCluade Opus 4ChatGPT o3カリフォルニア大学サンディエゴ校Everyテトリス逆転裁判ロゼッタ広報MavericksNoLang 4.0gpt-oss金井大組織作りCygnusTaurus笠原達也バグチケット都築圭太仁木一順ライフレビューSIGGRAPH 2025Text-to-MotionMiegakureSide InternationalRazer Cortex: Playtest Program - Powered by SideStable Audio 2.5Veo 3 FastGenie 3Dynamics LabMagica 2Mirage 2ペンシルバニア大学コーネル大学HOLODECK 2.0Nano Banana市場調査GoogleクラウドゲームエイトQ-STAR小栗伸重藤井啓祐水野弘之AnimeGamer香港城市大学ニューヨーク大学God's Innovation ProjectGIPマインドスポーツチェスGrok 4華南理工大学池上⾼志ミュージックビデオTOWA TEI椎名林檎中村剛森山尋西健一スキップE-ONEPICTOYはらぺこミーム任天堂ギフトピアちびロボ!いきものづくりクリエイトーイ大盛り! いきものづくりクリエイトーイドラゴンリーグドラゴンポーカー城とドラゴンkoROBOコンパニオンAIcharacter.aiNomi.aiMETA LOOP DESIGN LTD.MEOHiClubSynClubStarleyCotomoLivetoonkaiwaコンパニオンロボットヒューマノイドRealbotix顔認識Cluade1XNEOジュネーブ大学NadineMIXIPanasonicNICOBOGemini Robotics 1.5XR BlocksLLMERペンシルバニア州立大学SIMA 2日本IBMシリアスゲームセガXDAI俳優Adobe MAX 2025
NVIDIA、画像内オブジェクトのドラッグ&ドロップ、動きを制御できる動画生成モデルを発表
GPUメーカー最大手のNVIDIAは、AIシステムやグラフィックAIの研究にも熱心に取り組んでいます。そうした研究成果はSIGGRPAHとSIGRRAPH Aisaの採択論文からうかがうことができ、SIGGRAPH Asia 2024でも同社から20本の論文が採択されました。モリカトロンAIラボではSIGGRAPH Asia 2024を特集した記事をすでに公開していますが、本稿ではこの記事では取り上げていないNVIDIA関連論文を3本紹介します。
画像内オブジェクトのドラッグ&ドロップを可能とする「DiffUHaul」
イスラエルにあるテルアビブ大学らと共同研究した「DiffUHaul」は、画像内の任意のオブジェクトをドラッグ&ドロップできるモデルです。ドラッグしたオブジェクトがあった箇所は、画面全体の整合性を損なわないように背景等が補完されます。
一見すると簡単そうな以上のタスクを遂行するために、DiffUHaulでは以下のような3つのモジュールが実装されています。
- BlobGEN:画像内のオブジェクトの位置を識別したうえで、画像全体の構図を認識するモデル。このモデル自体は、NVIDIA研究チームが、機械学習に関する世界規模のカンファレンスICML 2024で発表した。
- Gated Self-Attention:BlobGENが識別したオブジェクトから特徴を抽出して、抽出した特徴にもとづいたオブジェクトを生成するモデル。
- Soft Attention Anchoring:Gated Self-Attentionが生成したオブジェクトを移動させながら再生成するモデル。移動処理時には、移動時間に応じて画像生成する位置を変化させる。その結果として、視覚的なドラック&ドロップを実現する。

研究チームは、DiffUHaulと類似した機能をもつ既存AIとの比較実験を行いました。以下の画像が実験結果をまとめたものですが、画像群の1行目がドラッグ&ドロップ前の画像(黄色の点がドラッグしたい位置)、もっとも下の行がDiffUHaulの出力画像、1行目とDiffUHaul出力行のあいだの行は類似既存AIの出力画像です。これらの画像を見ると、DiffUHaulでは指定した位置にオブジェクトをドラッグできているのに対して、類似既存AIは失敗しているのがわかります。

なお、DiffUHaulの制限事項としてオブジェクトの回転を伴うドラッグ&ドロップができない、オブジェクトの大きさを変えるリサイズができない、そしてほかのオブジェクトの後ろに隠れるような位置にドラッグ&ドロップする衝突処理ができない、といったことがあります。

複数のオブジェクトの動きを制御できる動画生成モデル「TrailBlazer」
現在の動画生成モデルにおける研究課題として、動画内オブジェクトの動きの制御や複雑な編集が挙げられます。こうしたなか、NVIDIAとヴィクトリア大学ウェリントンの共同研究チームは、複数のオブジェクトの動きを制御可能な動画生成モデル「TrailBlazer」を発表しました。
TrailBlazerはオープンソースの動画生成モデル「zeroscope」に、キーフレーム制御補完技法を統合することで実現しました。この技法は、動画内の任意のフレームを2つ選択すると、選択したフレーム間の動きが滑らかになるように、フレーム群を自動的に補完する既存技術です。この技術と動画生成を統合した結果、(左右や上下のような)典型的な動きと動く対象の位置を矩形によって指定するテンプレートを選択したうえで、動画の内容を決定するプロンプトを入力すると、そうした設定に沿った動画を出力できるようになりました。

複数のオブジェクトの動きを制御する場合、例えば「黄色い犬と白い猫」が動いている動画を生成する時は、各オブジェクトを個別に生成した後、それらが衝突しないように合成されます。「公園にいる黄色い犬と白い猫」のように背景情報をプロンプトで追加すると、背景が合成されます。背景プロンプトを変えれば、背景が異なった動画が生成されます。


オブジェクト位置を指定する矩形のサイズが変化する設定、例えば小さい矩形が大きい矩形になりながら横に移動するような場合、オブジェクトが画面奥から手前に動いているような遠近法的演出が可能となります。

TrailBlazerは、グラフィック技術では一般的なオブジェクトが別のそれに変化するモーフィングも実現します。例えば「subject(Cat→Dog)」というプロンプトを入力すると、猫が犬に変化しながら動く動画が生成されます。

TrailBlazerにおける動画生成処理自体は一般的な動画生成モデルと変わらないものなので、これらのモデルに見られる制約が認められます。具体的には、以下の画像のように歪んだ形状のオブジェクト(画像では自動車)を生成したり、白黒の体毛ではないパンダが生成されたりします。

以上のような限界があるものも、簡単な操作で生成動画を制御できるTrailBlazerは、専門的スキルがないユーザが意図した動画をAIによって制作する可能性を示しています。
3Dシーン内のオブジェクトを編集できる「QNeRF」
複数の2D画像を素材にして3Dシーンを生成するNeRFはすでに普及している技法ですが、同技法によって生成された3Dシーンを編集する技法はまだ発展途上です。こうしたなかNVIDIAとカーネギーメロン大学らの研究チームが発表したNeRFの発展技法「QNeRF」は、3Dシーンの編集を実現しました。
QNeRFは、生成された3Dシーンに対して、棒人間を使ってポーズを指定したり、長方形などの簡単な3Dオブジェクトで大きさと形状を指定したりすると、その指定にしたがって3Dシーン内のオブジェクトを編集する、というものです。例えば3Dシーン内のスパイダーマンのフィギュアのポーズや、ソファの数あるいは大きさを変えることができます。


QNeRFでは、以下のような3つの処理が実行されています。
- 画像からの特徴抽出:3Dシーンを生成する過程で生成される2D画像に関して、指定された編集内容を反映した画像の特徴を抽出する(以下の画像「①」部分)。
- ノイズの除去と特徴の学習:抽出された特徴からノイズを除去しながら、特徴情報の解像度を上げていく(以下の画像「②」部分)。
- 特徴のフィードバック:解像度が上がった特徴を画像生成処理に戻すことで、生成処理全体からノイズを減らす。

QNeRFの特徴学習では、9層のレイヤーが用いられます。これらのレイヤーは処理できる解像度が異なっており、処理できる解像度が高いレイヤーに段階的に入力することで、特徴情報の解像度を上げていきます。

研究チームは、QNeRFの出力結果と既存技法のそれを比較する実験を行いました。その結果をまとめたのが、以下の画像群です。「Input Image」が入力された3Dシーン画像、「Input Control」が入力画像におけるポーズ、「Target Control」が出力時のポーズを意味しています。右側の列「Ours」がQNeRFの出力画像とその深度マップを表し、その左側に並んでいる画像群が既存技法の出力結果です。QNeRFが鮮明な画像を出力する一方で、既存技法では輪郭が不明瞭な画像が出力されていることがわかります。

画像生成モデルの一種であるQNeRFは、画像生成モデル全般に認められる制約があります。具体的には、人間の手先のような複雑かつ微細なオブジェクトの画像生成に失敗する場合があり、その結果として不整合な3Dシーンを生成してしまいます。なお、研究チームは今後の課題として、NeRFの後継技法と言えるガウシアンスプラッティングでも3Dシーン編集可能とすることをかかげています。
以上のようにNVIDIAは、グラフィックAIの可能性を押し広げるような研究に継続的に取り組んでいます。SIGGRAPH 2024 Asiaでは動画生成AIや3Dオブジェクト生成に関する論文が多数発表されましたが、2025年のSIGGRAPGHではゲーム生成AIに関する最新研究が披露されるかもしれません。そして、そうした先進的な研究に関して、NVIDIAがその一翼を担うと見て間違いないでしょう。
Writer:吉本幸記









