モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。

TAG LIST: CG CGへの扉生成AI 安藤幸央吉本幸記月刊エンタメAIニュース河合律子 LLM OpenAI 機械学習大規模言語モデルディープラーニンググーグル Google 音楽 NVIDIA モリカトロン ChatGPT 森川幸人 GAN 三宅陽一郎 DeepMind 強化学習 Stable Diffusion 人工知能学会シナリオニューラルネットワーク QA マイクロソフト倫理自然言語処理 SIGGRAPH AIと倫理 GPT-3 スクウェア・エニックス大内孝子映画アート Facebook 音楽生成AI ルールベース著作権 3DCG 動画生成AI キャラクターAI NPC デバッグ敵対的生成ネットワークアニメーションロボットゲームプレイAI Minecraft モリカトロンAIラボインタビュープロシージャルディープフェイク NFT 画像生成 VFX ファッション StyleGAN DALL-E2 マルチモーダル Red Ram Gemini Adobe 遺伝的アルゴリズムメタAI 教育自動生成テストプレイ Midjourney VR 小説マンガ Meta Stability AI 画像生成AI GPT-4o インタビューゲームAI ボードゲーム深層学習 CEDEC2019 toio Microsoft マインクラフト CLIP テキスト画像生成 Playable!NeRF Sora 不完全情報ゲームビヘイビア・ツリー DALL-E CEDEC2021 バーチャルヒューマンデジタルツインメタバース ELSI 高橋力斗作曲アストロノーカロボティクスナビゲーションAI 畳み込みニューラルネットワーク AR アップル SIGGRAPH ASIA スポーツ手塚治虫汎用人工知能 3D 広告 CEDEC2020 AIアートはこだて未来大学エージェント GDC 2021 メタ市場分析デジタルヒューマン東京大学 JSAI2022 プロンプト GPT-4 GDC 2019 マルチエージェント HTN ソニー栗原聡 CNN マーケティング懐ゲーから辿るゲームAI技術史鴫原盛之アドベンチャーゲーム NVIDIA Omniverse CEDEC2022 ジェネレーティブAI DALL-E 3 言霊の迷宮 CM 音声認識 Ubisoft 階層型タスクネットワーク YouTube JSAI2020 Microsoft Azure 模倣学習 Unity インディーゲーム音声合成 BERT Omniverse Roblox がんばれ森川君2号 Netflix GPT-3.5 AIQVE ONE 世界モデル GTC2023 JSAI2023 電気通信大学 Apple JSAI2024 ブロックチェーンイベントレポート対話型エージェント人狼知能シーマン水野勇太ガイスター斎藤由多加 SF 研究シムシティシムピープル TEZUKA2020 スパーシャルAI Electronic Arts メタデータ TensorFlow キャリア Amazon DQN SIE アバター Genvid Technologies StyleGAN2 JSAI2021 Zork MCS-AI動的連携モデルモーションキャプチャー AGI 高橋ミレイ Cygames サイバーエージェント合成音声モリカトロン開発者インタビュー宮本茂則チャットボット AWS 徳井直生 GTC2022 Unreal Engine テキスト生成デザイントレーディングカードメディアアート text-to-image Adobe MAX Open AI ベリサーブ音声生成AI 松木晋祐 Bard ControlNet ブラック・ジャック村井源稲葉通将ユニバーサルミュージックマーダーミステリー CEDEC2023 LoRA XR Veo Runway GPT-5 Amadeus Code eSports ワークショップクラウド AlphaZero AIりんなカメラ環世界中島秀之宮路洋一理化学研究所テンセント人事 DARPA ドローン人工生命 ASBS ぱいどん AI美空ひばり手塚眞 GDC Summer 岡島学 eスポーツスタンフォード大学テニス BLUE PROTOCOL aibo 銭起揚自動運転車 Transformer GPT-2 シミュレーション哲学現代アートバンダイナムコ研究所 ELYZA NVIDIA Riva Epic Games rinna SNS 松尾豊データマイニングゲームエンジン Imagen バイアスサム・アルトマン NEDO 森山和道自動翻訳アーケードゲームセガ類家利直大澤博隆 SFプロトタイピングコナミデジタルエンタテインメント text-to-3D DreamFusion AIロボ「迷キュー」に挑戦 Preferred Networks PaLM GitHub Copilot Gen-1 大阪大学建築イーロン・マスク Stable Diffusion XL Audio2Face Google I/O Firefly TikTok 立教大学 KLab LLaMA ハリウッドテキスト画像生成AI 法律論文 Niantic 新清士 Apple Vision Pro ByteDance CEDEC2024 Runway Gen-3 Alpha スーパーマリオブラザーズ Whisk SIGGRAPH Asia 2024 DeepSeek モリカトロンAIコネクト GDC 2025 モリカコミック Veo 3 JSAI2025 OpenAI o3 CEDEC2025 Sora 2 OpenAI Five ピクサービッグデータナラティブエージェントシミュレーション眞鍋和子齊藤陽介成沢理恵お知らせ Magic Leap One サルでもわかる人工知能リップシンキング Ubisoft La Forge 知識表現 IGDA どうぶつしょうぎジェイ・コウガミ音楽ストリーミングマシンラーニング 5G 対話エンジンシーマン人工知能研究所ゴブレット・ゴブラーズ完全情報ゲームウェイポイントパス検索藤澤仁画像認識 DeNA 長谷洋平ぎゅわんぶらあ自己中心派ウロチョロス NBA フェイクニュースウィル・ライトレベルデザイン GPU ALife オルタナティヴ・マシンサウンドスケープ TRPG AI Dungeon ゼビウス不気味の谷写真松井俊浩パックマン通しプレイ本間翔太馬淵浩希中嶋謙互レコメンドシステム軍事 PyTorch モンテカルロ木探索バンダイナムコスタジオ田中章愛サッカーバスケットボール VAE RNN ウォッチドッグスレギオン HALO MIT MuZero Rival Peak リトル・コンピュータ・ピープルコンピューティショナル・フォトグラフィー絵画坂本洋典釜屋憲彦生物学 StyleCLIP masumi toyota TextWorld Bing Magenta GTC2021 CycleGAN NetHack AIボイスアクター南カリフォルニア大学 NVIDIA Canvas NetEase ナビゲーションメッシュ深層強化学習 ELYZA DIGEST ELIZA LEFT 4 DEAD プラチナエッグイーサリアムボエダ・ゴティエ Omniverse Replicator NVIDIA DRIVE Sim NVIDIA Isaac Sim Disney AI会話ジェネレーターグランツーリスモ・ソフィー VTuber フォートナイト Qosmo ポケモン Codex Soul Machines バーチャルキャラクター対談 GTC 2022 Siemens クラウドコンピューティング OpenSea GDC 2022 Earth-2 エコロジー ELYZA Pencil 医療キャラクターモーション RPG SIGGRAPH 2022 LaMDA マジック：ザ・ギャザリング介護 Romi 松原仁武田英明フルコトデータ分析 MILE WCCF WORLD CLUB Champion Football 柏田知大田邊雅彦トレカ Max Cooper 京都芸術大学ラベル付け秋期GTC2022 野々下裕子 pixiv セキュリティ 3Dスキャン Microsoft Designer イラスト柿沼太一 Scenario AIピカソ AI素材.com Andreessen Horowitz QA Tech Night 下田純也桑野範久 note DreamerV3 Blender ゲーム背景 Point-E アパレル BIM GPT Photoshop ChatGPT4 コミコパ Tencent TEZUKA2023 大阪公立大学オムロンサイニックエックス FastGAN 橋本敦史宮本道人 LLaMA 2 Hugging Face xAI ストライキ Voyager IBM ソフトバンク SIGGRAPH2023 音源分離 Web3 BitSummit ファインチューニンググランツーリスモ量子コンピュータ北野宏明立福寛 FSM-DNN MindAgent 効果音 NVIDIA ACE 慶應義塾大学ヒストリア AI Frog Interactive ComfyUI Suno AI KaKa Creation VOICEVOX GPTs 3D Gaussian Splatting GDC 2024 ポケットモンスターインフルエンサー SIMA Gemma 2 Inworld AI IEEE 早稲田大学 Apple Intelligence WWDC WWDC 2024 Perplexity くまうた濱田直希ソニー・インタラクティブエンタテインメント遊戯王佐竹空良九州大学伊藤黎 Sakana AI LINEヤフー DOOM GameNGen 社員インタビュー Movie Gen SynthID Playable!Mobile Sneaks Peridot 声優早瀬悠真 Veo 2 機械翻訳 SONY Project Sid Razer GDC Cube 3D ベンチマーク Hao AI Lab Claude ジョージア工科大学 Meshy Flow Gemini 2.5-pro Gemini 2.5 Flash Image Keep4o Nano Banana EXPO2025 大阪・関西万博アトラクチャー中村政義森旭彦 Veo 3.1 はらぺこミーム SIGGRAPH Asia 2025 ゲーム映像パラメータ設計バランス調整 Dota 2 ソーシャルゲーム淡路滋グリムノーツゴティエ・ボエダ Gautier Boeda Julius TPRG バーチャル・ヒューマン・エージェントクーガー石井敦茂谷保伯マジック・リープノンファンジブルトークン里井大輝 GEMS COMPANY 初音ミク転移学習デバッギング北尾まどか将棋ナップサック問題 Spotify Replica Studio amuse クラウドゲーミング和田洋一 Stadia SIGGRAPH 2019 iPhone AIGraph 予期知能ドラゴンクエスト PAIR アルスエレクトロニカ2019 逆転オセロニア奥村エルネスト純齋藤精一高橋智隆ロボユニ泉幸典ロボコレ2019 意思決定モデル LEFT ALIVE 長谷川誠 Baby X ロバート・ダウニー・Jr.The Age of A.I.レコメンデーション MOBA 研修 mynet.ai 人工音声プレイ動画群知能 Spore デノイズ画像処理 CPU GMAI ウィザードリィ西川善司サムライスピリッツストリートファイター山野辺一記大里飛鳥 13フェイズ構造 Oculus Quest 生体情報照明山崎陽斗立木創太 GameGAN ソサエティ5.0 SIGGRAPH 2020 DIB-R Apex Legends Ninja TENTUPLAY MARVEL Future Fight タイムラプスバスキア階層型強化学習 WANN 竹内将セリア・ホデント UX 認知科学ゲームデザイン LUMINOUS ENGINE Luminous Productions パターン・ランゲージちょまど FPS マルコフ決定過程協調フィルタリング AlphaDogfight Trials StarCraft II Future of Life Institute Intel LAIKA Rotomation ドラゴンクエストライバルズ不確定ゲーム Embedding GTC2020 NVIDIA MAXINE ビデオ会議階層的クラスタリング toio SDK for Unity GDMC MITメディアラボ Magenda DDSP Kaggle Assassin’s Creed Origins Sea of Thieves monoAI technology Oculus テスト Baldur's Gate 3 Candy Crush Saga SIGGRAPH ASIA 2020 BigGAN MaterialGAN ReBeL Volvo Rival Prak ユービーアイソフトメタルギアソリッドV FSM 汎用言語モデル Chitrakar 巡回セールスマン問題ジョルダン曲線リアリティ番組ジョンソン裕子 MILEs インタラクティブ・ストリーミングインタラクティブ・メディア Ludo ArtEmis GROVER FAIR チート検出オンラインカジノ RealFlow Deep Fluids MeInGame ブレイン・コンピュータ・インタフェース BCI Learning from Video ユクスキュルカントエージェントアーキテクチャ OCTOPATH TRAVELER 西木康智 OCTOPATH TRAVELER 大陸の覇者 StyleRig いただきストリート大森田不可止ザナック仁井谷正充 Azure Machine Learning 脱出ゲーム Hybrid Reward Architecture Super Phoenix Project Malmo Project Paidia Project Lookout Watch For ジミ・ヘンドリックスカート・コバーンエイミー・ワインハウスダフト・パンク Glenn Marshall Story2Hallucination Jukebox SIFT DCGAN DANNCE ハーバード大学デューク大学ローグライクゲーム NeurIPS 2021 ヒップホップ詩サイレント映画環境音粒子群最適化法進化差分法下川大樹高津芳希大石真史 BEiT DETR Sentropy Discord CALM プログラミングソースコード生成シチズンデベロッパー GitHub MCN-AI連携モデル並木幸介森寅嘉 SIGGRAPH 2021 半導体 Topaz Video Enhance AI DLSS Dynamixyz U-Net ADV XLand DEATH STRANDING Eric Johnson コジマプロダクションデシマエンジン Maxim Peter Joshua Romoff ハイパースケープミライ小町テスラ Tesla Bot Tesla AI Day バズグラフニュースタンテキ東芝倉田宜典韻律射影韻律転移コンピュータRPG アップルタウン物語 KELDIC メロディ言語 Astro Ego4D 日経イノベーション・ラボ敵対的強化学習 GOSU Data Lab GOSU Voice Assistant SenpAI.GG Mobalytics AWS Sagemaker 形態素解析 AWS Lambda 誤字検出 SentencePiece 竹村也哉 GOAP Adobe MAX 2021 Omniverse Avatar NVIDIA Megatron NVIDIA Merlin NVIDIA Metropolis テキサス大学 AI Messenger Voicebot OpenAI Codex HyperStyle Rendering with Style Disneyリサーチ GauGAN GauGAN2 画像言語表現モデル SIGGRAPH ASIA 2021 ディズニーリサーチ Mitsuba2 ワイツマン科学研究所 CG衣装 VRファッション Artflow Eponym 音声クローニング Gopher 鑑定 Oxia Palus Art Recognition NHC 2021 池田利夫新刊案内マーベル・シネマティック・ユニバース MCU アベンジャーズ Digital Domain Masquerade2.0 フェイシャルキャプチャー山田暉 LSTM モリカトロンAIソリューションコード生成AI AlphaCode Codeforces 自己増強型AI COLMAP ADOP GANverse3D グランツーリスモSPORT GTソフィー FIAグランツーリスモチャンピオンシップ DGX A100 Webcam VTuber 星新一賞 Live Nation Web3.0 AIOps スマートコントラクトメディア政治 NightCafe Luis Ruiz 東京工業大学博報堂ラップ Z世代 AIラッパーシステムプラスリンクス～キミと繋がる想い～STC Style Transfer Conversation RCP Rinna Character Platform Amelia Gatebox ANIMAK 逢妻ヒカリセコムバーチャル警備システム損保ジャパン上原利之アッパーグラウンド品質保証 Autodesk Bentley Systems ワールドシミュレーター H100 COBOL DGX H100 DGX SuperPOD Instant NeRF artonomous bitGANs コミュニティ管理オンラインゲーム気候変動マックス・プランク気象研究所ビョルン・スティーブンス気象モデル気象シミュレーション環境問題 SDGs メモリスタ音声変換 Veap Japan EAP 福井千春メンタルケア Edgar Handy 東京理科大学産業技術総合研究所リザバーコンピューティングソニーマーケティングもじぱ暗号通貨 FUZZLE Alteration オープンワールド AIFA P2E StyleGAN-NADA Unity for Industry GLIDE AvatarCLIP Synthetic Data Sonantic Cohere Urzas.ai Kiki Zoetic AI ペット Digital Dream Labs Cozmo タカラトミー LOVOT MOFLIN ミクシィユニロボットユニボ Gato 汎用強化学習AI ロンドン芸術大学 Google Brain Sound Control SYNTH SUPER Karl Sims Artnome ICONATE 浜中雅俊福井健策 Wikipedia Sphere Xaver 1000 養蜂 Beewise フィンテック投資 MILIZE 三菱UFJ信託銀行西成活裕群衆マネジメントライブビジネス新型コロナ周済涛清田陽司サイバネティックス人工知能史 AI哲学マップ星新一 StyleGAN-XL StyleGAN3 GANimator VoLux-GAN Projected GAN Self-Distilled StyleGAN ニューラルレンダリング PLATO frame.io Foodly 中川友紀子アールティ BlenderBot 3 Meta AI マーク・ザッカーバーグ WACUL AIライティング AIのべりすと QuillBot Copysmith Jasper ヴィトゲンシュタイン論理哲学論考 PromptBase バンダイナムコネクサスユーザーレビュー mimic Baidu ERNIE-ViLG 古文書凸版印刷 AI-OCR 画像判定実況パワフルサッカー桃太郎電鉄桃鉄パワサカ岩倉宏介 PPO Machine Learning Project Canvas 国立情報学研究所石川冬樹スパコンスーパーコンピュータ松岡聡 TSUBAME 1.0 TSUBAME 2.0 ABCI 富岳 Society 5.0 夏の電脳甲子園座談会 NVIDIA GET3D AI絵師 UGC PGC NovelAI NovelAI Diffusion モーションデータポーズ推定メッシュ生成メルセデス・ベンツ Magic Leap Epyllion マシュー・ボールムーアの法則 Adobe MAX 2022 Adobe Research Galactica 映像解析東芝デジタルソリューションズ SATLYS 映像解析AI PFN 3D Scan PFN 4D Scan DreamUp DeviantArt Waifu Diffusion 元素法典 Novel AI CALA アフォーダンス PaLM-SayCan Code as Policies CaP コリジョンチェック山口情報芸術センター［YCAM］YCAM アンラーニング・ランゲージカイル・マクドナルドローレン・リー・マッカーシー鎖国［Walled Garden］プロジェクト SIGGRAPH ASIA 2022 VToonify ControlVAE 変分オートエンコーダーフォトグラメトリ回帰型ニューラルネットワーク DeepJoin Azure OpenAI Service DeepL DeepL Write シンギュラリティレイ・カーツワイルヴァーナー・ヴィンジ Runway Research Make-A-Video Phenaki Dreamix Text-to-Imageモデル Latitude neoAI DreamIcon mign studiffuse 対話型AIモデル note AIアシスタント Ketchup AI News Art Selfie Art Transfer Pet Portraits Blob Opera クリムトクリティックネットワークアクターネットワーク DMLab Control Suite Atari 100k Atari 200M Yann LeCun 鈴木雅大コンセプトアート Colie Wertz リドリー・スコット絵コンテストーリーボード PaLM API MakerSuite Skeb Dreambooth-Stable-Diffusion Google Earth GEPPETTO AI Stable Diffusion web UI AI model AI Models ZMO.AI MOBBY’S モビーディックダイビングアウトドア AIスキャニング自動採寸 3DLOOK Sizer ワコールスニーカー UNSTREET Newelse CheckGoods 二次流通中古市場 Dupe Killer 偽ブランド配信ソニー・ピクチャーズアニメーション Fosters+Partners Zaha Hadid Architects ライブポートレイト Wonder Studio 土木インフラ Amazon Bedrock X.AI X Corp.Twitter Xホールディングス Magi SDXL RTFKT NIKE Clone X 村上隆 Digital Mark Snapchat クリエイターコミュニティバーチャルペット NVIDIA NeMo Service ヴァネッサ・ローザ Vanessa A Rosa 陶芸 Play.ht 音声AI LiDAR Polycam deforum ハーベスト ForGames ゲームマーケット岡野翔太郡山喜彦ジェフリー・ヒントン Google I/O 2023 武蔵野美術大学 BingAI Lightroom Canva BOOTH pixivFANBOX 虎の穴 Fantia とらのあな集英社少年ジャンプ＋ComicCopilot ゲームマスター Inowrld AI MOD Ghostwriter Skyrim スカイリム RPGツクールMZ ChatGPT_APIMZ ダンジョンズ&ドラゴンズ Oracle RPG 深津貴之 xVASynth Laser-NV MERF Alibaba VQRF nvdiffrec NeRFMeshing LERF マスタリングリアム・ギャラガーグライムス Boomy ジョン・レジェンドザ・ウィークエンドドレイクエッジワークス日本音楽作家団体協議会 FCA Voicebox さくらインターネットぷよぷよ TCG QRコード囲碁デンソーデンソーウェーブ原昌宏日本機械学会ロボティクス・メカトロニクス講演会トヨタ自動車かんばん方式プロット生成 4コママンガ ElevenLabs HeyGen After Effects 絵本出版 Ammaar Reshi Stories StoryBird Versed ProlificDreamer Unity Sentis Unity Muse Caleb Ward 宮田龍清河幸子西中美和安野貴博斧田小夜 CM3leon Stable Doodle T2I-Adapter 日本マネジメント総合研究所 Lily Hughes-Robinson Colossal Cave Adventure AdventureGPT リリー・ヒューズ＝ロビンソン BabyAGI GPT-3.5 Turbo カーリングウィンブルドン戦術分析パフォーマンス測定 IoT ProFitX Watsonx Athletica コーチング北見工業大学北見カーリングホール画像解析じりつくん NTT Sportict AIカメラ STADIUM TUBE Pixelllot S3 AIスマートコーチ Dreambooth ヤン・ルカン Perfusion ニューラル物理学毛髪荒牧英治中ザワヒデキ大屋雄裕中川裕志 Adreeseen Horowitz NVIDIA Avatar Cloud Engine Replica Studios Smart NPCs Roblox Studio Promethean AI Musiio Endel Sonar Sonar+D Dolby Atmos Sonar Music Festival ライゾマティクス真鍋大度花井裕也 Ritchie Hawtin Erica Synth Ufuk Barış Mutlu Japanese InstructBLIP Alpha 日本新聞協会 AIいらすとや AI Picasso Emposy AIタレント AIタレントエージェンシー modi.ai BitSummit Let’s Go!!デジタルレプリカ GOT7 synthesia HumanRF Actors-HQ SAG-AFTRA WGA チャーリー・ブルッカー岡野原大輔自己教師あり学習 In-Context Learning（ICL）qubit IBM Quantum System 2 ダリオ・ヒルジェン・スン・フアン HuggingFace Stable Audio 宗教仏教コカ・コーラ食品 Coca‑Cola Y3000 Zero Sugar Copilot Copyright Commitment テラバース京都大学音声解析感情分析周済涛ステートマシンディープニューラルネットワークハイブリッドアーキテクチャ Adobe Max 2023 Bing Chat Bing Image Creator Assistant with Bard The Arcade Search Generative Experience Dynalang VLE-CE AI Act EU Ars Electronica AI規制欧州委員会欧州議会欧州理事会 MusicLM AudioLM MusicCaps AudioCraft Mubert Mubert Render Gen-2 Runway AI Film Festival PreViz Character-LLM 復旦大学 Chat-Haruhi-Suzumiya 涼宮ハルヒ Emu Video ペリドット Dream Track Music AI Tools Lyria Yahoo!知恵袋インタラクティブプロンプトAI 石渡正人手塚プロダクション林海象古川善規大規模再構成モデル LRM Objaverse MVImgNet One-2-3-45 3Dガウシアンスプラッティングワンショット3D生成技術 FGDC Future Game Development Conference 佐々木瞬 Anique 中村太一エグゼリオ Copilot serial experiments lain AI lain PCG PCGRL Dungeons&Dragons ビートルズザ・ビートルズ: Get Back Demucs 音楽編集ソフト Adobe Audition iZotope RX10 Moises レベルファイブ Genie AI SIGGRAPH Asia 2023 C·ASE FLARE ダンス MagicAnimate Animate Anyone インテリジェントコンピュータ研究所アリババ DreaMoving VISCUIT Scratch スクラッチビスケットプログラミング教育 VALL-E Deepdub.ai AUDIOGEN Evoke Music AutoFoley Colourlab.Ai ディズニー Largo.ai Cinelytic Taskade Pika.art AI Filmmaking Assistant AI Screenwriter 芥川賞文学恋愛タップル Abema TV NEC 木村屋 GPT Store 生成AIチェッカーユーザーローカル九段理江東京都同情塔 4Dオブジェクト生成モデル Align Your Gaussians AYG MAV3D ファーウェイ 4D Gaussian Splatting 4D-GS Glaze WebGlaze NightShade Spawning Have I Been Trained?Fortnite Unreal Editor For Fortnite Volumetrics AIワールドジェネレーター Rosebud AI Gamemaker Layer Charisma.ai 調査 Meta Quest IP 強いAI 弱いAI Lumiere UNet ImageFX MusicFX TextFX Keyframer Gemini 1.5 AI Studio Vertex AI Chat with RTX Slack Slack AI Pokémon Battle Scope kanaeru 占い行動ロジック生成AI Convai NTTドコモ Ememe Genie 汎用AIエージェント AIファッションウィーク Grok-1 Mixture-of-Experts MoE Claude 3 Claude 3 Haiku Claude 3 Sonnet Claude 3 Opus 森永乳業 C2PA ゲーミフィケーション Tomo Kihara Playfool 遊び tsukurun 地方創生吉田直樹素材 OpenAI Japan Voice Engine Command R+Oracle Cloud Infrastructure Google Workspace Udio 立命館大学京都精華大学 TacticAI NPMP FOOH Project Astra Google I/O 2024 感情認識音声加工マルタ大学田中達大 Move AI ICRA2024 大規模基盤モデル Torobo 東京ロボティクスインピーダンス制御深層予測学習日立製作所尾形哲也 AIREC 汎用ロボットオムロンサイニックエックス ViLaIn PDDL ニューサウスウェールズ大学 Claude Sammut オックスフォード大学 Lars Kunze 杉浦孔明田向権 VASA-1 VoxCeleb2 AniTalker 上海大学 Luma Dream Machine NTT AI野々村真 GPT-4-turbo 佐藤恵助大道麻由物語構造分析慶応義塾大学渡邉謙吾ここ掘れ！プッカ大柳裕⼠加納基晴研究開発事例赤羽進亮 UDI（Universal Duel Interface）第一工科大学小林篤史荻野宏実ビヘイビアブランチ WPP General Computer Control（GCC）Cradle Spiral.AI ItakoLLM-7b 静岡大学明治大学北原鉄朗中村栄太日本大学ヤマハ前澤陽増田聡採用科学史 AIサイエンティスト Terra AI Overview 電通 AICO2 BitSummit Drift Omega Crafter SPACE INVADIANS 西島大介吉田伸一郎 SIGGRAPH2024 Motion-I2V Toonify3D 生成対向ネットワーク拡散モデル Diffusion うめ小沢高広ドリコム ai and SaaS インサイトカスタマーサポート ComfyUI-AdvancedLivePortrait GUI Video to Video iPhone 16 OpenAI o1 AIスマートリンクシャープウェアラブル CE-LLM Communication Edge-LLM AIペット Yahoo!ニュース AI Comic Factory AI comic Generator ComicsMaker.ai LlamaGen.ai GAZAI Flame Planner 動画ゲーム生成モデル Virtuals Protocol MarioVGG 松原卓二 Art Transfer 2 Art Selfie 2 Musical Canvas The Forever Labyrinth Refik Anadol Alexander Reben Rhizomatiks Molmo PixMo Qwen2 72B Depth Pro VARIETAS AI面接官キリンホールディングス空間コンピューティング Dream Screen Firefly Video Model Stable Video 4D AI受託開発事例田中志弥 Playable!3D Adobe MAX 2024 Illustrator Meta Quest 3 XR-Objects Orion 防犯 O2 Scam Detection Live Threat Detection 乗換NAVITIME Kaedim 3DFY.ai Luma AI Avaturn Bestat Oasis Decart Dejaboom!Unbounded Etched パブリシティ権日本俳優連合日本芸能マネージメント事業者協会日本声優事業社協議会 IAPP Tripo 2.0 Meta 3D Gen スマートシティ都市計画松本雄太 Genie 2 World Labs Cybever Third Dimension AI 東北大学 Gemini 2.0 フロンティアワークス Simplified AI Voice over Generator AI Audio Enhancer エーアイ AITalk コエステーション PlayStation VRML Techno Magic ゴーストバスターズスパイダーマンポリフォニー・デジタル荒牧伸志 Altera Robert Yang Project AVA Streamlabs Intelligent Streaming Assistant Project DIGITS スーパーコンピューターエージェンテック AI Shorts テルアビブ大学 DiffUHaul TrailBlazer ヴィクトリア大学ウェリントン zeroscope QNeRF カーネギーメロン大学 RALF グラフィックメイク Canvas Projects DeepSeek-R1 Loopy リップシンク CyberHost OmniHuman-1 CSAM Imagen 3 Google Labs Microsoft Muse ゲーム生成モデル WHAMデモンストレーター ChatGPT Edu 滋賀大学キリンビール桜AIカメラ Solist-AI ローム Factorio カリフォルニア大学 GamingAgent Anthropic Claude 3.7 Sonnet Factorio Learning Environment FLE Deepseek-v3 Gemini-2-Flash Llama-3.3-70B GPT-4o-Mini ZOZO NEXT ZOZO Fashion Intelligence System Partial Visual-Semantic Embedding WEAR GPT-4V ソイル大学 AIパズルジェネレーター DolphinGemma Wild Dolphin Project SoundStreamトークナイザー音声処理技術 GPT-4.1 GPT-4.1 mini GPT-4.1 nano LINE AI LINE AIトークサジェスト GTC2025 Fuxi Lab Naraka:Bladepoint Mobile バトルロイヤルビヘイビアツリー SoftServe ALNAIR AMRI BLADE GAGA QUEEN Runway Gen-4 SkyReels Stable Virtual Camera Intangible ブライアン・イーノ Eno Brain One AlphaEvolve Continuous Thought Machine（CTM）Arm Stable Audio Open Small Word2World STORY2GAME ウィットウォーターランド大学森川の頭の中花森リド Google I/O 2025 Lyra 2 MusicFX DJ Animon.ai ツインズひなひま Maya Deep Q-Learning AlphaGO スペースインベーダープリンス・オブ・ペルシャドラゴンクエストIV 堀井雄二山名学タイトーカプコン Ubi Anvilエンジン V1 Video Model Artificial Analysis Video Arena Video Model Leaderboard Claude 3.5 Mistral 樋口恭介 Claude 4 小川昴ホラーゲーム Stable Diffusion 1.5 階層型物語構造夏目漱石漱石書簡京都情報大学院大学上野未貴ブラウザ Comet Kiro Aww Inc.Visual Bank THE PEN FUJIYAMA AI SOUND 富士通西浦めめヘッドウォータース下斗米貴之ディプロマシー Cluade Opus 4 ChatGPT o3 カリフォルニア大学サンディエゴ校 Every テトリス逆転裁判ロゼッタ広報 Mavericks NoLang 4.0 gpt-oss 金井大組織作り Cygnus Taurus 笠原達也バグチケット都築圭太仁木一順ライフレビュー SIGGRAPH 2025 Text-to-Motion Miegakure Side International Razer Cortex: Playtest Program - Powered by Side Stable Audio 2.5 Veo 3 Fast Genie 3 Dynamics Lab Magica 2 Mirage 2 ペンシルバニア大学コーネル大学 HOLODECK 2.0 市場調査 Googleクラウドゲームエイト Q-STAR 小栗伸重藤井啓祐水野弘之 AnimeGamer 香港城市大学ニューヨーク大学 God's Innovation Project GIP マインドスポーツチェス Grok 4 華南理工大学池上⾼志ミュージックビデオ TOWA TEI 椎名林檎中村剛森山尋西健一スキップ E-ONE PICTOY 任天堂ギフトピアちびロボ！いきものづくりクリエイトーイ大盛り！いきものづくりクリエイトーイドラゴンリーグドラゴンポーカー城とドラゴン koROBO コンパニオンAI character.ai Nomi.ai META LOOP DESIGN LTD.MEO HiClub SynClub Starley Cotomo Livetoon kaiwa コンパニオンロボットヒューマノイド Realbotix 顔認識 Cluade 1X NEO ジュネーブ大学 Nadine MIXI Panasonic NICOBO Gemini Robotics 1.5 XR Blocks LLMER ペンシルバニア州立大学 SIMA 2 日本IBM シリアスゲームセガXD AI俳優世永玲生 Adobe MAX 2025 Gemini 3 GenTabs Disco イレブンラボジャパン日本郵便年賀状 #Geminiで年賀状 Nano Banana Pro ENCODE Jewelry Planner (AI)EncodeRing Jewelry Designer Story Jewelry Designer AI JEWELRY MODEL 中国・西安交通大学 LacAIDes 工芸宝飾品ソウル文化高等学校 MineDojo Text-to-Video OmnimatteZero Snap X-UniMotion DreamO 人工知能のための哲学塾犬飼博士瀬尾浩二郎 Steam Larian Studios Divinity Clair Obscur: Expedition 33 Indie Game Award Playtika Krafton TranslateGemma ChatGPT ヘルスケア

CGへの扉 Vol.28：定番手法の他分野応用、自然言語処理AI由来の画像処理AI

2021.7.16アート

そもそも「応用」とは何か？

あるテクノロジーを対象に「応用すべき」とか「応用の余地がある」などと言いますが、実際のところ「応用」とは何を示すのでしょう。もちろん目も覚めるような今までに無かった新テクノロジーは魅力的ですが、世の中のテクノロジーすべてがそのような新規性の塊ではありません。実用化されているさまざまなテクノロジーは「応用」の賜物であり、原理や知識を現実的な事柄、または他分野の事柄にあてはめて利用することを一般的に「応用」と呼んでいます。

○○シェアやサブスクリプション（定期購買）といった、最近の流行りで新しいと思えるサービスも、実は他分野からすれば古くからあったサービス形態かもしれません。例えば一般の仕事場に設置し、100円入れると1個好きな時に自由にお菓子を持っていける「オフィスグリコ」も「富山の薬売り」のビジネスモデルを模倣したものです。

富山の薬売りは家庭用常備薬のつまった箱を個人の家に置いていき、その時点では費用はかからず、次に来た時に使った薬の分だけの費用を徴収するという仕組みです。もちろん、人工知能研究の多くのブレイクスルーも、脳の原理や仕組みを参考にコンピュータ上のアルゴリズムにあてはめ、それらが成果となって、現在のAI研究、AI実装が広がっています。

「CGへの扉 Vol.22：言葉から画像を生成、DALL-Eはクリエイティブなのか？」でも取り上げた OpenAI社の GPT-3 も、その前身となる GPT-2 は自然言語処理のモデルとして文章生成に長けた用途で注目を浴び、画像生成に応用したことで、さらに大きな注目を集めました。GPT-2 の画像応用例のひとつであるImageGPTでは画像の半分を用意すれば、残りの半分を AI が補ってくれるというわかりやすい応用例が示されたことも話題性のひとつでした。

ソースコード共有サービス GitHub が大量のソースコードから学習し、プログラミング中のソースコードに適切なコメント文とソースコードの最初の部分を書き始めると、続きの適切なソースコードを補完してくれるサービス “GitHub Copilot” を発表しました。Copilotの内部実装や学習モデルがどうなっているのかは不明ですが、Copilotの開発には GPT-2,3 の OpenAI社が関係しており、ソースコード用途に特化した、GPT-2,3の応用例とも言える、仕組みやアプローチも似通ったものではないかと予想されます。

CLIPDraw：事前学習の必要がない、文章から画像を描く仕組み

論文：https://arxiv.org/pdf/2106.14843.pdf
ソースコード：https://colab.research.google.com/github/kvfrans/clipdraw/blob/main/clipdraw.ipynb
論文の筆頭著者 Kevin Frans氏による解説：https://kvfrans.com/clipdraw-exploring-text-to-drawing-synthesis/

CLIPDrawは、クロスコンパス社、米国マサチューセッツ工科大学、東京工業大学、東京大学の共同研究チームによる、事前学習を必要とせずに文章から絵を描くAI活用のアルゴリズムです。人間は言葉による豊かな風景描写、状況説明に長けており、文章だけで構成される小説を読んで、そこで描かれている風景をとても具体的に想像したり、また逆に一度見ただけの風景や状況を言葉で人に伝えることができたりします。言葉から描画したり、描画したものを言葉で説明したり、まったく同じ、完璧な再現は無理かもしれませんが、言葉と描くものとが人間の理解する仕組みの中で、重要な役目を果たしているのは確かです。

CLIPDraw は OpenAI社から公開されているCLIPをベースとしています。CLIPでは事前の学習なしで、写真画像の説明として適切なものを単語1つまたは数語の言葉からパラメータ評価することができました。CLIPDrawでは勾配降下法を用い、最初はまったくランダムな描画から始まり、ストローク（描画の軌跡）を変化させつつ描いた画像をCLIPで評価し、評価が高いものに合わせるよう描く線のパラメータを微調整します。その描画と評価を数百回繰り返すという反復的な方法を用い、文章に書かれた内容を理解したかのような絵を描いていくことができます。

CLIPDrawではさらに、形や雰囲気といった描き方に加えて「スタイル」という要素もあわせ持っています。例えば指定の言葉の中に「3Dレンダリング」などの言葉を含めると、CGで作られたワイヤーフレーム画像のような、それっぽい画像が生成されるそうです。

CLIPDrawで描かれた様々な説明文による猫。一番右は「3Dワイヤーフレームモデルの猫」

正直200回から500回も繰り返して最適化された描画も、確かに猫や馬、飛行機などとギリギリ読み取れるくらいの絵で、子どもの落書き程度にしか見えません。けれども子供の落書きも数か月、数年の成長で驚くほど精彩で正確なものに、時には芸術性が評価されるようなものにまで進化することを考えると、AIが描画の腕を磨く過程は、これから見逃せないものになるのかもしれません。

CLIPDrawを使い、さまざまな言葉を与えてAIに描かせることで、人間でさえも表現が難しい、AIが導き出した「幸福」や「不幸」といった表現しづらい概念を、どう絵で表現できるかにも興味が湧いてくることでしょう。

BEiTの登場。画像処理版のBERT

論文：https://arxiv.org/pdf/2106.08254.pdf

BEiT（Bidirectional Encoder representation from Image Transformers）は Microsoft Researchの研究で、自然言語処理で注目を浴びているBERT（Bidirectional Encoder Representations from Transformers）の考え方を画像に応用したものです。

BERTの特徴である、自己教師あり事前学習モデルの利点を、画像処理にも活かしたのが BEiT です。機械学習の学習データとして用いられる「教師ありデータ」とは、人間が目視と手動で判別ラベルをつけたデータのことで、この種のデータを膨大に事前学習して機械学習の精度を高めます。しかしこの手法の場合人間が判別したラベルに間違いが含まれる場合があることと、正確なデータを膨大とも言える必要な量を用意することが困難なため、AIの実用においておおきな課題になっていました。

BERTを既存研究と比較した時のブレイクスルーは、自己教師学習を可能にした点です。これは言葉通り、自分自身を教師として学ぶことができる仕組みです。例えば、ある単語の次に出現する頻度の高い単語を学習するには、大量の文章データから事前にAI自身が文章の中から単語が欠けた問題と正しい文章を参照した正答を用意し、人の手を借りずとも、大量に学習していける点にあります。

これと同じ考えで、画像処理においてもわざと画像の一部を欠けさせたり、画像の解像度を落とした問題を作り、元画像を正答とすることで、画像処理においても自己教師あり事前学習モデルを実現させることができると考えられます。ところが定型文や言い回しがある程度決まっている文章とは異なり、画像の場合は一部が欠けていても、その穴を埋める画像は無限に存在することが考えられます。

BEiTが行なったアプローチは MIM（Masked Image Modeling）と呼ばれる事前学習の方法です。これは学習対象となる画像を画素ごとに16×16ピクセルサイズのグリッド分割したものと、画像の特徴点を数字（Visual Token）で表現するTokenizerと数字（Visual Token）から画像に戻すDecoderを組み合わせます。画像の一部がランダムに欠けたものから元のVisual Tokenが得られるよう学習を繰り返すことで画像処理においても自己教師あり事前学習モデルを実現しています。ちなみに論文によるとVisual Tokenの生成手法は、OpenAIのDALL-E で使われている手法が応用しているもよう。

Facebook DETR 自然言語処理の手法を応用した物体検出

Facebook DETRによって検知された物体。100%の精度で象とシマウマが検出されている

論文：https://arxiv.org/pdf/2005.12872.pdf
Facebook AI の紹介ページ：https://ai.facebook.com/blog/end-to-end-object-detection-with-transformers/
ソースコード：https://github.com/facebookresearch/detr
解説動画：https://www.youtube.com/watch?v=T35ba_VXkMY

Facebook のAI研究チームが発表した2020年5月に発表した物体検出モデルDETRも、自然言語処理の方法を応用したものです。DETRは従来手法よりも高速化された手法で、ある物体の近くには、一緒にある物体が存在する可能性が高いといった文脈を理解して物体検知するのも特徴です。自然言語処理（NLP:Natural Language Processing）の世界のブレイクスルーであった Transformer モデルを物体検出に応用した事例です。

従来型の手法に比べ、Transformerの利点の一つに並列処理が可能な点があります。けれども画像検出にまつわる処理も逐次型のため、この Transformer の利点が活かしにくい分野ではありました。従来型の画像検出の手順としては、画像から物体を検出し、その後に何が写っているのかを分類し段階的に判別する必要がありました。

DETRでは画像から物体を場所と大きさを検知するとともに、画像に写っている物体同士の関係性を利用し、つながりのあるデータ群だと考えることによって Transformer の並列処理の利点を享受できるようになりました。例えばある写真に猫が写っているとすると、もうひとつ同じくらいの物体が存在すれば、それがもう一匹の猫である可能性が高く、猫よりも大きな物体が存在すれば、それは飼い主である人間が写っている可能性が高いといった写真ならではの関係性です。

まずは元となる画像を CNN(Convolutional Neural Network) に入力します。これによって特徴マップが生成されます。そこで生成された特徴マップを Transformer encoder-decoder に入力します。そうすると画像に写っているオブジェクトの個数、位置、サイズといった情報が得られます。得られた結果から “no object” となる物体として認識されなかったものを除外すると、画像全体の物体検出が完了します。

これからのAIの応用と成熟

元任天堂のゲーム開発者、横井軍平氏の著書『横井軍平ゲーム館』には「枯れた技術の水平思考」という考え方について書かれています。これは、すでに広く使われ、メリットやデメリットが明らかになっている技術をさまざまな分野に応用することで、今までになかったような使い道を生み出し、安価で安定した最大限の成果を得るという考え方です。決して古い技術を誉めたたえようという意味ではありません。

エンジニア気質が強い人や、研究志向の人であれば、常に最新技術を追い求め、独自性やオリジナリティを重視する状況もあるかもしれません。けれども今回紹介したテクノロジーや、人工知能の世界で話題になるテクノロジーは、何も目新しいものばかりではなく、旧来からあるテクノロジーを応用し、圧倒的な物量で驚くべき応用と成果を導き出していることが見受けられます。

また既存技術の組み合わせによって、あらたな応用例や現実的な用途に役立つ道筋を見出しているものも注目されています。そう考えると、これから話題になるであろう人工知能を応用するためのヒントは、そこここに転がっているのだと考えられるかもしれません。

本連載の今後の予定：「CGへの扉」では、単なるAIの話題とは少し異なり、CG/VFX, アートの文脈から話題を切り取り紹介していきます。映像制作の現場におけるAI活用や、AIで価値が高まった先進的なツール、これからの可能性を感じさせるような話題、テクノロジーの話題にご期待ください。何か取り上げて欲しいテーマやご希望などがございましたら、ぜひ編集部までお知らせください。

CGへの扉：

Vol.27：眼に追いつけ追い越せ？カメラは機械学習により進化

Vol.26：アートを加速させるAIの役割 #GTC2021 レポート

Vol.25：変幻自在の顔も実は人工知能

Vol.24：自然現象もすべて人工知能で再現する時代

Vol.23：AIで人の眼に進化するカメラ

Vol.22：言葉から画像を生成、DALL-Eはクリエイティブなのか？

Vol.20：Adobeと人工知能の将来を見極める #AdobeMAX2020

Vol.19：コミュニケーションツールの新境地「NVIDIA MAXINE」

Vol.18：SIGGRAPH2020レポート映像制作の現場で活躍する人工知能

Vol.17：描画を進化させるTensorFlow Graphicsの真価

Vol.16：バーチャル開催SIGGRAPH論文を先取り