モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。

TAG LIST: CG CGへの扉生成AI 安藤幸央吉本幸記月刊エンタメAIニュース河合律子機械学習ディープラーニング OpenAI LLM 大規模言語モデル Google NVIDIA 音楽グーグル GAN モリカトロン森川幸人 ChatGPT 三宅陽一郎 Stable Diffusion DeepMind 強化学習人工知能学会ニューラルネットワークシナリオマイクロソフト QA 自然言語処理 AIと倫理 GPT-3 倫理 Facebook 大内孝子映画 SIGGRAPH スクウェア・エニックス著作権アートキャラクターAI ルールベースゲームプレイAI Minecraft 敵対的生成ネットワーク NPC 音楽生成AI 動画生成AI モリカトロンAIラボインタビューアニメーション 3DCG 画像生成 NFT ロボットファッション DALL-E2 StyleGAN プロシージャルディープフェイクマルチモーダル VFX Midjourney 遺伝的アルゴリズムデバッグ自動生成 VR メタAI Meta 画像生成AI Red Ram マンガインタビューゲームAI Adobe Microsoft テストプレイマインクラフト小説 CLIP テキスト画像生成深層学習 CEDEC2019 toio 教育 NeRF デジタルツインメタバース不完全情報ゲーム Stability AI ボードゲーム DALL-E Sora ビヘイビア・ツリー CEDEC2021 CEDEC2020 作曲アストロノーカロボティクスナビゲーションAI 高橋力斗 AIアート Gemini メタ畳み込みニューラルネットワークアップルデジタルヒューマン ELSI Playable!スポーツはこだて未来大学エージェント GDC 2021 プロンプト GPT-4 手塚治虫汎用人工知能 JSAI2022 3D 広告 DALL-E 3 バーチャルヒューマン NVIDIA Omniverse GDC 2019 マルチエージェント CEDEC2022 市場分析 AR 懐ゲーから辿るゲームAI技術史鴫原盛之ジェネレーティブAI ソニー東京大学栗原聡 CNN マーケティング JSAI2024 CM BERT Microsoft Azure 音声認識言霊の迷宮 Unity Omniverse Ubisoft JSAI2023 Roblox がんばれ森川君2号電気通信大学 SIGGRAPH ASIA HTN Apple 階層型タスクネットワーク AIQVE ONE 世界モデルアドベンチャーゲームインディーゲーム JSAI2020 GTC2023 音声合成メタデータ TensorFlow ブロックチェーンイベントレポートキャリア模倣学習対話型エージェント Amazon サイバーエージェントトレーディングカードメディアアート DQN シーマン合成音声 SIE Runway 水野勇太モリカトロン開発者インタビュー宮本茂則アバターブラック・ジャック Genvid Technologies ガイスター StyleGAN2 徳井直生村井源稲葉通将斎藤由多加 Open AI ベリサーブ GTC2022 GPT-3.5 YouTube 音声生成AI SF Netflix JSAI2021 松木晋祐 Bard 研究シムシティシムピープル Zork GPT-4o MCS-AI動的連携モデルマーダーミステリーモーションキャプチャー TEZUKA2020 CEDEC2023 AGI テキスト生成スパーシャルAI Electronic Arts GDC Summer イーロン・マスク論文 Stable Diffusion XL 森山和道 Audio2Face NVIDIA Riva eスポーツスタンフォード大学アーケードゲームテニスセガ人狼知能 Google I/O 類家利直 Firefly eSports BLUE PROTOCOL CEDEC2024 aibo 大澤博隆 SFプロトタイピング銭起揚 Runway Gen-3 Alpha チャットボット TikTok text-to-3D DreamFusion 自動運転車ワークショップ Epic Games AIロボ「迷キュー」に挑戦 AWS Adobe MAX クラウド AlphaZero Preferred Networks Transformer GPT-2 rinna AIりんなカメラ環世界中島秀之 PaLM GitHub Copilot LLaMA 哲学 Apple Vision Pro ハリウッド宮路洋一 Whisk 理化学研究所 Gen-1 SIGGRAPH Asia 2024 テキスト画像生成AI 松尾豊人事データマイニング ControlNet 現代アート DARPA 法律ドローンゲームエンジン Unreal Engine Imagen 人工生命バイアスサム・アルトマン Veo ASBS ぱいどん AI美空ひばり手塚眞 LoRA デザイン GDC 2025 バンダイナムコ研究所 ELYZA NEDO 建築 ELIZA FSM-DNN MindAgent BIM LEFT 4 DEAD くまうた通しプレイソニー・インタラクティブエンタテインメント OpenAI Five Meshy 本間翔太馬淵浩希 Cygames 岡島学ピクサー九州大学プラチナエッグイーサリアム効果音ボエダ・ゴティエビッグデータ中嶋謙互 Amadeus Code データ分析自動翻訳 MILE NVIDIA ACE Veo 3 ナラティブ Niantic Omniverse Replicator WCCF レコメンドシステム NVIDIA DRIVE Sim WORLD CLUB Champion Football NVIDIA Isaac Sim Sakana AI 柏田知大軍事田邊雅彦トレカ慶應義塾大学 Max Cooper GPT Disney Photoshop PyTorch 京都芸術大学 ChatGPT4 モンテカルロ木探索 JSAI2025 ByteDance 眞鍋和子バンダイナムコスタジオコミコパヒストリア AI Frog Interactive 新清士ラベル付け田中章愛 ComfyUI 齊藤陽介コナミデジタルエンタテインメント成沢理恵お知らせ Magic Leap One Tencent サッカーバスケットボール LINEヤフー Suno AI KaKa Creation VOICEVOX text-to-image サルでもわかる人工知能 VAE TEZUKA2023 DOOM リップシンキング RNN GameNGen グランツーリスモ・ソフィー Ubisoft La Forge スーパーマリオブラザーズ社員インタビュー知識表現ウォッチドッグスレギオン VTuber IGDA 立教大学秋期GTC2022 大阪公立大学 HALO フォートナイト KLab どうぶつしょうぎジェイ・コウガミ音楽ストリーミング MIT 野々下裕子 Movie Gen Qosmo マシンラーニング 5G MuZero Rival Peak pixiv オムロンサイニックエックス GPTs セキュリティ対話エンジンポケモン 3Dスキャン橋本敦史リトル・コンピュータ・ピープル Codex シーマン人工知能研究所コンピューティショナル・フォトグラフィーゴブレット・ゴブラーズ絵画 3D Gaussian Splatting Microsoft Designer イラストシミュレーション Soul Machines 柿沼太一完全情報ゲームバーチャルキャラクター坂本洋典宮本道人釜屋憲彦 LLaMA 2 ウェイポイントパス検索 Hugging Face 対談藤澤仁生物学 XR GTC 2022 xAI 画像認識 Siemens ストライキ StyleCLIP DeNA Voyager 長谷洋平 GDC 2024 クラウドコンピューティング masumi toyota IBM ぎゅわんぶらあ自己中心派 OpenSea GDC 2022 Veo 2 ウロチョロス SNS TextWorld Earth-2 Bing エコロジー Magenta ソフトバンク SONY ポケットモンスター ELYZA Pencil Scenario SIGGRAPH2023 AIピカソ GTC2021 AI素材.com CycleGAN テンセント Andreessen Horowitz QA Tech Night NetHack 下田純也桑野範久キャラクターモーション音源分離 NBA フェイクニュースユニバーサルミュージック RPG ウィル・ライト Web3 SIGGRAPH 2022 レベルデザイン DreamerV3 SIMA AIボイスアクター南カリフォルニア大学 NVIDIA Canvas GDC GPU ALife オルタナティヴ・マシンサウンドスケープ LaMDA TRPG マジック：ザ・ギャザリング AI Dungeon 介護 BitSummit Gemma 2 Cube 3D ゼビウス NetEase Inworld AI モリカトロンAIコネクトゲーム背景 IEEE Point-E アパレル Claude 不気味の谷ナビゲーションメッシュファインチューニング早稲田大学グランツーリスモ写真高橋ミレイ北野宏明深層強化学習松原仁松井俊浩武田英明フルコトモリカコミックパックマン ELYZA DIGEST ジョージア工科大学 Apple Intelligence WWDC WWDC 2024 西成活裕ハイブリッドアーキテクチャ AI野々村真 LINE AIトークサジェスト Apex Legends 群衆マネジメントライブポートレイト GTC2025 Ninja コンピュータRPG ライブビジネス Wonder Studio Adobe Max 2023 GPT-4-turbo Fuxi Lab アップルタウン物語新型コロナ土木佐藤恵助 Naraka:Bladepoint Mobile KELDIC 周済涛 Bing Chat 大道麻由バトルロイヤルメロディ言語清田陽司インフラ Bing Image Creator 物語構造分析ビヘイビアツリーゲーム TENTUPLAY サイバネティックス慶応義塾大学 SoftServe MARVEL Future Fight Astro 人工知能史 Amazon Bedrock Assistant with Bard 渡邉謙吾 ALNAIR タイムラプス Ego4D AI哲学マップ The Arcade ここ掘れ！プッカ AMRI バスキア星新一 X.AI Search Generative Experience BLADE 日経イノベーション・ラボ StyleGAN-XL X Corp.Dynalang 濱田直希 GAGA 敵対的強化学習 StyleGAN3 Twitter VLE-CE 大柳裕⼠QUEEN 階層型強化学習 GOSU Data Lab GANimator Xホールディングス加納基晴 Runway Gen-4 WANN GOSU Voice Assistant VoLux-GAN Magi AI Act SkyReels 竹内将 SenpAI.GG Projected GAN EU 研究開発事例 Mobalytics Self-Distilled StyleGAN SDXL Ars Electronica 赤羽進亮 Stable Virtual Camera ニューラルレンダリング RTFKT AI規制遊戯王 Intangible AWS Sagemaker PLATO NIKE 欧州委員会 UDI（Universal Duel Interface）ブライアン・イーノ映像セリア・ホデント形態素解析 frame.io Clone X 欧州議会第一工科大学 Eno UX AWS Lambda Foodly 村上隆欧州理事会佐竹空良 Brain One 誤字検出 MusicLM 小林篤史 AlphaEvolve 認知科学中川友紀子 Digital Mark AudioLM Continuous Thought Machine（CTM）ゲームデザイン SentencePiece アールティ Snapchat MusicCaps 荻野宏実 Arm LUMINOUS ENGINE クリエイターコミュニティ AudioCraft 伊藤黎 Stable Audio Open Small Luminous Productions BlenderBot 3 バーチャルペットビヘイビアブランチ Word2World パターン・ランゲージ竹村也哉 Meta AI NVIDIA NeMo Service Mubert WPP STORY2GAME ちょまどマーク・ザッカーバーグヴァネッサ・ローザ Mubert Render General Computer Control（GCC）ウィットウォーターランド大学 GOAP WACUL Vanessa A Rosa Gen-2 Cradle 森川の頭の中 Adobe MAX 2021 陶芸 Runway AI Film Festival Spiral.AI 花森リド Play.ht PreViz ItakoLLM-7b Google I/O 2025 音声AI 静岡大学 AIライティング LiDAR Character-LLM 明治大学 Flow Omniverse Avatar AIのべりすと Polycam 復旦大学北原鉄朗 Lyra 2 FPS QuillBot deforum Chat-Haruhi-Suzumiya 中村栄太 MusicFX DJ マルコフ決定過程 NVIDIA Megatron Copysmith 涼宮ハルヒ日本大学 Animon.ai NVIDIA Merlin Jasper ハーベスト Emu Video ヤマハツインズひなひま NVIDIA Metropolis ForGames 前澤陽 Maya パラメータ設計ゲームマーケットペリドット増田聡 Deep Q-Learning バランス調整岡野翔太 Dream Track 採用 AlphaGO 協調フィルタリング郡山喜彦 Music AI Tools スペースインベーダーテキサス大学ジェフリー・ヒントン Lyria 科学史プリンス・オブ・ペルシャ Google I/O 2023 Yahoo!知恵袋 AIサイエンティストドラゴンクエストIV AlphaDogfight Trials AI Messenger Voicebot インタラクティブプロンプトAI Terra 堀井雄二エージェントシミュレーション OpenAI Codex 武蔵野美術大学 AI Overview 山名学 StarCraft II HyperStyle BingAI 石渡正人電通タイトー Future of Life Institute Rendering with Style 手塚プロダクション AICO2 カプコン Intel 林海象 BitSummit Drift Ubi Anvilエンジン LAIKA Disneyリサーチヴィトゲンシュタイン古川善規 V1 Video Model Rotomation GauGAN 論理哲学論考 Lightroom 大規模再構成モデル Omega Crafter Artificial Analysis GauGAN2 Canva LRM SPACE INVADIANS Video Arena ドラゴンクエストライバルズ画像言語表現モデル Objaverse 西島大介 Video Model Leaderboard 不確定ゲーム SIGGRAPH ASIA 2021 PromptBase BOOTH MVImgNet 吉田伸一郎 Claude 3.5 Dota 2 ディズニーリサーチ pixivFANBOX One-2-3-45 SIGGRAPH2024 Mistral Mitsuba2 バンダイナムコネクサス虎の穴 3Dガウシアンスプラッティング Motion-I2V ソーシャルゲーム Embedding ワイツマン科学研究所ユーザーレビュー Fantia ワンショット3D生成技術樋口恭介 GTC2020 CG衣装 mimic とらのあな Toonify3D Claude 4 NVIDIA MAXINE VRファッション Baidu 集英社 FGDC 生成対向ネットワーク小川昴淡路滋ビデオ会議 Artflow ERNIE-ViLG 少年ジャンプ＋Future Game Development Conference 拡散モデルホラーゲームグリムノーツ Eponym 古文書 ComicCopilot 佐々木瞬 Diffusion Stable Diffusion 1.5 ゴティエ・ボエダ音声クローニング凸版印刷階層型物語構造 Gautier Boeda 階層的クラスタリング Gopher AI-OCR ゲームマスターうめ夏目漱石画像判定 Inowrld AI 小沢高広漱石書簡 Julius 鑑定 MOD Anique ドリコム京都情報大学院大学 TPRG Oxia Palus Ghostwriter 中村太一 ai and 上野未貴バーチャル・ヒューマン・エージェント toio SDK for Unity Art Recognition Skyrim エグゼリオ SaaS クーガー実況パワフルサッカースカイリム Copilot インサイト石井敦 NHC 2021 桃太郎電鉄 RPGツクールMZ カスタマーサポート茂谷保伯池田利夫桃鉄 ChatGPT_APIMZ serial experiments lain ComfyUI-AdvancedLivePortrait GDMC 新刊案内パワサカダンジョンズ&ドラゴンズ AI lain GUI マーベル・シネマティック・ユニバース Oracle RPG PCG MITメディアラボ MCU 岩倉宏介深津貴之 PCGRL アベンジャーズ PPO xVASynth Dungeons&Dragons Video to Video マジック・リープ Digital Domain Machine Learning Project Canvas Laser-NV ビートルズ iPhone 16 Magenda Masquerade2.0 国立情報学研究所ザ・ビートルズ: Get Back OpenAI o1 ノンファンジブルトークン DDSP フェイシャルキャプチャー石川冬樹 MERF Demucs AIスマートリンクスパコン Alibaba 音楽編集ソフトシャープ里井大輝 Kaggle スーパーコンピュータ VQRF Adobe Audition ウェアラブル山田暉松岡聡 nvdiffrec iZotope CE-LLM Assassin’s Creed Origins AI会話ジェネレーター TSUBAME 1.0 NeRFMeshing RX10 Communication Edge-LLM Sea of Thieves TSUBAME 2.0 LERF Moises GEMS COMPANY monoAI technology LSTM ABCI マスタリング AIペットモリカトロンAIソリューション富岳レベルファイブ Yahoo!ニュース初音ミク Oculus コード生成AI Society 5.0 リアム・ギャラガー AI Comic Factory 転移学習テスト AlphaCode 夏の電脳甲子園グライムス AI comic Generator Baldur's Gate 3 Codeforces 座談会 Boomy ComicsMaker.ai Candy Crush Saga 自己増強型AI ジョン・レジェンド Genie AI LlamaGen.ai SIGGRAPH ASIA 2020 COLMAP ザ・ウィークエンド SIGGRAPH Asia 2023 GAZAI ADOP NVIDIA GET3D ドレイク C·ASE Flame Planner デバッギング BigGAN GANverse3D FLARE 動画ゲーム生成モデル MaterialGAN ダンスグランツーリスモSPORT AI絵師エッジワークス MagicAnimate ReBeL UGC 日本音楽作家団体協議会 Animate Anyone Virtuals Protocol GTソフィー PGC FCA インテリジェントコンピュータ研究所 Volvo FIAグランツーリスモチャンピオンシップ Voicebox アリババ MarioVGG NovelAI さくらインターネット DreaMoving Rival Prak DGX A100 NovelAI Diffusion VISCUIT 松原卓二ぷよぷよ Scratch Art Transfer 2 ユービーアイソフト Webcam VTuber モーションデータスクラッチ Art Selfie 2 星新一賞ビスケット Musical Canvas 北尾まどかポーズ推定 TCG プログラミング教育 The Forever Labyrinth 将棋メタルギアソリッドV メッシュ生成 Refik Anadol FSM メルセデス・ベンツ QRコード VALL-E Alexander Reben Magic Leap 囲碁 Deepdub.ai Rhizomatiks ナップサック問題 Live Nation Epyllion デンソー AUDIOGEN Molmo 汎用言語モデル Web3.0 マシュー・ボールデンソーウェーブ Evoke Music PixMo AIOps ムーアの法則原昌宏 AutoFoley Qwen2 72B Spotify スマートコントラクト日本機械学会 Colourlab.Ai Depth Pro Replica Studio ロボティクス・メカトロニクス講演会ディズニー amuse Chitrakar Adobe MAX 2022 トヨタ自動車 Largo.ai VARIETAS 巡回セールスマン問題かんばん方式 Cinelytic AI面接官ジョルダン曲線メディア Adobe Research Taskade キリンホールディングス政治 Galactica プロット生成 Pika.art 空間コンピューティングクラウドゲーミング AI Filmmaking Assistant Dream Screen 和田洋一リアリティ番組映像解析 FastGAN SynthID Stadia ジョンソン裕子 4コママンガ AI Screenwriter Firefly Video Model MILEs NightCafe 東芝デジタルソリューションズ芥川賞 Stable Video 4D インタラクティブ・ストリーミング Luis Ruiz SATLYS 映像解析AI 文学 AI受託開発事例インタラクティブ・メディア恋愛田中志弥 PFN 3D Scan ElevenLabs タップル Playable!3D 東京工業大学 HeyGen Abema TV Playable!Mobile Ludo 博報堂 After Effects NEC Adobe MAX 2024 ラップ PFN 4D Scan 絵本木村屋 Sneaks SIGGRAPH 2019 ArtEmis Z世代 DreamUp 出版 GPT Store Illustrator AIラッパーシステム DeviantArt Ammaar Reshi 生成AIチェッカー Meta Quest 3 Waifu Diffusion Stories ユーザーローカル XR-Objects GROVER プラスリンクス～キミと繋がる想い～元素法典 StoryBird 九段理江 Peridot FAIR STC Novel AI Versed 東京都同情塔 Orion チート検出 Style Transfer Conversation ProlificDreamer 防犯オンラインカジノ RCP Unity Sentis 4Dオブジェクト生成モデル O2 RealFlow Rinna Character Platform Unity Muse Align Your Gaussians Scam Detection iPhone CALA Caleb Ward AYG Live Threat Detection Deep Fluids 宮田龍 MAV3D 乗換NAVITIME MeInGame Amelia 清河幸子ファーウェイ Kaedim AIGraph ブレイン・コンピュータ・インタフェース西中美和 4D Gaussian Splatting 3DFY.ai BCI Gatebox アフォーダンス安野貴博 4D-GS Luma AI Learning from Video ANIMAK PaLM-SayCan 斧田小夜 Glaze Avaturn 予期知能逢妻ヒカリ WebGlaze Bestat セコム NightShade Oasis ユクスキュルバーチャル警備システム Code as Policies Spawning Decart カント損保ジャパン CaP Have I Been Trained?Dejaboom!CM3leon Fortnite Unbounded 上原利之 Stable Doodle Unreal Editor For Fortnite Etched ドラゴンクエストエージェントアーキテクチャアッパーグラウンドコリジョンチェック T2I-Adapter 声優 PAIR OCTOPATH TRAVELER パブリシティ権西木康智 Volumetrics 日本俳優連合 OCTOPATH TRAVELER 大陸の覇者山口情報芸術センター［YCAM］AIワールドジェネレーター日本芸能マネージメント事業者協会アルスエレクトロニカ2019 品質保証 YCAM 日本マネジメント総合研究所 Rosebud AI Gamemaker 日本声優事業社協議会 StyleRig Autodesk アンラーニング・ランゲージ Layer IAPP 逆転オセロニア Bentley Systems カイル・マクドナルド Lily Hughes-Robinson Charisma.ai Tripo 2.0 ワールドシミュレーターローレン・リー・マッカーシー Colossal Cave Adventure Meta 3D Gen 奥村エルネスト純いただきストリート H100 鎖国［Walled Garden］プロジェクト AdventureGPT 調査スマートシティ齋藤精一大森田不可止 COBOL SIGGRAPH ASIA 2022 リリー・ヒューズ＝ロビンソン Meta Quest 都市計画高橋智隆 DGX H100 VToonify BabyAGI IP 松本雄太ロボユニザナック DGX SuperPOD ControlVAE GPT-3.5 Turbo 早瀬悠真泉幸典仁井谷正充変分オートエンコーダーカーリング強いAI Genie 2 ロボコレ2019 Instant NeRF フォトグラメトリウィンブルドン弱いAI World Labs artonomous 回帰型ニューラルネットワーク Cybever bitGANs DeepJoin 戦術分析 Third Dimension AI Azure Machine Learning Azure OpenAI Service パフォーマンス測定 Lumiere 東北大学意思決定モデル脱出ゲーム DeepL IoT UNet Gemini 2.0 Hybrid Reward Architecture コミュニティ管理 DeepL Write ProFitX ImageFX Super Phoenix Watsonx MusicFX Project Malmo オンラインゲーム Athletica TextFX フロンティアワークス気候変動コーチング機械翻訳 Project Paidia シンギュラリティ北見工業大学 Keyframer Simplified Project Lookout マックス・プランク気象研究所レイ・カーツワイル北見カーリングホール AI Voice over Generator Watch For ビョルン・スティーブンスヴァーナー・ヴィンジ画像解析 Gemini 1.5 AI Audio Enhancer 気象モデル Runway Research じりつくん AI Studio エーアイ LEFT ALIVE 気象シミュレーション Make-A-Video NTT Sportict Vertex AI AITalk 長谷川誠ジミ・ヘンドリックス環境問題 Phenaki AIカメラ Chat with RTX コエステーション Baby X カート・コバーン Dreamix STADIUM TUBE Slack ロバート・ダウニー・Jr.エイミー・ワインハウス SDGs Text-to-Imageモデル Pixelllot S3 Slack AI PlayStation Pokémon Battle Scope ダフト・パンクメモリスタ AIスマートコーチ VRML Glenn Marshall kanaeru Techno Magic The Age of A.I.Story2Hallucination 音声変換 Latitude 占いゴーストバスターズレコメンデーション Jukebox Dreambooth 行動ロジック生成AI スパイダーマン Veap Japan ヤン・ルカン Convai ポリフォニー・デジタル EAP neoAI Perfusion NTTドコモ荒牧伸志 SIFT 福井千春 DreamIcon ニューラル物理学 Ememe Project Sid DCGAN 医療 mign 毛髪 Genie Altera MOBA DANNCE メンタルケア studiffuse 荒牧英治汎用AIエージェント Robert Yang ハーバード大学 Edgar Handy 中ザワヒデキ AIファッションウィーク Razer 研修デューク大学大屋雄裕インフルエンサー Project AVA 中川裕志 Grok-1 Streamlabs mynet.ai ローグライクゲーム Adreeseen Horowitz Mixture-of-Experts Intelligent Streaming Assistant 東京理科大学 NVIDIA Avatar Cloud Engine MoE Project DIGITS 人工音声 NeurIPS 2021 産業技術総合研究所 Replica Studios Claude 3 スーパーコンピューターリザバーコンピューティング Smart NPCs Claude 3 Haiku エージェンテックプレイ動画ヒップホップ対話型AIモデル Roblox Studio Claude 3 Sonnet AI Shorts 詩ソニーマーケティング Promethean AI Claude 3 Opus テルアビブ大学サイレント映画もじぱ note 森永乳業 DiffUHaul 環境音暗号通貨 note AIアシスタント Musiio C2PA TrailBlazer FUZZLE Ketchup Endel ゲーミフィケーションヴィクトリア大学ウェリントン Alteration AI News Tomo Kihara zeroscope 粒子群最適化法 Art Selfie Playfool QNeRF 進化差分法オープンワールド Art Transfer Sonar 遊びカーネギーメロン大学群知能下川大樹 AIFA Pet Portraits Sonar+D tsukurun RALF 高津芳希 P2E Blob Opera 地方創生グラフィック大石真史クリムト Dolby Atmos 吉田直樹メイク BEiT StyleGAN-NADA Sonar Music Festival 素材 Canvas DETR ライゾマティクス Projects Spore クリティックネットワーク真鍋大度 OpenAI Japan DeepSeek デノイズ Unity for Industry アクターネットワーク花井裕也 Voice Engine DeepSeek-R1 画像処理 DMLab Ritchie Hawtin Command R+Sentropy GLIDE Control Suite Erica Synth Oracle Cloud Infrastructure Loopy CPU Discord AvatarCLIP Atari 100k Ufuk Barış Mutlu Google Workspace リップシンク Synthetic Data Atari 200M Japanese InstructBLIP Alpha Udio CyberHost CALM Yann LeCun 日本新聞協会立命館大学 OmniHuman-1 プログラミング鈴木雅大 AIいらすとや京都精華大学 CSAM ソースコード生成コンセプトアート AI Picasso TacticAI Imagen 3 GMAI シチズンデベロッパー Sonantic Colie Wertz Emposy NPMP Google Labs GitHub Cohere リドリー・スコット AIタレント FOOH Microsoft Muse ウィザードリィ MCN-AI連携モデル絵コンテ AIタレントエージェンシーゲーム生成モデル Urzas.ai ストーリーボード modi.ai Project Astra WHAMデモンストレーター大阪大学 Google I/O 2024 ChatGPT Edu 西川善司並木幸介 Kiki Blender BitSummit Let’s Go!!滋賀大学サムライスピリッツ森寅嘉 Zoetic AI SIGGRAPH 2021 ペット感情認識キリンビールストリートファイター半導体 Digital Dream Labs PaLM API デジタルレプリカ音声加工桜AIカメラ Topaz Video Enhance AI Cozmo MakerSuite GOT7 マルタ大学 Solist-AI DLSS タカラトミー Skeb synthesia 田中達大ローム山野辺一記 LOVOT Dreambooth-Stable-Diffusion HumanRF 大里飛鳥 Dynamixyz MOFLIN Actors-HQ Move AI ベンチマーク Romi Google Earth SAG-AFTRA ICRA2024 Factorio U-Net ミクシィ GEPPETTO AI WGA Hao AI Lab 13フェイズ構造ユニロボット Stable Diffusion web UI チャーリー・ブルッカー大規模基盤モデルカリフォルニア大学 ADV ユニボ Torobo GamingAgent XLand Gato 岡野原大輔東京ロボティクス AI model 自己教師あり学習インピーダンス制御 Anthropic DEATH STRANDING AI Models In-Context Learning（ICL）深層予測学習 Claude 3.7 Sonnet Eric Johnson 汎用強化学習AI ZMO.AI 日立製作所 Factorio Learning Environment MOBBY’S FLE Oculus Quest コジマプロダクションロンドン芸術大学モビーディック尾形哲也 Deepseek-v3 生体情報デシマエンジン Google Brain ダイビング量子コンピュータ AIREC Gemini-2-Flash Sound Control アウトドア qubit 汎用ロボット Llama-3.3-70B SYNTH SUPER AIスキャニング IBM Quantum System 2 オムロンサイニックエックス GPT-4o-Mini 照明 Maxim Peter Karl Sims 自動採寸 ViLaIn Joshua Romoff Artnome 3DLOOK ダリオ・ヒル PDDL ZOZO NEXT ハイパースケープ ICONATE Sizer ジェン・スン・フアンニューサウスウェールズ大学 ZOZO 山崎陽斗ワコール HuggingFace Claude Sammut Fashion Intelligence System 立木創太スニーカー Stable Audio オックスフォード大学 Partial Visual-Semantic Embedding 浜中雅俊 UNSTREET 宗教 Lars Kunze WEAR ミライ小町 Newelse 仏教杉浦孔明 GPT-4V テスラ福井健策 CheckGoods コカ・コーラ田向権ソイル大学 GameGAN 二次流通食品 VASA-1 Tesla Bot 中古市場 Coca‑Cola Y3000 Zero Sugar VoxCeleb2 AIパズルジェネレーター Tesla AI Day Wikipedia Dupe Killer Copilot Copyright Commitment AniTalker DolphinGemma ソサエティ5.0 Sphere 偽ブランドテラバース上海大学 SIGGRAPH 2020 バズグラフ Xaver 1000 配信京都大学 Wild Dolphin Project ニュースタンテキ養蜂立福寛 SoundStreamトークナイザー東芝 Beewise ソニー・ピクチャーズアニメーション音声解析音声処理技術 DIB-R 倉田宜典フィンテック感情分析 Luma GPT-4.1 投資 Fosters+Partners 周済涛 Dream Machine GPT-4.1 mini 韻律射影 MILIZE Zaha Hadid Architects ステートマシン NTT GPT-4.1 nano 韻律転移三菱UFJ信託銀行ディープニューラルネットワーク Perplexity LINE AI

CGへの扉 Vol.28：定番手法の他分野応用、自然言語処理AI由来の画像処理AI

2021.7.16アート

そもそも「応用」とは何か？

あるテクノロジーを対象に「応用すべき」とか「応用の余地がある」などと言いますが、実際のところ「応用」とは何を示すのでしょう。もちろん目も覚めるような今までに無かった新テクノロジーは魅力的ですが、世の中のテクノロジーすべてがそのような新規性の塊ではありません。実用化されているさまざまなテクノロジーは「応用」の賜物であり、原理や知識を現実的な事柄、または他分野の事柄にあてはめて利用することを一般的に「応用」と呼んでいます。

○○シェアやサブスクリプション（定期購買）といった、最近の流行りで新しいと思えるサービスも、実は他分野からすれば古くからあったサービス形態かもしれません。例えば一般の仕事場に設置し、100円入れると1個好きな時に自由にお菓子を持っていける「オフィスグリコ」も「富山の薬売り」のビジネスモデルを模倣したものです。

富山の薬売りは家庭用常備薬のつまった箱を個人の家に置いていき、その時点では費用はかからず、次に来た時に使った薬の分だけの費用を徴収するという仕組みです。もちろん、人工知能研究の多くのブレイクスルーも、脳の原理や仕組みを参考にコンピュータ上のアルゴリズムにあてはめ、それらが成果となって、現在のAI研究、AI実装が広がっています。

「CGへの扉 Vol.22：言葉から画像を生成、DALL-Eはクリエイティブなのか？」でも取り上げた OpenAI社の GPT-3 も、その前身となる GPT-2 は自然言語処理のモデルとして文章生成に長けた用途で注目を浴び、画像生成に応用したことで、さらに大きな注目を集めました。GPT-2 の画像応用例のひとつであるImageGPTでは画像の半分を用意すれば、残りの半分を AI が補ってくれるというわかりやすい応用例が示されたことも話題性のひとつでした。

ソースコード共有サービス GitHub が大量のソースコードから学習し、プログラミング中のソースコードに適切なコメント文とソースコードの最初の部分を書き始めると、続きの適切なソースコードを補完してくれるサービス “GitHub Copilot” を発表しました。Copilotの内部実装や学習モデルがどうなっているのかは不明ですが、Copilotの開発には GPT-2,3 の OpenAI社が関係しており、ソースコード用途に特化した、GPT-2,3の応用例とも言える、仕組みやアプローチも似通ったものではないかと予想されます。

CLIPDraw：事前学習の必要がない、文章から画像を描く仕組み

論文：https://arxiv.org/pdf/2106.14843.pdf
ソースコード：https://colab.research.google.com/github/kvfrans/clipdraw/blob/main/clipdraw.ipynb
論文の筆頭著者 Kevin Frans氏による解説：https://kvfrans.com/clipdraw-exploring-text-to-drawing-synthesis/

CLIPDrawは、クロスコンパス社、米国マサチューセッツ工科大学、東京工業大学、東京大学の共同研究チームによる、事前学習を必要とせずに文章から絵を描くAI活用のアルゴリズムです。人間は言葉による豊かな風景描写、状況説明に長けており、文章だけで構成される小説を読んで、そこで描かれている風景をとても具体的に想像したり、また逆に一度見ただけの風景や状況を言葉で人に伝えることができたりします。言葉から描画したり、描画したものを言葉で説明したり、まったく同じ、完璧な再現は無理かもしれませんが、言葉と描くものとが人間の理解する仕組みの中で、重要な役目を果たしているのは確かです。

CLIPDraw は OpenAI社から公開されているCLIPをベースとしています。CLIPでは事前の学習なしで、写真画像の説明として適切なものを単語1つまたは数語の言葉からパラメータ評価することができました。CLIPDrawでは勾配降下法を用い、最初はまったくランダムな描画から始まり、ストローク（描画の軌跡）を変化させつつ描いた画像をCLIPで評価し、評価が高いものに合わせるよう描く線のパラメータを微調整します。その描画と評価を数百回繰り返すという反復的な方法を用い、文章に書かれた内容を理解したかのような絵を描いていくことができます。

CLIPDrawではさらに、形や雰囲気といった描き方に加えて「スタイル」という要素もあわせ持っています。例えば指定の言葉の中に「3Dレンダリング」などの言葉を含めると、CGで作られたワイヤーフレーム画像のような、それっぽい画像が生成されるそうです。

CLIPDrawで描かれた様々な説明文による猫。一番右は「3Dワイヤーフレームモデルの猫」

正直200回から500回も繰り返して最適化された描画も、確かに猫や馬、飛行機などとギリギリ読み取れるくらいの絵で、子どもの落書き程度にしか見えません。けれども子供の落書きも数か月、数年の成長で驚くほど精彩で正確なものに、時には芸術性が評価されるようなものにまで進化することを考えると、AIが描画の腕を磨く過程は、これから見逃せないものになるのかもしれません。

CLIPDrawを使い、さまざまな言葉を与えてAIに描かせることで、人間でさえも表現が難しい、AIが導き出した「幸福」や「不幸」といった表現しづらい概念を、どう絵で表現できるかにも興味が湧いてくることでしょう。

BEiTの登場。画像処理版のBERT

論文：https://arxiv.org/pdf/2106.08254.pdf

BEiT（Bidirectional Encoder representation from Image Transformers）は Microsoft Researchの研究で、自然言語処理で注目を浴びているBERT（Bidirectional Encoder Representations from Transformers）の考え方を画像に応用したものです。

BERTの特徴である、自己教師あり事前学習モデルの利点を、画像処理にも活かしたのが BEiT です。機械学習の学習データとして用いられる「教師ありデータ」とは、人間が目視と手動で判別ラベルをつけたデータのことで、この種のデータを膨大に事前学習して機械学習の精度を高めます。しかしこの手法の場合人間が判別したラベルに間違いが含まれる場合があることと、正確なデータを膨大とも言える必要な量を用意することが困難なため、AIの実用においておおきな課題になっていました。

BERTを既存研究と比較した時のブレイクスルーは、自己教師学習を可能にした点です。これは言葉通り、自分自身を教師として学ぶことができる仕組みです。例えば、ある単語の次に出現する頻度の高い単語を学習するには、大量の文章データから事前にAI自身が文章の中から単語が欠けた問題と正しい文章を参照した正答を用意し、人の手を借りずとも、大量に学習していける点にあります。

これと同じ考えで、画像処理においてもわざと画像の一部を欠けさせたり、画像の解像度を落とした問題を作り、元画像を正答とすることで、画像処理においても自己教師あり事前学習モデルを実現させることができると考えられます。ところが定型文や言い回しがある程度決まっている文章とは異なり、画像の場合は一部が欠けていても、その穴を埋める画像は無限に存在することが考えられます。

BEiTが行なったアプローチは MIM（Masked Image Modeling）と呼ばれる事前学習の方法です。これは学習対象となる画像を画素ごとに16×16ピクセルサイズのグリッド分割したものと、画像の特徴点を数字（Visual Token）で表現するTokenizerと数字（Visual Token）から画像に戻すDecoderを組み合わせます。画像の一部がランダムに欠けたものから元のVisual Tokenが得られるよう学習を繰り返すことで画像処理においても自己教師あり事前学習モデルを実現しています。ちなみに論文によるとVisual Tokenの生成手法は、OpenAIのDALL-E で使われている手法が応用しているもよう。

Facebook DETR 自然言語処理の手法を応用した物体検出

Facebook DETRによって検知された物体。100%の精度で象とシマウマが検出されている

論文：https://arxiv.org/pdf/2005.12872.pdf
Facebook AI の紹介ページ：https://ai.facebook.com/blog/end-to-end-object-detection-with-transformers/
ソースコード：https://github.com/facebookresearch/detr
解説動画：https://www.youtube.com/watch?v=T35ba_VXkMY

Facebook のAI研究チームが発表した2020年5月に発表した物体検出モデルDETRも、自然言語処理の方法を応用したものです。DETRは従来手法よりも高速化された手法で、ある物体の近くには、一緒にある物体が存在する可能性が高いといった文脈を理解して物体検知するのも特徴です。自然言語処理（NLP:Natural Language Processing）の世界のブレイクスルーであった Transformer モデルを物体検出に応用した事例です。

従来型の手法に比べ、Transformerの利点の一つに並列処理が可能な点があります。けれども画像検出にまつわる処理も逐次型のため、この Transformer の利点が活かしにくい分野ではありました。従来型の画像検出の手順としては、画像から物体を検出し、その後に何が写っているのかを分類し段階的に判別する必要がありました。

DETRでは画像から物体を場所と大きさを検知するとともに、画像に写っている物体同士の関係性を利用し、つながりのあるデータ群だと考えることによって Transformer の並列処理の利点を享受できるようになりました。例えばある写真に猫が写っているとすると、もうひとつ同じくらいの物体が存在すれば、それがもう一匹の猫である可能性が高く、猫よりも大きな物体が存在すれば、それは飼い主である人間が写っている可能性が高いといった写真ならではの関係性です。

まずは元となる画像を CNN(Convolutional Neural Network) に入力します。これによって特徴マップが生成されます。そこで生成された特徴マップを Transformer encoder-decoder に入力します。そうすると画像に写っているオブジェクトの個数、位置、サイズといった情報が得られます。得られた結果から “no object” となる物体として認識されなかったものを除外すると、画像全体の物体検出が完了します。

これからのAIの応用と成熟

元任天堂のゲーム開発者、横井軍平氏の著書『横井軍平ゲーム館』には「枯れた技術の水平思考」という考え方について書かれています。これは、すでに広く使われ、メリットやデメリットが明らかになっている技術をさまざまな分野に応用することで、今までになかったような使い道を生み出し、安価で安定した最大限の成果を得るという考え方です。決して古い技術を誉めたたえようという意味ではありません。

エンジニア気質が強い人や、研究志向の人であれば、常に最新技術を追い求め、独自性やオリジナリティを重視する状況もあるかもしれません。けれども今回紹介したテクノロジーや、人工知能の世界で話題になるテクノロジーは、何も目新しいものばかりではなく、旧来からあるテクノロジーを応用し、圧倒的な物量で驚くべき応用と成果を導き出していることが見受けられます。

また既存技術の組み合わせによって、あらたな応用例や現実的な用途に役立つ道筋を見出しているものも注目されています。そう考えると、これから話題になるであろう人工知能を応用するためのヒントは、そこここに転がっているのだと考えられるかもしれません。

本連載の今後の予定：「CGへの扉」では、単なるAIの話題とは少し異なり、CG/VFX, アートの文脈から話題を切り取り紹介していきます。映像制作の現場におけるAI活用や、AIで価値が高まった先進的なツール、これからの可能性を感じさせるような話題、テクノロジーの話題にご期待ください。何か取り上げて欲しいテーマやご希望などがございましたら、ぜひ編集部までお知らせください。

CGへの扉：

Vol.27：眼に追いつけ追い越せ？カメラは機械学習により進化

Vol.26：アートを加速させるAIの役割 #GTC2021 レポート

Vol.25：変幻自在の顔も実は人工知能

Vol.24：自然現象もすべて人工知能で再現する時代

Vol.23：AIで人の眼に進化するカメラ

Vol.22：言葉から画像を生成、DALL-Eはクリエイティブなのか？

Vol.20：Adobeと人工知能の将来を見極める #AdobeMAX2020

Vol.19：コミュニケーションツールの新境地「NVIDIA MAXINE」

Vol.18：SIGGRAPH2020レポート映像制作の現場で活躍する人工知能

Vol.17：描画を進化させるTensorFlow Graphicsの真価

Vol.16：バーチャル開催SIGGRAPH論文を先取り