モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。

TAG LIST: CG CGへの扉生成AI 安藤幸央吉本幸記月刊エンタメAIニュース河合律子機械学習ディープラーニング OpenAI LLM Google NVIDIA 大規模言語モデルグーグル GAN 音楽モリカトロン森川幸人 ChatGPT 三宅陽一郎 DeepMind 強化学習 Stable Diffusion 人工知能学会ニューラルネットワークシナリオマイクロソフト QA 自然言語処理 AIと倫理 GPT-3 倫理 Facebook 大内孝子映画 SIGGRAPH スクウェア・エニックス著作権アートキャラクターAI ルールベースゲームプレイAI Minecraft 敵対的生成ネットワーク NPC 音楽生成AI 動画生成AI モリカトロンAIラボインタビューアニメーション 3DCG 画像生成 NFT ロボットファッション DALL-E2 StyleGAN プロシージャルディープフェイクマルチモーダル VFX Midjourney 遺伝的アルゴリズムデバッグ自動生成 VR メタAI Meta 画像生成AI Red Ram マンガインタビューゲームAI Adobe Microsoft テストプレイマインクラフト CLIP テキスト画像生成深層学習 CEDEC2019 toio 教育 NeRF デジタルツインメタバース不完全情報ゲーム小説 Stability AI ボードゲーム DALL-E Sora ビヘイビア・ツリー CEDEC2021 CEDEC2020 作曲アストロノーカロボティクスナビゲーションAI 高橋力斗 AIアート Gemini メタ畳み込みニューラルネットワークアップルデジタルヒューマン ELSI Playable!スポーツエージェント GDC 2021 プロンプト GPT-4 手塚治虫汎用人工知能 JSAI2022 3D 広告 DALL-E 3 バーチャルヒューマン NVIDIA Omniverse GDC 2019 マルチエージェント CEDEC2022 市場分析 AR 懐ゲーから辿るゲームAI技術史鴫原盛之ジェネレーティブAI ソニー東京大学はこだて未来大学栗原聡 CNN マーケティング JSAI2024 CM BERT Microsoft Azure 音声認識言霊の迷宮 Unity Omniverse Ubisoft JSAI2023 Roblox がんばれ森川君2号電気通信大学 SIGGRAPH ASIA HTN Apple 階層型タスクネットワーク AIQVE ONE 世界モデルアドベンチャーゲームインディーゲーム JSAI2020 GTC2023 音声合成メタデータ TensorFlow ブロックチェーンイベントレポートキャリア模倣学習対話型エージェント Amazon サイバーエージェントトレーディングカードメディアアート DQN シーマン合成音声 SIE Runway 水野勇太モリカトロン開発者インタビュー宮本茂則アバターブラック・ジャック Genvid Technologies ガイスター StyleGAN2 徳井直生稲葉通将斎藤由多加 Open AI ベリサーブ GTC2022 GPT-3.5 YouTube 音声生成AI SF Netflix JSAI2021 松木晋祐 Bard 研究シムシティシムピープル Zork GPT-4o MCS-AI動的連携モデルマーダーミステリーモーションキャプチャー TEZUKA2020 CEDEC2023 AGI テキスト生成スパーシャルAI Electronic Arts GDC Summer イーロン・マスク論文 Stable Diffusion XL 森山和道 Audio2Face NVIDIA Riva eスポーツスタンフォード大学アーケードゲームテニスセガ人狼知能 Google I/O 類家利直 Firefly eSports BLUE PROTOCOL CEDEC2024 aibo 大澤博隆 SFプロトタイピング銭起揚 Runway Gen-3 Alpha チャットボット TikTok text-to-3D DreamFusion 自動運転車ワークショップ Epic Games AIロボ「迷キュー」に挑戦 AWS Adobe MAX 村井源クラウド AlphaZero Preferred Networks Transformer GPT-2 rinna AIりんなカメラ環世界中島秀之 PaLM GitHub Copilot LLaMA 哲学 Apple Vision Pro ハリウッド宮路洋一 Whisk 理化学研究所 Gen-1 SIGGRAPH Asia 2024 テキスト画像生成AI 松尾豊人事データマイニング ControlNet 現代アート DARPA 法律ドローンゲームエンジン Unreal Engine Imagen 人工生命バイアスサム・アルトマン Veo ASBS ぱいどん AI美空ひばり手塚眞デザイン GDC 2025 バンダイナムコ研究所 ELYZA NEDO 建築 ELIZA FSM-DNN MindAgent BIM LEFT 4 DEAD くまうた通しプレイソニー・インタラクティブエンタテインメント OpenAI Five Meshy 本間翔太馬淵浩希 Cygames 岡島学ピクサー九州大学プラチナエッグイーサリアム効果音ボエダ・ゴティエビッグデータ中嶋謙互 Amadeus Code データ分析自動翻訳 MILE NVIDIA ACE Veo 3 ナラティブ Niantic Omniverse Replicator WCCF レコメンドシステム NVIDIA DRIVE Sim WORLD CLUB Champion Football NVIDIA Isaac Sim Sakana AI 柏田知大軍事田邊雅彦トレカ慶應義塾大学 Max Cooper GPT Disney Photoshop PyTorch 京都芸術大学 ChatGPT4 モンテカルロ木探索 ByteDance 眞鍋和子バンダイナムコスタジオコミコパヒストリア AI Frog Interactive 新清士ラベル付け田中章愛 ComfyUI 齊藤陽介コナミデジタルエンタテインメント成沢理恵お知らせ Magic Leap One Tencent サッカーバスケットボール LINEヤフー Suno AI KaKa Creation VOICEVOX text-to-image サルでもわかる人工知能 VAE TEZUKA2023 DOOM リップシンキング RNN GameNGen グランツーリスモ・ソフィー Ubisoft La Forge スーパーマリオブラザーズ社員インタビュー知識表現ウォッチドッグスレギオン VTuber IGDA 立教大学秋期GTC2022 大阪公立大学 HALO フォートナイト KLab どうぶつしょうぎジェイ・コウガミ音楽ストリーミング MIT 野々下裕子 Movie Gen Qosmo マシンラーニング 5G MuZero Rival Peak pixiv オムロンサイニックエックス GPTs セキュリティ対話エンジンポケモン 3Dスキャン橋本敦史リトル・コンピュータ・ピープル Codex シーマン人工知能研究所コンピューティショナル・フォトグラフィーゴブレット・ゴブラーズ絵画 3D Gaussian Splatting Microsoft Designer イラストシミュレーション Soul Machines 柿沼太一完全情報ゲームバーチャルキャラクター坂本洋典宮本道人釜屋憲彦 LLaMA 2 ウェイポイントパス検索 Hugging Face 対談藤澤仁生物学 XR GTC 2022 xAI 画像認識 Siemens ストライキ StyleCLIP DeNA Voyager 長谷洋平 GDC 2024 クラウドコンピューティング masumi toyota IBM ぎゅわんぶらあ自己中心派 OpenSea GDC 2022 Veo 2 ウロチョロス SNS TextWorld Earth-2 Bing エコロジー Magenta ソフトバンク SONY ポケットモンスター ELYZA Pencil Scenario SIGGRAPH2023 AIピカソ GTC2021 AI素材.com CycleGAN テンセント Andreessen Horowitz QA Tech Night NetHack 下田純也桑野範久キャラクターモーション音源分離 NBA フェイクニュースユニバーサルミュージック RPG ウィル・ライト Web3 SIGGRAPH 2022 レベルデザイン DreamerV3 SIMA AIボイスアクター南カリフォルニア大学 NVIDIA Canvas GDC GPU ALife オルタナティヴ・マシンサウンドスケープ LaMDA TRPG マジック：ザ・ギャザリング AI Dungeon 介護 BitSummit Gemma 2 Cube 3D ゼビウス NetEase Inworld AI モリカトロンAIコネクトゲーム背景 IEEE Point-E アパレル不気味の谷 LoRA ナビゲーションメッシュファインチューニング早稲田大学グランツーリスモ写真高橋ミレイ北野宏明深層強化学習松原仁松井俊浩武田英明フルコトモリカコミックパックマン ELYZA DIGEST ジョージア工科大学 Apple Intelligence WWDC WWDC 2024 西成活裕ハイブリッドアーキテクチャ AI野々村真 LINE AIトークサジェスト Apex Legends 群衆マネジメントライブポートレイト GTC2025 Ninja コンピュータRPG ライブビジネス Wonder Studio Adobe Max 2023 GPT-4-turbo Fuxi Lab アップルタウン物語新型コロナ土木佐藤恵助 Naraka:Bladepoint Mobile KELDIC 周済涛 Bing Chat 大道麻由バトルロイヤルメロディ言語清田陽司インフラ Bing Image Creator 物語構造分析ビヘイビアツリーゲーム TENTUPLAY サイバネティックス慶応義塾大学 SoftServe MARVEL Future Fight Astro 人工知能史 Amazon Bedrock Assistant with Bard 渡邉謙吾 ALNAIR タイムラプス Ego4D AI哲学マップ The Arcade ここ掘れ！プッカ AMRI バスキア星新一 X.AI Search Generative Experience BLADE 日経イノベーション・ラボ StyleGAN-XL X Corp.Dynalang 濱田直希 GAGA 敵対的強化学習 StyleGAN3 Twitter VLE-CE 大柳裕⼠QUEEN 階層型強化学習 GOSU Data Lab GANimator Xホールディングス加納基晴 Runway Gen-4 WANN GOSU Voice Assistant VoLux-GAN Magi AI Act SkyReels 竹内将 SenpAI.GG Projected GAN EU 研究開発事例 Mobalytics Self-Distilled StyleGAN SDXL Ars Electronica 赤羽進亮 Stable Virtual Camera ニューラルレンダリング RTFKT AI規制遊戯王 Intangible AWS Sagemaker PLATO NIKE 欧州委員会 UDI（Universal Duel Interface）ブライアン・イーノ映像セリア・ホデント形態素解析 frame.io Clone X 欧州議会第一工科大学 Eno UX AWS Lambda Foodly 村上隆欧州理事会佐竹空良 Brain One 誤字検出 MusicLM 小林篤史 AlphaEvolve 認知科学中川友紀子 Digital Mark AudioLM Continuous Thought Machine（CTM）ゲームデザイン SentencePiece アールティ Snapchat MusicCaps 荻野宏実 Arm LUMINOUS ENGINE クリエイターコミュニティ AudioCraft 伊藤黎 Stable Audio Open Small Luminous Productions BlenderBot 3 バーチャルペットビヘイビアブランチ Word2World パターン・ランゲージ竹村也哉 Meta AI NVIDIA NeMo Service Mubert WPP STORY2GAME ちょまどマーク・ザッカーバーグヴァネッサ・ローザ Mubert Render General Computer Control（GCC）ウィットウォーターランド大学 GOAP WACUL Vanessa A Rosa Gen-2 Cradle 森川の頭の中 Adobe MAX 2021 陶芸 Runway AI Film Festival Spiral.AI 花森リド Play.ht PreViz ItakoLLM-7b Google I/O 2025 音声AI 静岡大学 AIライティング LiDAR Character-LLM 明治大学 Flow Omniverse Avatar AIのべりすと Polycam 復旦大学北原鉄朗 Lyra 2 FPS QuillBot deforum Chat-Haruhi-Suzumiya 中村栄太 MusicFX DJ マルコフ決定過程 NVIDIA Megatron Copysmith 涼宮ハルヒ日本大学 Animon.ai NVIDIA Merlin Jasper ハーベスト Emu Video ヤマハツインズひなひま NVIDIA Metropolis ForGames 前澤陽 Maya パラメータ設計ゲームマーケットペリドット増田聡 Deep Q-Learning バランス調整岡野翔太 Dream Track 採用 AlphaGO 協調フィルタリング郡山喜彦 Music AI Tools スペースインベーダーテキサス大学ジェフリー・ヒントン Lyria 科学史プリンス・オブ・ペルシャ Google I/O 2023 Yahoo!知恵袋 AIサイエンティストドラゴンクエストIV AlphaDogfight Trials AI Messenger Voicebot インタラクティブプロンプトAI Terra 堀井雄二エージェントシミュレーション OpenAI Codex 武蔵野美術大学 AI Overview 山名学 StarCraft II HyperStyle BingAI 石渡正人電通タイトー Future of Life Institute Rendering with Style 手塚プロダクション AICO2 カプコン Intel 林海象 BitSummit Drift Ubi Anvilエンジン LAIKA Disneyリサーチヴィトゲンシュタイン古川善規 V1 Video Model Rotomation GauGAN 論理哲学論考 Lightroom 大規模再構成モデル Omega Crafter Artificial Analysis GauGAN2 Canva LRM SPACE INVADIANS Video Arena ドラゴンクエストライバルズ画像言語表現モデル Objaverse 西島大介 Video Model Leaderboard 不確定ゲーム SIGGRAPH ASIA 2021 PromptBase BOOTH MVImgNet 吉田伸一郎 Claude 3.5 Dota 2 ディズニーリサーチ pixivFANBOX One-2-3-45 SIGGRAPH2024 Mistral Mitsuba2 バンダイナムコネクサス虎の穴 3Dガウシアンスプラッティング Motion-I2V JSAI2025 ソーシャルゲーム Embedding ワイツマン科学研究所ユーザーレビュー Fantia ワンショット3D生成技術 GTC2020 CG衣装 mimic とらのあな Toonify3D NVIDIA MAXINE VRファッション Baidu 集英社 FGDC 生成対向ネットワーク淡路滋ビデオ会議 Artflow ERNIE-ViLG 少年ジャンプ＋Future Game Development Conference 拡散モデルグリムノーツ Eponym 古文書 ComicCopilot 佐々木瞬 Diffusion ゴティエ・ボエダ音声クローニング凸版印刷 Gautier Boeda 階層的クラスタリング Gopher AI-OCR ゲームマスターうめ画像判定 Inowrld AI 小沢高広 Julius 鑑定 MOD Anique ドリコム TPRG Oxia Palus Ghostwriter 中村太一 ai and バーチャル・ヒューマン・エージェント toio SDK for Unity Art Recognition Skyrim エグゼリオ SaaS クーガー実況パワフルサッカースカイリム Copilot インサイト石井敦 NHC 2021 桃太郎電鉄 RPGツクールMZ カスタマーサポート茂谷保伯池田利夫桃鉄 ChatGPT_APIMZ serial experiments lain ComfyUI-AdvancedLivePortrait GDMC 新刊案内パワサカダンジョンズ&ドラゴンズ AI lain GUI マーベル・シネマティック・ユニバース Oracle RPG PCG MITメディアラボ MCU 岩倉宏介深津貴之 PCGRL アベンジャーズ PPO xVASynth Dungeons&Dragons Video to Video マジック・リープ Digital Domain Machine Learning Project Canvas Laser-NV ビートルズ iPhone 16 Magenda Masquerade2.0 国立情報学研究所ザ・ビートルズ: Get Back OpenAI o1 ノンファンジブルトークン DDSP フェイシャルキャプチャー石川冬樹 MERF Demucs AIスマートリンクスパコン Alibaba 音楽編集ソフトシャープ里井大輝 Kaggle スーパーコンピュータ VQRF Adobe Audition ウェアラブル山田暉松岡聡 nvdiffrec iZotope CE-LLM Assassin’s Creed Origins AI会話ジェネレーター TSUBAME 1.0 NeRFMeshing RX10 Communication Edge-LLM Sea of Thieves TSUBAME 2.0 LERF Moises GEMS COMPANY monoAI technology LSTM ABCI マスタリング AIペットモリカトロンAIソリューション富岳レベルファイブ Yahoo!ニュース初音ミク Oculus コード生成AI Society 5.0 リアム・ギャラガー AI Comic Factory 転移学習テスト AlphaCode 夏の電脳甲子園グライムス AI comic Generator Baldur's Gate 3 Codeforces 座談会 Boomy ComicsMaker.ai Candy Crush Saga 自己増強型AI ジョン・レジェンド Genie AI LlamaGen.ai SIGGRAPH ASIA 2020 COLMAP ザ・ウィークエンド SIGGRAPH Asia 2023 GAZAI ADOP NVIDIA GET3D ドレイク C·ASE Flame Planner デバッギング BigGAN GANverse3D FLARE 動画ゲーム生成モデル MaterialGAN ダンスグランツーリスモSPORT AI絵師エッジワークス MagicAnimate ReBeL UGC 日本音楽作家団体協議会 Animate Anyone Virtuals Protocol GTソフィー PGC FCA インテリジェントコンピュータ研究所 Volvo FIAグランツーリスモチャンピオンシップ Voicebox アリババ MarioVGG NovelAI さくらインターネット DreaMoving Rival Prak DGX A100 NovelAI Diffusion VISCUIT 松原卓二ぷよぷよ Scratch Art Transfer 2 ユービーアイソフト Webcam VTuber モーションデータスクラッチ Art Selfie 2 星新一賞ビスケット Musical Canvas 北尾まどかポーズ推定 TCG プログラミング教育 The Forever Labyrinth 将棋メタルギアソリッドV メッシュ生成 Refik Anadol FSM メルセデス・ベンツ QRコード VALL-E Alexander Reben Magic Leap 囲碁 Deepdub.ai Rhizomatiks ナップサック問題 Live Nation Epyllion デンソー AUDIOGEN Molmo 汎用言語モデル Web3.0 マシュー・ボールデンソーウェーブ Evoke Music PixMo AIOps ムーアの法則原昌宏 AutoFoley Qwen2 72B Spotify スマートコントラクト日本機械学会 Colourlab.Ai Depth Pro Replica Studio ロボティクス・メカトロニクス講演会ディズニー amuse Chitrakar Adobe MAX 2022 トヨタ自動車 Largo.ai VARIETAS 巡回セールスマン問題かんばん方式 Cinelytic AI面接官ジョルダン曲線メディア Adobe Research Taskade キリンホールディングス政治 Galactica プロット生成 Pika.art 空間コンピューティングクラウドゲーミング AI Filmmaking Assistant Dream Screen 和田洋一リアリティ番組映像解析 FastGAN SynthID Stadia ジョンソン裕子 4コママンガ AI Screenwriter Firefly Video Model MILEs NightCafe 東芝デジタルソリューションズ芥川賞 Stable Video 4D インタラクティブ・ストリーミング Luis Ruiz SATLYS 映像解析AI 文学 AI受託開発事例インタラクティブ・メディア恋愛田中志弥 PFN 3D Scan ElevenLabs タップル Playable!3D 東京工業大学 HeyGen Abema TV Playable!Mobile Ludo 博報堂 After Effects NEC Adobe MAX 2024 ラップ PFN 4D Scan 絵本木村屋 Sneaks SIGGRAPH 2019 ArtEmis Z世代 DreamUp 出版 GPT Store Illustrator AIラッパーシステム DeviantArt Ammaar Reshi 生成AIチェッカー Meta Quest 3 Waifu Diffusion Stories ユーザーローカル XR-Objects GROVER プラスリンクス～キミと繋がる想い～元素法典 StoryBird 九段理江 Peridot FAIR STC Novel AI Versed 東京都同情塔 Orion チート検出 Style Transfer Conversation ProlificDreamer 防犯オンラインカジノ RCP Unity Sentis 4Dオブジェクト生成モデル O2 RealFlow Rinna Character Platform Unity Muse Align Your Gaussians Scam Detection iPhone CALA Caleb Ward AYG Live Threat Detection Deep Fluids 宮田龍 MAV3D 乗換NAVITIME MeInGame Amelia 清河幸子ファーウェイ Kaedim AIGraph ブレイン・コンピュータ・インタフェース西中美和 4D Gaussian Splatting 3DFY.ai BCI Gatebox アフォーダンス安野貴博 4D-GS Luma AI Learning from Video ANIMAK PaLM-SayCan 斧田小夜 Glaze Avaturn 予期知能逢妻ヒカリ WebGlaze Bestat セコム NightShade Oasis ユクスキュルバーチャル警備システム Code as Policies Spawning Decart カント損保ジャパン CaP Have I Been Trained?Dejaboom!CM3leon Fortnite Unbounded 上原利之 Stable Doodle Unreal Editor For Fortnite Etched ドラゴンクエストエージェントアーキテクチャアッパーグラウンドコリジョンチェック T2I-Adapter 声優 PAIR OCTOPATH TRAVELER パブリシティ権西木康智 Volumetrics 日本俳優連合 OCTOPATH TRAVELER 大陸の覇者山口情報芸術センター［YCAM］AIワールドジェネレーター日本芸能マネージメント事業者協会アルスエレクトロニカ2019 品質保証 YCAM 日本マネジメント総合研究所 Rosebud AI Gamemaker 日本声優事業社協議会 StyleRig Autodesk アンラーニング・ランゲージ Layer IAPP 逆転オセロニア Bentley Systems カイル・マクドナルド Lily Hughes-Robinson Charisma.ai Tripo 2.0 ワールドシミュレーターローレン・リー・マッカーシー Colossal Cave Adventure Meta 3D Gen 奥村エルネスト純いただきストリート H100 鎖国［Walled Garden］プロジェクト AdventureGPT 調査スマートシティ齋藤精一大森田不可止 COBOL SIGGRAPH ASIA 2022 リリー・ヒューズ＝ロビンソン Meta Quest 都市計画高橋智隆 DGX H100 VToonify BabyAGI IP 松本雄太ロボユニザナック DGX SuperPOD ControlVAE GPT-3.5 Turbo 早瀬悠真泉幸典仁井谷正充変分オートエンコーダーカーリング強いAI Genie 2 ロボコレ2019 Instant NeRF フォトグラメトリウィンブルドン弱いAI World Labs artonomous 回帰型ニューラルネットワーク Cybever bitGANs DeepJoin 戦術分析 Third Dimension AI Azure Machine Learning Azure OpenAI Service パフォーマンス測定 Lumiere 東北大学意思決定モデル脱出ゲーム DeepL IoT UNet Gemini 2.0 Hybrid Reward Architecture コミュニティ管理 DeepL Write ProFitX ImageFX Super Phoenix Watsonx MusicFX Project Malmo オンラインゲーム Athletica TextFX フロンティアワークス気候変動コーチング機械翻訳 Project Paidia シンギュラリティ北見工業大学 Keyframer Simplified Project Lookout マックス・プランク気象研究所レイ・カーツワイル北見カーリングホール AI Voice over Generator Watch For ビョルン・スティーブンスヴァーナー・ヴィンジ画像解析 Gemini 1.5 AI Audio Enhancer 気象モデル Runway Research じりつくん AI Studio エーアイ LEFT ALIVE 気象シミュレーション Make-A-Video NTT Sportict Vertex AI AITalk 長谷川誠ジミ・ヘンドリックス環境問題 Phenaki AIカメラ Chat with RTX コエステーション Baby X カート・コバーン Dreamix STADIUM TUBE Slack ロバート・ダウニー・Jr.エイミー・ワインハウス SDGs Text-to-Imageモデル Pixelllot S3 Slack AI PlayStation Pokémon Battle Scope ダフト・パンクメモリスタ AIスマートコーチ VRML Glenn Marshall kanaeru Techno Magic The Age of A.I.Story2Hallucination 音声変換 Latitude 占いゴーストバスターズレコメンデーション Jukebox Dreambooth 行動ロジック生成AI スパイダーマン Veap Japan ヤン・ルカン Convai ポリフォニー・デジタル EAP neoAI Perfusion NTTドコモ荒牧伸志 SIFT 福井千春 DreamIcon ニューラル物理学 Ememe Project Sid DCGAN 医療 mign 毛髪 Genie Altera MOBA DANNCE メンタルケア studiffuse 荒牧英治汎用AIエージェント Robert Yang ハーバード大学 Edgar Handy 中ザワヒデキ AIファッションウィーク Razer 研修デューク大学大屋雄裕インフルエンサー Project AVA 中川裕志 Grok-1 Streamlabs mynet.ai ローグライクゲーム Adreeseen Horowitz Mixture-of-Experts Intelligent Streaming Assistant 東京理科大学 NVIDIA Avatar Cloud Engine MoE Project DIGITS 人工音声 NeurIPS 2021 産業技術総合研究所 Replica Studios Claude 3 スーパーコンピューターリザバーコンピューティング Smart NPCs Claude 3 Haiku エージェンテックプレイ動画ヒップホップ対話型AIモデル Roblox Studio Claude 3 Sonnet AI Shorts 詩ソニーマーケティング Promethean AI Claude 3 Opus テルアビブ大学サイレント映画もじぱ note 森永乳業 DiffUHaul 環境音暗号通貨 note AIアシスタント Musiio C2PA TrailBlazer FUZZLE Ketchup Endel ゲーミフィケーションヴィクトリア大学ウェリントン Alteration AI News Tomo Kihara zeroscope 粒子群最適化法 Art Selfie Playfool QNeRF 進化差分法オープンワールド Art Transfer Sonar 遊びカーネギーメロン大学群知能下川大樹 AIFA Pet Portraits Sonar+D tsukurun RALF 高津芳希 P2E Blob Opera 地方創生グラフィック大石真史クリムト Dolby Atmos 吉田直樹メイク BEiT StyleGAN-NADA Sonar Music Festival 素材 Canvas DETR ライゾマティクス Projects Spore クリティックネットワーク真鍋大度 OpenAI Japan DeepSeek デノイズ Unity for Industry アクターネットワーク花井裕也 Voice Engine DeepSeek-R1 画像処理 DMLab Ritchie Hawtin Command R+Sentropy GLIDE Control Suite Erica Synth Oracle Cloud Infrastructure Loopy CPU Discord AvatarCLIP Atari 100k Ufuk Barış Mutlu Google Workspace リップシンク Synthetic Data Atari 200M Japanese InstructBLIP Alpha Udio CyberHost CALM Yann LeCun 日本新聞協会立命館大学 OmniHuman-1 プログラミング鈴木雅大 AIいらすとや京都精華大学 CSAM ソースコード生成コンセプトアート AI Picasso TacticAI Imagen 3 GMAI シチズンデベロッパー Sonantic Colie Wertz Emposy NPMP Google Labs GitHub Cohere リドリー・スコット AIタレント FOOH Microsoft Muse ウィザードリィ MCN-AI連携モデル絵コンテ AIタレントエージェンシーゲーム生成モデル Urzas.ai ストーリーボード modi.ai Project Astra WHAMデモンストレーター大阪大学 Google I/O 2024 ChatGPT Edu 西川善司並木幸介 Kiki Blender BitSummit Let’s Go!!滋賀大学サムライスピリッツ森寅嘉 Zoetic AI SIGGRAPH 2021 ペット感情認識キリンビールストリートファイター半導体 Digital Dream Labs PaLM API デジタルレプリカ音声加工桜AIカメラ Topaz Video Enhance AI Cozmo MakerSuite GOT7 マルタ大学 Solist-AI DLSS タカラトミー Skeb synthesia 田中達大ローム山野辺一記 LOVOT Dreambooth-Stable-Diffusion HumanRF 大里飛鳥 Dynamixyz MOFLIN Actors-HQ Move AI ベンチマーク Romi Google Earth SAG-AFTRA ICRA2024 Factorio U-Net ミクシィ GEPPETTO AI WGA Hao AI Lab 13フェイズ構造ユニロボット Stable Diffusion web UI チャーリー・ブルッカー大規模基盤モデルカリフォルニア大学 ADV ユニボ Torobo GamingAgent XLand Gato 岡野原大輔東京ロボティクス Claude AI model 自己教師あり学習インピーダンス制御 Anthropic DEATH STRANDING AI Models In-Context Learning（ICL）深層予測学習 Claude 3.7 Sonnet Eric Johnson 汎用強化学習AI ZMO.AI 日立製作所 Factorio Learning Environment MOBBY’S FLE Oculus Quest コジマプロダクションロンドン芸術大学モビーディック尾形哲也 Deepseek-v3 生体情報デシマエンジン Google Brain ダイビング量子コンピュータ AIREC Gemini-2-Flash Sound Control アウトドア qubit 汎用ロボット Llama-3.3-70B SYNTH SUPER AIスキャニング IBM Quantum System 2 オムロンサイニックエックス GPT-4o-Mini 照明 Maxim Peter Karl Sims 自動採寸 ViLaIn Joshua Romoff Artnome 3DLOOK ダリオ・ヒル PDDL ZOZO NEXT ハイパースケープ ICONATE Sizer ジェン・スン・フアンニューサウスウェールズ大学 ZOZO 山崎陽斗ワコール HuggingFace Claude Sammut Fashion Intelligence System 立木創太スニーカー Stable Audio オックスフォード大学 Partial Visual-Semantic Embedding 浜中雅俊 UNSTREET 宗教 Lars Kunze WEAR ミライ小町 Newelse 仏教杉浦孔明 GPT-4V テスラ福井健策 CheckGoods コカ・コーラ田向権ソイル大学 GameGAN 二次流通食品 VASA-1 Tesla Bot 中古市場 Coca‑Cola Y3000 Zero Sugar VoxCeleb2 AIパズルジェネレーター Tesla AI Day Wikipedia Dupe Killer Copilot Copyright Commitment AniTalker DolphinGemma ソサエティ5.0 Sphere 偽ブランドテラバース上海大学 SIGGRAPH 2020 バズグラフ Xaver 1000 配信京都大学 Wild Dolphin Project ニュースタンテキ養蜂立福寛 SoundStreamトークナイザー東芝 Beewise ソニー・ピクチャーズアニメーション音声解析音声処理技術 DIB-R 倉田宜典フィンテック感情分析 Luma GPT-4.1 投資 Fosters+Partners 周済涛 Dream Machine GPT-4.1 mini 韻律射影 MILIZE Zaha Hadid Architects ステートマシン NTT GPT-4.1 nano 韻律転移三菱UFJ信託銀行ディープニューラルネットワーク Perplexity LINE AI

CGへの扉 Vol.39：言葉から生み出されるアートとは？

2022.6.17アート

言葉から生み出される画像

「立てば芍薬、座れば牡丹、歩く姿は百合の花」美しい人を表現する言葉ですが、人によってとらえ方はさまざまです。そもそも牡丹がどんな花なのか知らなければ牡丹よりも服のボタンを思い浮かべてしまうかもしれません。この言葉は江戸時代から落語や講談に出てきますが、はっきりとした由来は分かりません。もともとは薬効を示した言葉で、気が立っている人には芍薬の根を、疲れやすくすぐ座ってしまう人には牡丹の根、ふらふらと歩いている人には百合の球根が効くということらしいのですが、その本来の意味ではない事柄が今では一般的に知られています。

最近、言葉から画像を生成する人工知能を活用した事例として DALL-E の後継である DALL-E2 が話題になりました。
また、それに続いて同様の研究プロダクトであるグーグルのImagen が話題性の意味でも技術的要素としても追従してきています。

人間は理解や認識の多くを視覚に頼っています。とは言いつつも現代のコミュニケーションの多くは言葉に依存しています。先ほどの「立てば芍薬〜」と同様に言葉から想像する様相は人それぞれですが、膨大な言語体系の抽出と機械学習によって、言葉の表現どおりの画像を生成するというテクノロジーが登場しました。今まではプロのイラストレーターに言葉や例を示して描いてもらっていた絵が、テイストやその出来栄えはとにかく、人工知能が手軽に画像として合成してくれる時代がやってきたのです。

DALL-E2 の登場

DELL-E2で言葉から描いた画像。チャンピオンデータと呼ばれる良質の結果を並べたものであるが、それでもちょっとしたイラストのレベルにある

OpenAI DALL-E2：https://openai.com/dall-e-2/

2021年はじめにOpenAI社からDALL-Eが登場し、人工知能業界に衝撃を与えました。その機械学習の規模、精度とも人工知能研究に関わる人であれば容易ではないことが分かり、驚きをもって迎えられたのです。

【参考記事】CGへの扉 Vol.22：言葉から画像を生成、DALL-Eはクリエイティブなのか？

それから約一年後、満を持して登場した DALL-E2 はどう進化しているのでしょうか。

リサーチペーパーによると、DALL-E2は旧 DALL-E1に比べ、写実的で文言と画像との一致度が高いと評価されています。さらに解像度が4倍になった点も歓迎されています。

論文：Hierarchical Text-Conditional Image Generation with CLIP Latents

また、DALL-E2 は DALL-Eでの応用事例を反映し、意図しない不当な利用がなされないよう、さまざまな工夫が進んでいます。例えばフェイク画像として使われないように生成される画像に制限がかかる機構が組み込まれているなど配慮が進んでいます。そのため政治家や俳優などの画像を生成しないように、また成人向けの露骨な画像を生成しないよう、工夫がなされています。

画像生成のために指定する文言も、ポリシーに違反した言葉を扱わないよう自動的にフィルタリングするとともに、人の目でもチェックしているとのこと。現在の DALL-E2 は DALL-E1 と同様、APIは一般に公開されておらず、信頼できる限られたユーザーにのみ公開し、利用方法を探っていると言われています。DALL-E2 は素晴らしい成果と受け取られていつつも、逆に DALL-E2 が苦手とする画像や文言の研究も進んでいます。今後は研究成果というだけでなく、実用に向かっての工夫や制限を考慮することで、さらに用途が広がってくることが予想されます。

DALL-E2 の発表に合わせてInstagramのアカウントも開設されており「何かアイデアがあればDMで送ってくれれば実現するよ！」と書かれています。

DALL-E2はOpenAIが開発している、テキストと画像のペアを学習したCLIPと、テキストから画像を生成するGLIDEというテクノロジーを組み合わせて使われています。

CLIP：https://openai.com/blog/clip/
CLIPに関する論文：Learning Transferable Visual Models From Natural Language Supervision
GLIDEに関する論文：Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models

DALL-E2も次に紹介するGoogle Imagenも拡散モデル（Diffusion Model）と呼ばれる方式を用いています。最初はランダムな点のパターンの組み合わせから始まり、そこで生成された画像に指定された言葉の要素がふくまれていれば、そのまま画像を徐々に精細に変化させていきます。一方、画像が指定された言葉からかけ離れてきた場合は、そこで計算を打ち切ります。膨大なトライ＆エラーの結果、指定された言葉を描いた画像が生成されるわけです。今後ますます精度やリアルさ、様々な言葉の扱いを広げてくると考えられます。DALL-E3はどう進化してくるのか今から楽しみです。

Google Imagenの登場

毎度、グーグルのプロダクトは名前が普通すぎて冴えない気がしていますが、Google Imagen（正式名：Imagen diffusion model）もDALL-E 同様言葉で表現したイメージ画像を生成するテクノロジーです。Imagenは印象、画像、姿といった意味です。

論文：Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding

グーグルは「DrawBench」と呼ばれる大量のテキストリストからGoogle Imagenで生成した画像と、DALL-E2 で生成した画像を人が比較し、言葉とその言葉が示すであろう画像との一致度を図ったところ、Imagen の方が評価が高かったと報告されています。

DALL-E2ではいち早く不適切な画像が生成されないよう配慮を進めている一方、Google Imagen はバイアスを考慮してか（？）あえて不適切な画像データも学習データとして用いてしまっているため、場合によっては一般的な閲覧には適さない画像も生成されるのが現状とのこと。学習のデータセットのベースとして用いられているのはLAION-400M。今後、意図的に不適切な画像を抜いておくのか、それを踏まえた上でありとあらゆる画像を扱うのか、論争が広がってくると考えられます。機械学習の教師データとして自動生成した画像を活用する合成データ「Synthetic Data」の考えも広がっており、一筋縄ではいかないことが分かります。

Google Imagen 開発の際に発見された特徴として、画像のモデルを大きく扱おうとするよりも、言語モデルの扱いを大きくした方が効率よく良い画像が得られるという意外な結果です。そう考えると、今まで思い込みで考えてきた研究や実装も、人工知能にとっては何か違う重要な要素が隠されている箇所がいろいろ見つかっていきそうです。

Google Imagen では 64×64 ピクセルサイズの画像であたりをつけ、そこから 256×256, 1024×1024 にアップコンバートする流れで、高精細な目的画像を生成しています。

ブルーチェックのベレー帽と赤いドット柄のタートルネックを着たゴールデンレトリバー

言葉から三次元アバターを生成する AvatarCLIP

コンピュータグラフィックスの最新研究論文が発表される今年の SIGGRAPH 2022 は、カナダのバンクーバーにて 8月8日から11日の5日間、現地会場とオンラインとハイブリッド環境で実施される予定です。SIGGRAPH 2022 で発表される論文が徐々に明らかになってきており、話題を先取りすると、その中でも注目の論文のひとつが、言葉から三次元アバターを生成するAvatarCLIP です。

AvatarCLIPは、事前学習済みの環境だけで、あらかじめデータが無いものについてもある程度の予測から目的の結果を出力できる「ゼロショット学習」と呼ばれる実装がなされています。AvatarCLIP は DELL-E2 や Google Imagen の 3D版ともいえるもので、自然言語から3Dアバターの形状と、テクスチャ（柄や色の情報）、動きといった情報を生成することができます。出力事例をみると、まだまだぎこちない感は否めませんが、今後ゲーム内の NPC（ノンプレイヤーキャラクター）や、群衆もののCG/VFXで活用できる可能がみてとれます。

AvatarCLIP: Zero-Shot Text-Driven Generation and Animation of 3D Avatars

論文：https://arxiv.org/abs/2205.08535
プロジェクトページ：https://hongfz16.github.io/projects/AvatarCLIP.html
ソースコード：https://github.com/kaz12tech/ai_demos/blob/main/AvatarCLIP_demo.ipynb

人が生み出すアートと、人工知能が生み出すアート

DALL-E2もGoogle Imagenも、現在は一般公開されていないこともあり、Twitterのネタとして扱われてしまいます。ちょっとしたイラストであれば、素早く的確なものを瞬時に用意できることから、これもまた「人工知能が人間の仕事を奪う」事例として考える人が出てくるかもしれません。DALL-E2やGoogle Imagenが生成する画像は、人間ぽっさも少し感じますが、その理由は面白そうな画像を生み出そうと考えている人間が考えた生成キーワードに由来しているとも言えます。妙なリアルさと、かすかに感じる人間ではない何かの知性らしきものが感じられる画像が生み出されており、若干妙な雰囲気が感じられるのも確かです。

DALL-Eの名前は、シュルレアリスムと呼ばれるシュールで独特の雰囲気をもった絵画で知られるサルバドール・ダリの名前と、廃墟となった惑星のゴミ拾いを続けるロボットWALL-Eから取られているので、その奇妙さも納得できるかもしれません。ただ、そういって笑っていられるのは今だけで、気づかないうちに日頃目にする広告画像や商品パッケージ、イラストを描いたのは実は人工知能という世の中がやってくるかもしれません。

本連載の今後の予定：「CGへの扉」では、単なるAIの話題とは少し異なり、CG/VFX, アートの文脈から話題を切り取り紹介していきます。映像制作の現場におけるAI活用や、AIで価値が高まった先進的なツール、これからの可能性を感じさせるような話題、テクノロジーの話題にご期待ください。何か取り上げて欲しいテーマやご希望などがございましたら、ぜひ編集部までお知らせください。

CGへの扉：

Vol.38：AIで作りAIで届ける映像作品

Vol.37：NVIDIA GTC 2022 レポート／アートとAIの視点で

Vol.36：創るためのAI〜AIと人間の創造性の未来：徳井直生氏講演レポート

Vol.35：マーベル・シネマティック・ユニバースを支える機械学習

Vol.34：注目論文よりCGの祭典 #SIGGRAPHAsia2021 を振り返る

Vol.33：AIの必然性 #SIGGRAPHAsia2021 レポート

Vol.32：Adobe Sneaks より進化の方向性を知る

Vol.31：人工知能が考える「顔」と、人が考える「顔」

Vol.30：SIGGRAPH2021レポート「ディープフェイクとの戦い」

Vol.29：AIの恩恵を受けるCG研究の世界。#SIGGRAPH2021 論文より

Vol.28：定番手法の他分野応用、自然言語処理AI由来の画像処理AI