モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。

TAG LIST: CG CGへの扉生成AI 安藤幸央吉本幸記月刊エンタメAIニュース河合律子機械学習ディープラーニング OpenAI LLM Google NVIDIA 大規模言語モデルグーグル GAN 音楽モリカトロン森川幸人 ChatGPT 三宅陽一郎 DeepMind 強化学習 Stable Diffusion 人工知能学会ニューラルネットワークシナリオマイクロソフト QA 自然言語処理 AIと倫理 GPT-3 倫理 Facebook 大内孝子映画 SIGGRAPH スクウェア・エニックス著作権アートキャラクターAI ルールベースゲームプレイAI Minecraft 敵対的生成ネットワーク NPC 音楽生成AI 動画生成AI モリカトロンAIラボインタビューアニメーション 3DCG 画像生成 NFT ロボットファッション DALL-E2 StyleGAN プロシージャルディープフェイクマルチモーダル VFX Midjourney 遺伝的アルゴリズムデバッグ自動生成 VR メタAI Meta 画像生成AI Red Ram マンガインタビューゲームAI Adobe Microsoft テストプレイマインクラフト CLIP テキスト画像生成深層学習 CEDEC2019 toio 教育 NeRF デジタルツインメタバース不完全情報ゲーム小説 Stability AI ボードゲーム DALL-E Sora ビヘイビア・ツリー CEDEC2021 CEDEC2020 作曲アストロノーカロボティクスナビゲーションAI 高橋力斗 AIアート Gemini メタ畳み込みニューラルネットワークアップルデジタルヒューマン ELSI Playable!スポーツエージェント GDC 2021 プロンプト GPT-4 手塚治虫汎用人工知能 JSAI2022 3D 広告 DALL-E 3 バーチャルヒューマン NVIDIA Omniverse GDC 2019 マルチエージェント CEDEC2022 市場分析 AR 懐ゲーから辿るゲームAI技術史鴫原盛之ジェネレーティブAI ソニー東京大学はこだて未来大学栗原聡 CNN マーケティング JSAI2024 CM BERT Microsoft Azure 音声認識言霊の迷宮 Unity Omniverse Ubisoft JSAI2023 Roblox がんばれ森川君2号電気通信大学 SIGGRAPH ASIA HTN Apple 階層型タスクネットワーク AIQVE ONE 世界モデルアドベンチャーゲームインディーゲーム JSAI2020 GTC2023 音声合成メタデータ TensorFlow ブロックチェーンイベントレポートキャリア模倣学習対話型エージェント Amazon サイバーエージェントトレーディングカードメディアアート DQN シーマン合成音声 SIE Runway 水野勇太モリカトロン開発者インタビュー宮本茂則アバターブラック・ジャック Genvid Technologies ガイスター StyleGAN2 徳井直生稲葉通将斎藤由多加 Open AI ベリサーブ GTC2022 GPT-3.5 YouTube 音声生成AI SF Netflix JSAI2021 松木晋祐 Bard 研究シムシティシムピープル Zork GPT-4o MCS-AI動的連携モデルマーダーミステリーモーションキャプチャー TEZUKA2020 CEDEC2023 AGI テキスト生成スパーシャルAI Electronic Arts GDC Summer イーロン・マスク論文 Stable Diffusion XL 森山和道 Audio2Face NVIDIA Riva eスポーツスタンフォード大学アーケードゲームテニスセガ人狼知能 Google I/O 類家利直 Firefly eSports BLUE PROTOCOL CEDEC2024 aibo 大澤博隆 SFプロトタイピング銭起揚 Runway Gen-3 Alpha チャットボット TikTok text-to-3D DreamFusion 自動運転車ワークショップ Epic Games AIロボ「迷キュー」に挑戦 AWS Adobe MAX 村井源クラウド AlphaZero Preferred Networks Transformer GPT-2 rinna AIりんなカメラ環世界中島秀之 PaLM GitHub Copilot LLaMA 哲学 Apple Vision Pro ハリウッド宮路洋一 Whisk 理化学研究所 Gen-1 SIGGRAPH Asia 2024 テキスト画像生成AI 松尾豊人事データマイニング ControlNet 現代アート DARPA 法律ドローンゲームエンジン Unreal Engine Imagen 人工生命バイアスサム・アルトマン Veo ASBS ぱいどん AI美空ひばり手塚眞デザイン GDC 2025 バンダイナムコ研究所 ELYZA NEDO 建築 ELIZA FSM-DNN MindAgent BIM LEFT 4 DEAD くまうた通しプレイソニー・インタラクティブエンタテインメント OpenAI Five Meshy 本間翔太馬淵浩希 Cygames 岡島学ピクサー九州大学プラチナエッグイーサリアム効果音ボエダ・ゴティエビッグデータ中嶋謙互 Amadeus Code データ分析自動翻訳 MILE NVIDIA ACE Veo 3 ナラティブ Niantic Omniverse Replicator WCCF レコメンドシステム NVIDIA DRIVE Sim WORLD CLUB Champion Football NVIDIA Isaac Sim Sakana AI 柏田知大軍事田邊雅彦トレカ慶應義塾大学 Max Cooper GPT Disney Photoshop PyTorch 京都芸術大学 ChatGPT4 モンテカルロ木探索 ByteDance 眞鍋和子バンダイナムコスタジオコミコパヒストリア AI Frog Interactive 新清士ラベル付け田中章愛 ComfyUI 齊藤陽介コナミデジタルエンタテインメント成沢理恵お知らせ Magic Leap One Tencent サッカーバスケットボール LINEヤフー Suno AI KaKa Creation VOICEVOX text-to-image サルでもわかる人工知能 VAE TEZUKA2023 DOOM リップシンキング RNN GameNGen グランツーリスモ・ソフィー Ubisoft La Forge スーパーマリオブラザーズ社員インタビュー知識表現ウォッチドッグスレギオン VTuber IGDA 立教大学秋期GTC2022 大阪公立大学 HALO フォートナイト KLab どうぶつしょうぎジェイ・コウガミ音楽ストリーミング MIT 野々下裕子 Movie Gen Qosmo マシンラーニング 5G MuZero Rival Peak pixiv オムロンサイニックエックス GPTs セキュリティ対話エンジンポケモン 3Dスキャン橋本敦史リトル・コンピュータ・ピープル Codex シーマン人工知能研究所コンピューティショナル・フォトグラフィーゴブレット・ゴブラーズ絵画 3D Gaussian Splatting Microsoft Designer イラストシミュレーション Soul Machines 柿沼太一完全情報ゲームバーチャルキャラクター坂本洋典宮本道人釜屋憲彦 LLaMA 2 ウェイポイントパス検索 Hugging Face 対談藤澤仁生物学 XR GTC 2022 xAI 画像認識 Siemens ストライキ StyleCLIP DeNA Voyager 長谷洋平 GDC 2024 クラウドコンピューティング masumi toyota IBM ぎゅわんぶらあ自己中心派 OpenSea GDC 2022 Veo 2 ウロチョロス SNS TextWorld Earth-2 Bing エコロジー Magenta ソフトバンク SONY ポケットモンスター ELYZA Pencil Scenario SIGGRAPH2023 AIピカソ GTC2021 AI素材.com CycleGAN テンセント Andreessen Horowitz QA Tech Night NetHack 下田純也桑野範久キャラクターモーション音源分離 NBA フェイクニュースユニバーサルミュージック RPG ウィル・ライト Web3 SIGGRAPH 2022 レベルデザイン DreamerV3 SIMA AIボイスアクター南カリフォルニア大学 NVIDIA Canvas GDC GPU ALife オルタナティヴ・マシンサウンドスケープ LaMDA TRPG マジック：ザ・ギャザリング AI Dungeon 介護 BitSummit Gemma 2 Cube 3D ゼビウス NetEase Inworld AI モリカトロンAIコネクトゲーム背景 IEEE Point-E アパレル不気味の谷 LoRA ナビゲーションメッシュファインチューニング早稲田大学グランツーリスモ写真高橋ミレイ北野宏明深層強化学習松原仁松井俊浩武田英明フルコトモリカコミックパックマン ELYZA DIGEST ジョージア工科大学 Apple Intelligence WWDC WWDC 2024 西成活裕ハイブリッドアーキテクチャ AI野々村真 LINE AIトークサジェスト Apex Legends 群衆マネジメントライブポートレイト GTC2025 Ninja コンピュータRPG ライブビジネス Wonder Studio Adobe Max 2023 GPT-4-turbo Fuxi Lab アップルタウン物語新型コロナ土木佐藤恵助 Naraka:Bladepoint Mobile KELDIC 周済涛 Bing Chat 大道麻由バトルロイヤルメロディ言語清田陽司インフラ Bing Image Creator 物語構造分析ビヘイビアツリーゲーム TENTUPLAY サイバネティックス慶応義塾大学 SoftServe MARVEL Future Fight Astro 人工知能史 Amazon Bedrock Assistant with Bard 渡邉謙吾 ALNAIR タイムラプス Ego4D AI哲学マップ The Arcade ここ掘れ！プッカ AMRI バスキア星新一 X.AI Search Generative Experience BLADE 日経イノベーション・ラボ StyleGAN-XL X Corp.Dynalang 濱田直希 GAGA 敵対的強化学習 StyleGAN3 Twitter VLE-CE 大柳裕⼠QUEEN 階層型強化学習 GOSU Data Lab GANimator Xホールディングス加納基晴 Runway Gen-4 WANN GOSU Voice Assistant VoLux-GAN Magi AI Act SkyReels 竹内将 SenpAI.GG Projected GAN EU 研究開発事例 Mobalytics Self-Distilled StyleGAN SDXL Ars Electronica 赤羽進亮 Stable Virtual Camera ニューラルレンダリング RTFKT AI規制遊戯王 Intangible AWS Sagemaker PLATO NIKE 欧州委員会 UDI（Universal Duel Interface）ブライアン・イーノ映像セリア・ホデント形態素解析 frame.io Clone X 欧州議会第一工科大学 Eno UX AWS Lambda Foodly 村上隆欧州理事会佐竹空良 Brain One 誤字検出 MusicLM 小林篤史 AlphaEvolve 認知科学中川友紀子 Digital Mark AudioLM Continuous Thought Machine（CTM）ゲームデザイン SentencePiece アールティ Snapchat MusicCaps 荻野宏実 Arm LUMINOUS ENGINE クリエイターコミュニティ AudioCraft 伊藤黎 Stable Audio Open Small Luminous Productions BlenderBot 3 バーチャルペットビヘイビアブランチ Word2World パターン・ランゲージ竹村也哉 Meta AI NVIDIA NeMo Service Mubert WPP STORY2GAME ちょまどマーク・ザッカーバーグヴァネッサ・ローザ Mubert Render General Computer Control（GCC）ウィットウォーターランド大学 GOAP WACUL Vanessa A Rosa Gen-2 Cradle 森川の頭の中 Adobe MAX 2021 陶芸 Runway AI Film Festival Spiral.AI 花森リド Play.ht PreViz ItakoLLM-7b Google I/O 2025 音声AI 静岡大学 AIライティング LiDAR Character-LLM 明治大学 Flow Omniverse Avatar AIのべりすと Polycam 復旦大学北原鉄朗 Lyra 2 FPS QuillBot deforum Chat-Haruhi-Suzumiya 中村栄太 MusicFX DJ マルコフ決定過程 NVIDIA Megatron Copysmith 涼宮ハルヒ日本大学 Animon.ai NVIDIA Merlin Jasper ハーベスト Emu Video ヤマハツインズひなひま NVIDIA Metropolis ForGames 前澤陽 Maya パラメータ設計ゲームマーケットペリドット増田聡 Deep Q-Learning バランス調整岡野翔太 Dream Track 採用 AlphaGO 協調フィルタリング郡山喜彦 Music AI Tools スペースインベーダーテキサス大学ジェフリー・ヒントン Lyria 科学史プリンス・オブ・ペルシャ Google I/O 2023 Yahoo!知恵袋 AIサイエンティストドラゴンクエストIV AlphaDogfight Trials AI Messenger Voicebot インタラクティブプロンプトAI Terra 堀井雄二エージェントシミュレーション OpenAI Codex 武蔵野美術大学 AI Overview 山名学 StarCraft II HyperStyle BingAI 石渡正人電通タイトー Future of Life Institute Rendering with Style 手塚プロダクション AICO2 カプコン Intel 林海象 BitSummit Drift Ubi Anvilエンジン LAIKA Disneyリサーチヴィトゲンシュタイン古川善規 V1 Video Model Rotomation GauGAN 論理哲学論考 Lightroom 大規模再構成モデル Omega Crafter Artificial Analysis GauGAN2 Canva LRM SPACE INVADIANS Video Arena ドラゴンクエストライバルズ画像言語表現モデル Objaverse 西島大介 Video Model Leaderboard 不確定ゲーム SIGGRAPH ASIA 2021 PromptBase BOOTH MVImgNet 吉田伸一郎 Claude 3.5 Dota 2 ディズニーリサーチ pixivFANBOX One-2-3-45 SIGGRAPH2024 Mistral Mitsuba2 バンダイナムコネクサス虎の穴 3Dガウシアンスプラッティング Motion-I2V JSAI2025 ソーシャルゲーム Embedding ワイツマン科学研究所ユーザーレビュー Fantia ワンショット3D生成技術 GTC2020 CG衣装 mimic とらのあな Toonify3D NVIDIA MAXINE VRファッション Baidu 集英社 FGDC 生成対向ネットワーク淡路滋ビデオ会議 Artflow ERNIE-ViLG 少年ジャンプ＋Future Game Development Conference 拡散モデルグリムノーツ Eponym 古文書 ComicCopilot 佐々木瞬 Diffusion ゴティエ・ボエダ音声クローニング凸版印刷 Gautier Boeda 階層的クラスタリング Gopher AI-OCR ゲームマスターうめ画像判定 Inowrld AI 小沢高広 Julius 鑑定 MOD Anique ドリコム TPRG Oxia Palus Ghostwriter 中村太一 ai and バーチャル・ヒューマン・エージェント toio SDK for Unity Art Recognition Skyrim エグゼリオ SaaS クーガー実況パワフルサッカースカイリム Copilot インサイト石井敦 NHC 2021 桃太郎電鉄 RPGツクールMZ カスタマーサポート茂谷保伯池田利夫桃鉄 ChatGPT_APIMZ serial experiments lain ComfyUI-AdvancedLivePortrait GDMC 新刊案内パワサカダンジョンズ&ドラゴンズ AI lain GUI マーベル・シネマティック・ユニバース Oracle RPG PCG MITメディアラボ MCU 岩倉宏介深津貴之 PCGRL アベンジャーズ PPO xVASynth Dungeons&Dragons Video to Video マジック・リープ Digital Domain Machine Learning Project Canvas Laser-NV ビートルズ iPhone 16 Magenda Masquerade2.0 国立情報学研究所ザ・ビートルズ: Get Back OpenAI o1 ノンファンジブルトークン DDSP フェイシャルキャプチャー石川冬樹 MERF Demucs AIスマートリンクスパコン Alibaba 音楽編集ソフトシャープ里井大輝 Kaggle スーパーコンピュータ VQRF Adobe Audition ウェアラブル山田暉松岡聡 nvdiffrec iZotope CE-LLM Assassin’s Creed Origins AI会話ジェネレーター TSUBAME 1.0 NeRFMeshing RX10 Communication Edge-LLM Sea of Thieves TSUBAME 2.0 LERF Moises GEMS COMPANY monoAI technology LSTM ABCI マスタリング AIペットモリカトロンAIソリューション富岳レベルファイブ Yahoo!ニュース初音ミク Oculus コード生成AI Society 5.0 リアム・ギャラガー AI Comic Factory 転移学習テスト AlphaCode 夏の電脳甲子園グライムス AI comic Generator Baldur's Gate 3 Codeforces 座談会 Boomy ComicsMaker.ai Candy Crush Saga 自己増強型AI ジョン・レジェンド Genie AI LlamaGen.ai SIGGRAPH ASIA 2020 COLMAP ザ・ウィークエンド SIGGRAPH Asia 2023 GAZAI ADOP NVIDIA GET3D ドレイク C·ASE Flame Planner デバッギング BigGAN GANverse3D FLARE 動画ゲーム生成モデル MaterialGAN ダンスグランツーリスモSPORT AI絵師エッジワークス MagicAnimate ReBeL UGC 日本音楽作家団体協議会 Animate Anyone Virtuals Protocol GTソフィー PGC FCA インテリジェントコンピュータ研究所 Volvo FIAグランツーリスモチャンピオンシップ Voicebox アリババ MarioVGG NovelAI さくらインターネット DreaMoving Rival Prak DGX A100 NovelAI Diffusion VISCUIT 松原卓二ぷよぷよ Scratch Art Transfer 2 ユービーアイソフト Webcam VTuber モーションデータスクラッチ Art Selfie 2 星新一賞ビスケット Musical Canvas 北尾まどかポーズ推定 TCG プログラミング教育 The Forever Labyrinth 将棋メタルギアソリッドV メッシュ生成 Refik Anadol FSM メルセデス・ベンツ QRコード VALL-E Alexander Reben Magic Leap 囲碁 Deepdub.ai Rhizomatiks ナップサック問題 Live Nation Epyllion デンソー AUDIOGEN Molmo 汎用言語モデル Web3.0 マシュー・ボールデンソーウェーブ Evoke Music PixMo AIOps ムーアの法則原昌宏 AutoFoley Qwen2 72B Spotify スマートコントラクト日本機械学会 Colourlab.Ai Depth Pro Replica Studio ロボティクス・メカトロニクス講演会ディズニー amuse Chitrakar Adobe MAX 2022 トヨタ自動車 Largo.ai VARIETAS 巡回セールスマン問題かんばん方式 Cinelytic AI面接官ジョルダン曲線メディア Adobe Research Taskade キリンホールディングス政治 Galactica プロット生成 Pika.art 空間コンピューティングクラウドゲーミング AI Filmmaking Assistant Dream Screen 和田洋一リアリティ番組映像解析 FastGAN SynthID Stadia ジョンソン裕子 4コママンガ AI Screenwriter Firefly Video Model MILEs NightCafe 東芝デジタルソリューションズ芥川賞 Stable Video 4D インタラクティブ・ストリーミング Luis Ruiz SATLYS 映像解析AI 文学 AI受託開発事例インタラクティブ・メディア恋愛田中志弥 PFN 3D Scan ElevenLabs タップル Playable!3D 東京工業大学 HeyGen Abema TV Playable!Mobile Ludo 博報堂 After Effects NEC Adobe MAX 2024 ラップ PFN 4D Scan 絵本木村屋 Sneaks SIGGRAPH 2019 ArtEmis Z世代 DreamUp 出版 GPT Store Illustrator AIラッパーシステム DeviantArt Ammaar Reshi 生成AIチェッカー Meta Quest 3 Waifu Diffusion Stories ユーザーローカル XR-Objects GROVER プラスリンクス～キミと繋がる想い～元素法典 StoryBird 九段理江 Peridot FAIR STC Novel AI Versed 東京都同情塔 Orion チート検出 Style Transfer Conversation ProlificDreamer 防犯オンラインカジノ RCP Unity Sentis 4Dオブジェクト生成モデル O2 RealFlow Rinna Character Platform Unity Muse Align Your Gaussians Scam Detection iPhone CALA Caleb Ward AYG Live Threat Detection Deep Fluids 宮田龍 MAV3D 乗換NAVITIME MeInGame Amelia 清河幸子ファーウェイ Kaedim AIGraph ブレイン・コンピュータ・インタフェース西中美和 4D Gaussian Splatting 3DFY.ai BCI Gatebox アフォーダンス安野貴博 4D-GS Luma AI Learning from Video ANIMAK PaLM-SayCan 斧田小夜 Glaze Avaturn 予期知能逢妻ヒカリ WebGlaze Bestat セコム NightShade Oasis ユクスキュルバーチャル警備システム Code as Policies Spawning Decart カント損保ジャパン CaP Have I Been Trained?Dejaboom!CM3leon Fortnite Unbounded 上原利之 Stable Doodle Unreal Editor For Fortnite Etched ドラゴンクエストエージェントアーキテクチャアッパーグラウンドコリジョンチェック T2I-Adapter 声優 PAIR OCTOPATH TRAVELER パブリシティ権西木康智 Volumetrics 日本俳優連合 OCTOPATH TRAVELER 大陸の覇者山口情報芸術センター［YCAM］AIワールドジェネレーター日本芸能マネージメント事業者協会アルスエレクトロニカ2019 品質保証 YCAM 日本マネジメント総合研究所 Rosebud AI Gamemaker 日本声優事業社協議会 StyleRig Autodesk アンラーニング・ランゲージ Layer IAPP 逆転オセロニア Bentley Systems カイル・マクドナルド Lily Hughes-Robinson Charisma.ai Tripo 2.0 ワールドシミュレーターローレン・リー・マッカーシー Colossal Cave Adventure Meta 3D Gen 奥村エルネスト純いただきストリート H100 鎖国［Walled Garden］プロジェクト AdventureGPT 調査スマートシティ齋藤精一大森田不可止 COBOL SIGGRAPH ASIA 2022 リリー・ヒューズ＝ロビンソン Meta Quest 都市計画高橋智隆 DGX H100 VToonify BabyAGI IP 松本雄太ロボユニザナック DGX SuperPOD ControlVAE GPT-3.5 Turbo 早瀬悠真泉幸典仁井谷正充変分オートエンコーダーカーリング強いAI Genie 2 ロボコレ2019 Instant NeRF フォトグラメトリウィンブルドン弱いAI World Labs artonomous 回帰型ニューラルネットワーク Cybever bitGANs DeepJoin 戦術分析 Third Dimension AI Azure Machine Learning Azure OpenAI Service パフォーマンス測定 Lumiere 東北大学意思決定モデル脱出ゲーム DeepL IoT UNet Gemini 2.0 Hybrid Reward Architecture コミュニティ管理 DeepL Write ProFitX ImageFX Super Phoenix Watsonx MusicFX Project Malmo オンラインゲーム Athletica TextFX フロンティアワークス気候変動コーチング機械翻訳 Project Paidia シンギュラリティ北見工業大学 Keyframer Simplified Project Lookout マックス・プランク気象研究所レイ・カーツワイル北見カーリングホール AI Voice over Generator Watch For ビョルン・スティーブンスヴァーナー・ヴィンジ画像解析 Gemini 1.5 AI Audio Enhancer 気象モデル Runway Research じりつくん AI Studio エーアイ LEFT ALIVE 気象シミュレーション Make-A-Video NTT Sportict Vertex AI AITalk 長谷川誠ジミ・ヘンドリックス環境問題 Phenaki AIカメラ Chat with RTX コエステーション Baby X カート・コバーン Dreamix STADIUM TUBE Slack ロバート・ダウニー・Jr.エイミー・ワインハウス SDGs Text-to-Imageモデル Pixelllot S3 Slack AI PlayStation Pokémon Battle Scope ダフト・パンクメモリスタ AIスマートコーチ VRML Glenn Marshall kanaeru Techno Magic The Age of A.I.Story2Hallucination 音声変換 Latitude 占いゴーストバスターズレコメンデーション Jukebox Dreambooth 行動ロジック生成AI スパイダーマン Veap Japan ヤン・ルカン Convai ポリフォニー・デジタル EAP neoAI Perfusion NTTドコモ荒牧伸志 SIFT 福井千春 DreamIcon ニューラル物理学 Ememe Project Sid DCGAN 医療 mign 毛髪 Genie Altera MOBA DANNCE メンタルケア studiffuse 荒牧英治汎用AIエージェント Robert Yang ハーバード大学 Edgar Handy 中ザワヒデキ AIファッションウィーク Razer 研修デューク大学大屋雄裕インフルエンサー Project AVA 中川裕志 Grok-1 Streamlabs mynet.ai ローグライクゲーム Adreeseen Horowitz Mixture-of-Experts Intelligent Streaming Assistant 東京理科大学 NVIDIA Avatar Cloud Engine MoE Project DIGITS 人工音声 NeurIPS 2021 産業技術総合研究所 Replica Studios Claude 3 スーパーコンピューターリザバーコンピューティング Smart NPCs Claude 3 Haiku エージェンテックプレイ動画ヒップホップ対話型AIモデル Roblox Studio Claude 3 Sonnet AI Shorts 詩ソニーマーケティング Promethean AI Claude 3 Opus テルアビブ大学サイレント映画もじぱ note 森永乳業 DiffUHaul 環境音暗号通貨 note AIアシスタント Musiio C2PA TrailBlazer FUZZLE Ketchup Endel ゲーミフィケーションヴィクトリア大学ウェリントン Alteration AI News Tomo Kihara zeroscope 粒子群最適化法 Art Selfie Playfool QNeRF 進化差分法オープンワールド Art Transfer Sonar 遊びカーネギーメロン大学群知能下川大樹 AIFA Pet Portraits Sonar+D tsukurun RALF 高津芳希 P2E Blob Opera 地方創生グラフィック大石真史クリムト Dolby Atmos 吉田直樹メイク BEiT StyleGAN-NADA Sonar Music Festival 素材 Canvas DETR ライゾマティクス Projects Spore クリティックネットワーク真鍋大度 OpenAI Japan DeepSeek デノイズ Unity for Industry アクターネットワーク花井裕也 Voice Engine DeepSeek-R1 画像処理 DMLab Ritchie Hawtin Command R+Sentropy GLIDE Control Suite Erica Synth Oracle Cloud Infrastructure Loopy CPU Discord AvatarCLIP Atari 100k Ufuk Barış Mutlu Google Workspace リップシンク Synthetic Data Atari 200M Japanese InstructBLIP Alpha Udio CyberHost CALM Yann LeCun 日本新聞協会立命館大学 OmniHuman-1 プログラミング鈴木雅大 AIいらすとや京都精華大学 CSAM ソースコード生成コンセプトアート AI Picasso TacticAI Imagen 3 GMAI シチズンデベロッパー Sonantic Colie Wertz Emposy NPMP Google Labs GitHub Cohere リドリー・スコット AIタレント FOOH Microsoft Muse ウィザードリィ MCN-AI連携モデル絵コンテ AIタレントエージェンシーゲーム生成モデル Urzas.ai ストーリーボード modi.ai Project Astra WHAMデモンストレーター大阪大学 Google I/O 2024 ChatGPT Edu 西川善司並木幸介 Kiki Blender BitSummit Let’s Go!!滋賀大学サムライスピリッツ森寅嘉 Zoetic AI SIGGRAPH 2021 ペット感情認識キリンビールストリートファイター半導体 Digital Dream Labs PaLM API デジタルレプリカ音声加工桜AIカメラ Topaz Video Enhance AI Cozmo MakerSuite GOT7 マルタ大学 Solist-AI DLSS タカラトミー Skeb synthesia 田中達大ローム山野辺一記 LOVOT Dreambooth-Stable-Diffusion HumanRF 大里飛鳥 Dynamixyz MOFLIN Actors-HQ Move AI ベンチマーク Romi Google Earth SAG-AFTRA ICRA2024 Factorio U-Net ミクシィ GEPPETTO AI WGA Hao AI Lab 13フェイズ構造ユニロボット Stable Diffusion web UI チャーリー・ブルッカー大規模基盤モデルカリフォルニア大学 ADV ユニボ Torobo GamingAgent XLand Gato 岡野原大輔東京ロボティクス Claude AI model 自己教師あり学習インピーダンス制御 Anthropic DEATH STRANDING AI Models In-Context Learning（ICL）深層予測学習 Claude 3.7 Sonnet Eric Johnson 汎用強化学習AI ZMO.AI 日立製作所 Factorio Learning Environment MOBBY’S FLE Oculus Quest コジマプロダクションロンドン芸術大学モビーディック尾形哲也 Deepseek-v3 生体情報デシマエンジン Google Brain ダイビング量子コンピュータ AIREC Gemini-2-Flash Sound Control アウトドア qubit 汎用ロボット Llama-3.3-70B SYNTH SUPER AIスキャニング IBM Quantum System 2 オムロンサイニックエックス GPT-4o-Mini 照明 Maxim Peter Karl Sims 自動採寸 ViLaIn Joshua Romoff Artnome 3DLOOK ダリオ・ヒル PDDL ZOZO NEXT ハイパースケープ ICONATE Sizer ジェン・スン・フアンニューサウスウェールズ大学 ZOZO 山崎陽斗ワコール HuggingFace Claude Sammut Fashion Intelligence System 立木創太スニーカー Stable Audio オックスフォード大学 Partial Visual-Semantic Embedding 浜中雅俊 UNSTREET 宗教 Lars Kunze WEAR ミライ小町 Newelse 仏教杉浦孔明 GPT-4V テスラ福井健策 CheckGoods コカ・コーラ田向権ソイル大学 GameGAN 二次流通食品 VASA-1 Tesla Bot 中古市場 Coca‑Cola Y3000 Zero Sugar VoxCeleb2 AIパズルジェネレーター Tesla AI Day Wikipedia Dupe Killer Copilot Copyright Commitment AniTalker DolphinGemma ソサエティ5.0 Sphere 偽ブランドテラバース上海大学 SIGGRAPH 2020 バズグラフ Xaver 1000 配信京都大学 Wild Dolphin Project ニュースタンテキ養蜂立福寛 SoundStreamトークナイザー東芝 Beewise ソニー・ピクチャーズアニメーション音声解析音声処理技術 DIB-R 倉田宜典フィンテック感情分析 Luma GPT-4.1 投資 Fosters+Partners 周済涛 Dream Machine GPT-4.1 mini 韻律射影 MILIZE Zaha Hadid Architects ステートマシン NTT GPT-4.1 nano 韻律転移三菱UFJ信託銀行ディープニューラルネットワーク Perplexity LINE AI

CGへの扉 Vol.22：言葉から画像を生成、DALL-Eはクリエイティブなのか？

2021.1.14アート

OpenAIから、言葉から画像を生成するDALL-Eが登場

汎用人工知能の実現を目指して研究を進める団体OpenAIが、2021年1月5日に文章から画像を生成するDALL-Eと、言葉と画像を関係づけるCLIPを発表しました（もともとOpenAIは、非営利団体でしたが、2019年3月より利益に上限のある営利団体に変わっています）。

DALL-E：https://openai.com/blog/dall-e/
CLIP：https://openai.com/blog/clip/

OpenAIは、TESLAやSpaceXの創業者として知られるイーロン・マスク氏やMicrosoftが支援している汎用人工知能の研究機関で、OpenAIのチーフサイエンティストを務めるIlya Sutskever氏が、今回の研究を牽引しています。DALL-Eはテレビのクイズ番組や、伝言ゲーム等でよくある、言葉だけで説明した図柄を正確に画像で表現するというものです。

Webページや雑誌に画像や写真が掲載されている場合、その画像についての適切で短い文章の説明として「キャプション」が書かれていることがあります。一般的にキャプションはその原稿の執筆者や編集者が考えて書いていますが、DALL-Eでは逆に、いわゆるそのキャプションの文章から、適切な画像を生成するという汎用言語モデルです。

DALL-Eの名前は、シュルレアリスムと呼ばれるシュールで独特の雰囲気をもった絵画で知られるサルバドール・ダリの名前と、PIXARの長編アニメ映画に登場するゴミ集めロボットWALL-Eに由来しています。DALL-Eは大量のテキスト情報と画像情報の組み合わせ例を学習し、120億個のパラメータを持ったGPT-3の活用事例でもあります。

DALL-Eのベースとなっているのは、同じくOpenAIが開発している高精度なAI文章生成ツールGPT-3（Generative Pre-Training3）とVQ-VAE-2（Vector Quantised-Variational AutoEncoder：ベクトル量子化-変分オートエンコーダ）と呼ばれるノイズからシグナルを分離する仕組みです。

GPT-3は、1,750億のパラメータを備えた自然言語の文章生成言語モデルであり、文章の生成だけでなく、プログラムも生成できるとのことで話題になりました。ここでいうところの文章生成言語モデルは、文章の作られ方をモデル化したもので、大量の例文をもとに構築されています。

例えばある言語モデルで

　「今日のランチは…」という言葉の次に、

　「今日のランチは」→「ラーメン」「にしよう」
　　　　　　　　　　→「何を」「作ろうかな？」
　　　　　　　　　　→「抜きだな」

といったさまざまなパターンがモデル化されており、これらを活用して巷によくある文章を生成することができるのです。実際、簡単なお題からGPT-3で生成した文章をAmazon Mechanical Turkで一般の人に確認してもらったところ、人間が書いたものではないとバレたのは52%とのことでした。これはコイントスでランダムに裏か表かを当てる割合に近いものです。

現在GPT-3はフェイクニュースなどでの悪用を避けるためAPIでのみの公開となっており、クローズドベータと呼ばれる一部のテスター、報道関係者のみに公開されている状態です。一般公開の予定、費用などは今のところ未定です。十数億円規模と試算されている、これだけの規模の事前学習を考えると、そう安くはないと考えられます。

以下に示すのがDALL-Eの活用例です。DALL-Eの紹介ページでは完全に自由な文章でサンプルを試すことはできませんが、いくつかのキーワードを変更して新しい画像生成を試すことが可能で、その結果には大変驚かされます。まるでGoogleで画像検索した結果のような、キーワードに合致した画像が並びます。それらが実は人工知能が生成した画像だとは信じられないかもしれません。

属性、質感の制御
複数のオブジェクトの描画
遠近感と立体感の可視化
内部構造と外部構造の可視化
文脈の詳細を類推する

「ブルーベリーのステンドグラス」で生成。実際、世の中にブルーベリーのステンドグラスはほとんどない

「OpenAIの看板を掲げた店舗」で生成。実際にOpenAIというお店は無いが、それっぽい画像が生成できている

ファッションやインテリアのための活用事例を探る

「黒革のジャケットに金のプリーツスカートを履いたフェミニンなファッション」で生成

無関係な組み合わせを試す（例：カタツムリ型のハープ（楽器）の画像）
動物のイラストを描く
追加の学習なしで、指定した画像を描く
地理的条件や知識を生かす（例：中国風の料理の画像）

過去や未来の知識を生かす（例：古い電話機の画像）

「◯◯年代の電話の写真」で生成。年代ごとにそれっぽい雰囲気の電話機が生成されている。実際の電話機では無い。

DALL-Eに追従する研究者たち

OpenAIのDALL-Eの発表に刺激を受け、世界中の人工知能研究者がDALL-Eの実装を類推したり、サンプル実装を試してみたりしています。このようなスピード感や情報共有の気概が昨今の人工知能研究の勢いにもつながっているように感じられます。

ソースコード：人工知能活用の定番フレームワークPytorchによるサンプル実装「DALL-E in Pytorch」

ソースコード：GPTの代わりにTensorFlowを活用したDALL-Eサンプル実装「EleutherAI/DALLE-mtf」

DALL-Eと双璧をなすCLIPとは？

左上：頭が欠けているがカンガルーだと判別、右上：犬の品種シベリアンハスキーの絵だと認識、左下：メインクーンという猫の品種を判別、右下：画像が荒いがヘビだと認識

OpenAIがDALL-Eと同時に発表したCLIP（Contrastive Language-Image Pre-training）は、画像に写っているものが何であるのかをカテゴリ名を与えることで、個別の学習なし事前学習のみで、ある程度類推可能にする手法です。CLIPはネット上にある4億の画像とそのキャプションを集めて事前学習したもので、今までに見たことがないものを類推することのできる、いわゆる「ゼロショット学習」に対応しています。

一般公開されているCLIPのソースコード：https://github.com/openai/CLIP
OpenAI公式のCLIPの解説：https://openai.com/blog/clip/

人工知能とクリエイティビティの現状

よくある議論ですが、DALL-Eがここまで自由気ままにクオリティの高い画像を生成することができるようになった今、デザイナーや画家や写真家の仕事はなくなってしまうのでしょうか？バリエーションを数多く素早く作るのであれば人工知能が有利かもしれません。けれどもどれが良いのかを最終的に判断するのは現在のところまだ人間です。

ただし今後GAN（敵対的ネットワーク）の考えと同じように、有識者の正しい選択を学習していけば、気分に左右されたり依怙贔屓（えこひいき）したりすることのない、ブレのない判断ができる人工知能活用の可能性も考えらせます。また、数多くあるバリエーションから良いものを判断する際にも、ある一人の天才デザイナーや天才プランナーの判断ではない、多くの人々による集合知の結果から導き出される判断も今後増えてくるかもしれません。

現在多くの話題を集めているGPT-3の成績が良いのは、世の中にすでに存在するデータ、つまり教科書すべてを暗記したからです。そこから考えると、ゼロから何か価値のあるものを生み出すのは苦手だということになります。従って、現在のDALL-Eに対する私たちの驚きは「成績が良い」ことに対する驚きであり、生み出された画像に感動を覚えたり、美しさや情緒を感じたりしているわけではありません。

ここで、画家サルバドール・ダリの言葉が思い出されます。

　”Those who do not want to imitate anything, produce nothing.”
　「何も真似ようとしない者は、何も生み出しはしない」

現在の人工知能研究が置かれている状況は、オリジナリティ云々、クリエイティビティ云々ではなく、まずは人間の真似をしながらスキルやセンスを磨いている、いわば研鑽や修行の段階なのだと見て取れるのです。OpenAIでは、DALL-EやCLIPの社会的影響を十分に考えており、ネット上のデータを活用したことによる情報の偏りや、意図しないバイアス、長期的な倫理的課題や著作権の課題などを十分に考えながら展開していくとのことです。

本連載の今後の予定：「CGへの扉」では、単なるAIの話題とは少し異なり、CG/VFX, アートの文脈から話題を切り取り紹介していきます。映像制作の現場におけるAI活用や、AIで価値が高まった先進的なツール、これからの可能性を感じさせるような話題、テクノロジーの話題にご期待ください。なにか取り上げて欲しいテーマやご希望などがございましたら、ぜひ編集部までお知らせください。

CGへの扉：

Vol.20：Adobeと人工知能の将来を見極める #AdobeMAX2020

Vol.19：コミュニケーションツールの新境地「NVIDIA MAXINE」

Vol.18：SIGGRAPH2020レポート映像制作の現場で活躍する人工知能

Vol.17：描画を進化させるTensorFlow Graphicsの真価

Vol.16：バーチャル開催SIGGRAPH論文を先取り

Vol.15：撮影に革新をもたらすAIによる照明

Vol.14：AIが生み出す顔と人間の表情

Vol.13：AIのクリエイティブとクリエイティビティ再考

Vol.12：AIのおかげで映像の拡大やノイズ除去が高品質に

Vol.11：動き、ダンスに新しい要素を加えるAIの役目

Vol.10：老齢とは無縁、De-Aging技術の台頭