モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。

TAG LIST: CG CGへの扉生成AI 吉本幸記安藤幸央月刊エンタメAIニュース河合律子 LLM OpenAI 大規模言語モデル機械学習ディープラーニング Google グーグル音楽 NVIDIA モリカトロン ChatGPT 森川幸人 GAN 三宅陽一郎 DeepMind 強化学習 Stable Diffusion 人工知能学会シナリオニューラルネットワーク QA マイクロソフト倫理自然言語処理 SIGGRAPH AIと倫理 GPT-3 スクウェア・エニックス大内孝子映画アート Facebook 音楽生成AI ルールベース著作権 3DCG 動画生成AI キャラクターAI NPC デバッグ敵対的生成ネットワークアニメーションロボットゲームプレイAI Minecraft モリカトロンAIラボインタビュープロシージャルディープフェイク NFT 画像生成 VFX ファッション StyleGAN DALL-E2 マルチモーダル Red Ram Gemini Adobe 遺伝的アルゴリズムメタAI 教育自動生成テストプレイ Midjourney VR 小説ボードゲームマンガ Meta Stability AI 画像生成AI GPT-4o インタビューゲームAI 不完全情報ゲーム深層学習 CEDEC2019 toio Microsoft マインクラフト CLIP テキスト画像生成 Playable!NeRF Sora ビヘイビア・ツリー広告 DALL-E CEDEC2021 バーチャルヒューマンデジタルツインメタバース ELSI 高橋力斗作曲アストロノーカロボティクスナビゲーションAI 畳み込みニューラルネットワーク AR アップル SIGGRAPH ASIA スポーツ手塚治虫汎用人工知能 3D CEDEC2020 AIアートはこだて未来大学エージェント GDC 2021 アドベンチャーゲームメタ市場分析デジタルヒューマン東京大学 JSAI2022 プロンプト GPT-4 CM GDC 2019 マルチエージェント HTN ソニー栗原聡 CNN マーケティング懐ゲーから辿るゲームAI技術史鴫原盛之 NVIDIA Omniverse CEDEC2022 ジェネレーティブAI DALL-E 3 言霊の迷宮人狼知能音声認識 Ubisoft 階層型タスクネットワーク YouTube JSAI2020 Microsoft Azure 模倣学習 Unity インディーゲーム音声合成 BERT Omniverse Roblox がんばれ森川君2号 Netflix GPT-3.5 AIQVE ONE 世界モデル GTC2023 JSAI2023 電気通信大学 Apple JSAI2024 ブロックチェーンイベントレポート対話型エージェントシーマン水野勇太ガイスター斎藤由多加 SF 研究シムシティシムピープル TEZUKA2020 スパーシャルAI Electronic Arts メタデータ TensorFlow キャリア Amazon DQN SIE アバター Genvid Technologies StyleGAN2 JSAI2021 Zork MCS-AI動的連携モデルモーションキャプチャー AGI 高橋ミレイ Cygames サイバーエージェント合成音声モリカトロン開発者インタビュー宮本茂則チャットボット AWS 徳井直生 GTC2022 Unreal Engine テキスト生成デザイントレーディングカードメディアアート text-to-image Adobe MAX Open AI ベリサーブ音声生成AI 松木晋祐 Bard ControlNet ブラック・ジャック村井源稲葉通将ユニバーサルミュージックマーダーミステリー CEDEC2023 LoRA XR Veo Runway GPT-5 Amadeus Code eSports お知らせワークショップクラウド AlphaZero AIりんなカメラ環世界中島秀之宮路洋一理化学研究所テンセント人事 DARPA ドローン人工生命 ASBS ぱいどん AI美空ひばり手塚眞 GDC Summer 岡島学 eスポーツスタンフォード大学テニス BLUE PROTOCOL aibo 銭起揚自動運転車 Transformer GPT-2 シミュレーション哲学現代アートバンダイナムコ研究所 ELYZA NVIDIA Riva Epic Games rinna SNS 松尾豊データマイニングゲームエンジン Imagen バイアスサム・アルトマン NEDO 森山和道自動翻訳アーケードゲームセガ類家利直大澤博隆 SFプロトタイピングコナミデジタルエンタテインメント text-to-3D DreamFusion AIロボ「迷キュー」に挑戦 Preferred Networks PaLM GitHub Copilot Gen-1 大阪大学建築イーロン・マスク Stable Diffusion XL Audio2Face Google I/O Firefly TikTok 立教大学 KLab LLaMA ハリウッドテキスト画像生成AI 法律論文 Niantic 新清士 Apple Vision Pro ByteDance CEDEC2024 Runway Gen-3 Alpha スーパーマリオブラザーズ Whisk SIGGRAPH Asia 2024 DeepSeek モリカトロンAIコネクト GDC 2025 モリカコミック Veo 3 JSAI2025 OpenAI o3 CEDEC2025 Sora 2 OpenAI Five ピクサービッグデータナラティブエージェントシミュレーション眞鍋和子齊藤陽介成沢理恵 Magic Leap One サルでもわかる人工知能リップシンキング Ubisoft La Forge 知識表現 IGDA どうぶつしょうぎジェイ・コウガミ音楽ストリーミングマシンラーニング 5G 対話エンジンシーマン人工知能研究所ゴブレット・ゴブラーズ完全情報ゲームウェイポイントパス検索藤澤仁画像認識 DeNA 長谷洋平ぎゅわんぶらあ自己中心派ウロチョロス NBA フェイクニュースウィル・ライトレベルデザイン GPU ALife オルタナティヴ・マシンサウンドスケープ TRPG AI Dungeon ゼビウス不気味の谷写真松井俊浩パックマン通しプレイ本間翔太馬淵浩希中嶋謙互 FPS レコメンドシステム軍事 PyTorch モンテカルロ木探索バンダイナムコスタジオ田中章愛サッカーバスケットボール VAE RNN ウォッチドッグスレギオン HALO MIT MuZero Rival Peak リトル・コンピュータ・ピープルコンピューティショナル・フォトグラフィー絵画坂本洋典釜屋憲彦生物学 StyleCLIP masumi toyota TextWorld Bing Magenta GTC2021 CycleGAN NetHack AIボイスアクター南カリフォルニア大学 NVIDIA Canvas NetEase ナビゲーションメッシュ深層強化学習 ELYZA DIGEST ELIZA LEFT 4 DEAD プラチナエッグイーサリアムボエダ・ゴティエ Omniverse Replicator NVIDIA DRIVE Sim NVIDIA Isaac Sim Disney AI会話ジェネレーターグランツーリスモ・ソフィー VTuber フォートナイト Qosmo ポケモン Codex Soul Machines バーチャルキャラクター対談 GTC 2022 Siemens クラウドコンピューティング OpenSea GDC 2022 Earth-2 エコロジー ELYZA Pencil 医療キャラクターモーション RPG SIGGRAPH 2022 LaMDA マジック：ザ・ギャザリング介護 Romi 松原仁武田英明フルコトデータ分析 MILE WCCF WORLD CLUB Champion Football 柏田知大田邊雅彦トレカ Max Cooper 京都芸術大学ラベル付け秋期GTC2022 野々下裕子 pixiv セキュリティ 3Dスキャン Microsoft Designer イラスト柿沼太一 Scenario AIピカソ AI素材.com Andreessen Horowitz QA Tech Night 下田純也桑野範久 note DreamerV3 Blender ゲーム背景 Point-E アパレル BIM GPT Photoshop ChatGPT4 コミコパ Tencent TEZUKA2023 大阪公立大学オムロンサイニックエックス FastGAN 橋本敦史宮本道人 LLaMA 2 Hugging Face xAI ストライキ Voyager IBM ソフトバンク SIGGRAPH2023 音源分離 Web3 BitSummit ファインチューニンググランツーリスモ量子コンピュータ北野宏明立福寛 FSM-DNN MindAgent 効果音 NVIDIA ACE 慶應義塾大学ヒストリア AI Frog Interactive ComfyUI Suno AI KaKa Creation VOICEVOX GPTs 3D Gaussian Splatting GDC 2024 ポケットモンスターインフルエンサー SIMA Gemma 2 Inworld AI IEEE 早稲田大学 Apple Intelligence WWDC WWDC 2024 Perplexity くまうた濱田直希ソニー・インタラクティブエンタテインメント遊戯王佐竹空良九州大学伊藤黎 Sakana AI LINEヤフー DOOM GameNGen 社員インタビュー Movie Gen SynthID Playable!Mobile Sneaks Peridot 声優早瀬悠真 Veo 2 機械翻訳 SONY Project Sid Razer GDC Cube 3D ベンチマーク Hao AI Lab Claude Anthropic ジョージア工科大学 Meshy Flow Gemini 2.5-pro Gemini 2.5 Flash Image Keep4o Nano Banana EXPO2025 大阪・関西万博アトラクチャー中村政義森旭彦 Veo 3.1 はらぺこミーム SIGGRAPH Asia 2025 ゲーム映像パラメータ設計バランス調整 Dota 2 ソーシャルゲーム淡路滋グリムノーツゴティエ・ボエダ Gautier Boeda Julius TPRG バーチャル・ヒューマン・エージェントクーガー石井敦茂谷保伯マジック・リープノンファンジブルトークン里井大輝 GEMS COMPANY 初音ミク転移学習デバッギング北尾まどか将棋ナップサック問題 Spotify Replica Studio amuse クラウドゲーミング和田洋一 Stadia SIGGRAPH 2019 iPhone AIGraph 予期知能ドラゴンクエスト PAIR アルスエレクトロニカ2019 逆転オセロニア奥村エルネスト純齋藤精一高橋智隆ロボユニ泉幸典ロボコレ2019 意思決定モデル LEFT ALIVE 長谷川誠 Baby X ロバート・ダウニー・Jr.The Age of A.I.レコメンデーション MOBA 研修 mynet.ai 人工音声プレイ動画群知能 Spore デノイズ画像処理 CPU GMAI ウィザードリィ西川善司サムライスピリッツストリートファイター山野辺一記大里飛鳥 13フェイズ構造 Oculus Quest 生体情報照明山崎陽斗立木創太 GameGAN ソサエティ5.0 SIGGRAPH 2020 DIB-R Apex Legends Ninja TENTUPLAY MARVEL Future Fight タイムラプスバスキア階層型強化学習 WANN 竹内将セリア・ホデント UX 認知科学ゲームデザイン LUMINOUS ENGINE Luminous Productions パターン・ランゲージちょまどマルコフ決定過程協調フィルタリング AlphaDogfight Trials StarCraft II Future of Life Institute Intel LAIKA Rotomation ドラゴンクエストライバルズ不確定ゲーム Embedding GTC2020 NVIDIA MAXINE ビデオ会議階層的クラスタリング toio SDK for Unity GDMC MITメディアラボ Magenda DDSP Kaggle Assassin’s Creed Origins Sea of Thieves monoAI technology Oculus テスト Baldur's Gate 3 Candy Crush Saga SIGGRAPH ASIA 2020 BigGAN MaterialGAN ReBeL Volvo Rival Prak ユービーアイソフトメタルギアソリッドV FSM 汎用言語モデル Chitrakar 巡回セールスマン問題ジョルダン曲線リアリティ番組ジョンソン裕子 MILEs インタラクティブ・ストリーミングインタラクティブ・メディア Ludo ArtEmis GROVER FAIR チート検出オンラインカジノ RealFlow Deep Fluids MeInGame ブレイン・コンピュータ・インタフェース BCI Learning from Video ユクスキュルカントエージェントアーキテクチャ OCTOPATH TRAVELER 西木康智 OCTOPATH TRAVELER 大陸の覇者 StyleRig いただきストリート大森田不可止ザナック仁井谷正充 Azure Machine Learning 脱出ゲーム Hybrid Reward Architecture Super Phoenix Project Malmo Project Paidia Project Lookout Watch For ジミ・ヘンドリックスカート・コバーンエイミー・ワインハウスダフト・パンク Glenn Marshall Story2Hallucination Jukebox SIFT DCGAN DANNCE ハーバード大学デューク大学ローグライクゲーム NeurIPS 2021 ヒップホップ詩サイレント映画環境音粒子群最適化法進化差分法下川大樹高津芳希大石真史 BEiT DETR Sentropy Discord CALM プログラミングソースコード生成シチズンデベロッパー GitHub MCN-AI連携モデル並木幸介森寅嘉 SIGGRAPH 2021 半導体 Topaz Video Enhance AI DLSS Dynamixyz U-Net ADV XLand DEATH STRANDING Eric Johnson コジマプロダクションデシマエンジン Maxim Peter Joshua Romoff ハイパースケープミライ小町テスラ Tesla Bot Tesla AI Day バズグラフニュースタンテキ東芝倉田宜典韻律射影韻律転移コンピュータRPG アップルタウン物語 KELDIC メロディ言語 Astro Ego4D 日経イノベーション・ラボ敵対的強化学習 GOSU Data Lab GOSU Voice Assistant SenpAI.GG Mobalytics AWS Sagemaker 形態素解析 AWS Lambda 誤字検出 SentencePiece 竹村也哉 GOAP Adobe MAX 2021 Omniverse Avatar NVIDIA Megatron NVIDIA Merlin NVIDIA Metropolis テキサス大学 AI Messenger Voicebot OpenAI Codex HyperStyle Rendering with Style Disneyリサーチ GauGAN GauGAN2 画像言語表現モデル SIGGRAPH ASIA 2021 ディズニーリサーチ Mitsuba2 ワイツマン科学研究所 CG衣装 VRファッション Artflow Eponym 音声クローニング Gopher 鑑定 Oxia Palus Art Recognition NHC 2021 池田利夫新刊案内マーベル・シネマティック・ユニバース MCU アベンジャーズ Digital Domain Masquerade2.0 フェイシャルキャプチャー山田暉 LSTM モリカトロンAIソリューションコード生成AI AlphaCode Codeforces 自己増強型AI COLMAP ADOP GANverse3D グランツーリスモSPORT GTソフィー FIAグランツーリスモチャンピオンシップ DGX A100 Webcam VTuber 星新一賞 Live Nation Web3.0 AIOps スマートコントラクトメディア政治 NightCafe Luis Ruiz 東京工業大学博報堂ラップ Z世代 AIラッパーシステムプラスリンクス～キミと繋がる想い～STC Style Transfer Conversation RCP Rinna Character Platform Amelia Gatebox ANIMAK 逢妻ヒカリセコムバーチャル警備システム損保ジャパン上原利之アッパーグラウンド品質保証 Autodesk Bentley Systems ワールドシミュレーター H100 COBOL DGX H100 DGX SuperPOD Instant NeRF artonomous bitGANs コミュニティ管理オンラインゲーム気候変動マックス・プランク気象研究所ビョルン・スティーブンス気象モデル気象シミュレーション環境問題 SDGs メモリスタ音声変換 Veap Japan EAP 福井千春メンタルケア Edgar Handy 東京理科大学産業技術総合研究所リザバーコンピューティングソニーマーケティングもじぱ暗号通貨 FUZZLE Alteration オープンワールド AIFA P2E StyleGAN-NADA Unity for Industry GLIDE AvatarCLIP Synthetic Data Sonantic Cohere Urzas.ai Kiki Zoetic AI ペット Digital Dream Labs Cozmo タカラトミー LOVOT MOFLIN ミクシィユニロボットユニボ Gato 汎用強化学習AI ロンドン芸術大学 Google Brain Sound Control SYNTH SUPER Karl Sims Artnome ICONATE 浜中雅俊福井健策 Wikipedia Sphere Xaver 1000 養蜂 Beewise フィンテック投資 MILIZE 三菱UFJ信託銀行西成活裕群衆マネジメントライブビジネス新型コロナ周済涛清田陽司サイバネティックス人工知能史 AI哲学マップ星新一 StyleGAN-XL StyleGAN3 GANimator VoLux-GAN Projected GAN Self-Distilled StyleGAN ニューラルレンダリング PLATO frame.io Foodly 中川友紀子アールティ BlenderBot 3 Meta AI マーク・ザッカーバーグ WACUL AIライティング AIのべりすと QuillBot Copysmith Jasper ヴィトゲンシュタイン論理哲学論考 PromptBase バンダイナムコネクサスユーザーレビュー mimic Baidu ERNIE-ViLG 古文書凸版印刷 AI-OCR 画像判定実況パワフルサッカー桃太郎電鉄桃鉄パワサカ岩倉宏介 PPO Machine Learning Project Canvas 国立情報学研究所石川冬樹スパコンスーパーコンピュータ松岡聡 TSUBAME 1.0 TSUBAME 2.0 ABCI 富岳 Society 5.0 夏の電脳甲子園座談会 NVIDIA GET3D AI絵師 UGC PGC NovelAI NovelAI Diffusion モーションデータポーズ推定メッシュ生成メルセデス・ベンツ Magic Leap Epyllion マシュー・ボールムーアの法則 Adobe MAX 2022 Adobe Research Galactica 映像解析東芝デジタルソリューションズ SATLYS 映像解析AI PFN 3D Scan PFN 4D Scan DreamUp DeviantArt Waifu Diffusion 元素法典 Novel AI CALA アフォーダンス PaLM-SayCan Code as Policies CaP コリジョンチェック山口情報芸術センター［YCAM］YCAM アンラーニング・ランゲージカイル・マクドナルドローレン・リー・マッカーシー鎖国［Walled Garden］プロジェクト SIGGRAPH ASIA 2022 VToonify ControlVAE 変分オートエンコーダーフォトグラメトリ回帰型ニューラルネットワーク DeepJoin Azure OpenAI Service DeepL DeepL Write シンギュラリティレイ・カーツワイルヴァーナー・ヴィンジ Runway Research Make-A-Video Phenaki Dreamix Text-to-Imageモデル Latitude neoAI DreamIcon mign studiffuse 対話型AIモデル note AIアシスタント Ketchup AI News Art Selfie Art Transfer Pet Portraits Blob Opera クリムトクリティックネットワークアクターネットワーク DMLab Control Suite Atari 100k Atari 200M Yann LeCun 鈴木雅大コンセプトアート Colie Wertz リドリー・スコット絵コンテストーリーボード PaLM API MakerSuite Skeb Dreambooth-Stable-Diffusion Google Earth GEPPETTO AI Stable Diffusion web UI AI model AI Models ZMO.AI MOBBY’S モビーディックダイビングアウトドア AIスキャニング自動採寸 3DLOOK Sizer ワコールスニーカー UNSTREET Newelse CheckGoods 二次流通中古市場 Dupe Killer 偽ブランド配信ソニー・ピクチャーズアニメーション Fosters+Partners Zaha Hadid Architects ライブポートレイト Wonder Studio 土木インフラ Amazon Bedrock X.AI X Corp.Twitter Xホールディングス Magi SDXL RTFKT NIKE Clone X 村上隆 Digital Mark Snapchat クリエイターコミュニティバーチャルペット NVIDIA NeMo Service ヴァネッサ・ローザ Vanessa A Rosa 陶芸 Play.ht 音声AI LiDAR Polycam deforum ハーベスト ForGames ゲームマーケット岡野翔太郡山喜彦ジェフリー・ヒントン Google I/O 2023 武蔵野美術大学 BingAI Lightroom Canva BOOTH pixivFANBOX 虎の穴 Fantia とらのあな集英社少年ジャンプ＋ComicCopilot ゲームマスター Inowrld AI MOD Ghostwriter Skyrim スカイリム RPGツクールMZ ChatGPT_APIMZ ダンジョンズ&ドラゴンズ Oracle RPG 深津貴之 xVASynth Laser-NV MERF Alibaba VQRF nvdiffrec NeRFMeshing LERF マスタリングリアム・ギャラガーグライムス Boomy ジョン・レジェンドザ・ウィークエンドドレイクエッジワークス日本音楽作家団体協議会 FCA Voicebox さくらインターネットぷよぷよ TCG QRコード囲碁デンソーデンソーウェーブ原昌宏日本機械学会ロボティクス・メカトロニクス講演会トヨタ自動車かんばん方式プロット生成 4コママンガ ElevenLabs HeyGen After Effects 絵本出版 Ammaar Reshi Stories StoryBird Versed ProlificDreamer Unity Sentis Unity Muse Caleb Ward 宮田龍清河幸子西中美和安野貴博斧田小夜 CM3leon Stable Doodle T2I-Adapter 日本マネジメント総合研究所 Lily Hughes-Robinson Colossal Cave Adventure AdventureGPT リリー・ヒューズ＝ロビンソン BabyAGI GPT-3.5 Turbo カーリングウィンブルドン戦術分析パフォーマンス測定 IoT ProFitX Watsonx Athletica コーチング北見工業大学北見カーリングホール画像解析じりつくん NTT Sportict AIカメラ STADIUM TUBE Pixelllot S3 AIスマートコーチ Dreambooth ヤン・ルカン Perfusion ニューラル物理学毛髪荒牧英治中ザワヒデキ大屋雄裕中川裕志 Adreeseen Horowitz NVIDIA Avatar Cloud Engine Replica Studios Smart NPCs Roblox Studio Promethean AI Musiio Endel Sonar Sonar+D Dolby Atmos Sonar Music Festival ライゾマティクス真鍋大度花井裕也 Ritchie Hawtin Erica Synth Ufuk Barış Mutlu Japanese InstructBLIP Alpha 日本新聞協会 AIいらすとや AI Picasso Emposy AIタレント AIタレントエージェンシー modi.ai BitSummit Let’s Go!!デジタルレプリカ GOT7 synthesia HumanRF Actors-HQ SAG-AFTRA WGA チャーリー・ブルッカー岡野原大輔自己教師あり学習 In-Context Learning（ICL）qubit IBM Quantum System 2 ダリオ・ヒルジェン・スン・フアン HuggingFace Stable Audio 宗教仏教コカ・コーラ食品 Coca‑Cola Y3000 Zero Sugar Copilot Copyright Commitment テラバース京都大学音声解析感情分析周済涛ステートマシンディープニューラルネットワークハイブリッドアーキテクチャ Adobe Max 2023 Bing Chat Bing Image Creator Assistant with Bard The Arcade Search Generative Experience Dynalang VLE-CE AI Act EU Ars Electronica AI規制欧州委員会欧州議会欧州理事会 MusicLM AudioLM MusicCaps AudioCraft Mubert Mubert Render Gen-2 Runway AI Film Festival PreViz Character-LLM 復旦大学 Chat-Haruhi-Suzumiya 涼宮ハルヒ Emu Video ペリドット Dream Track Music AI Tools Lyria Yahoo!知恵袋インタラクティブプロンプトAI 石渡正人手塚プロダクション林海象古川善規大規模再構成モデル LRM Objaverse MVImgNet One-2-3-45 3Dガウシアンスプラッティングワンショット3D生成技術 FGDC Future Game Development Conference 佐々木瞬 Anique 中村太一エグゼリオ Copilot serial experiments lain AI lain PCG PCGRL Dungeons&Dragons ビートルズザ・ビートルズ: Get Back Demucs 音楽編集ソフト Adobe Audition iZotope RX10 Moises レベルファイブ Genie AI SIGGRAPH Asia 2023 C·ASE FLARE ダンス MagicAnimate Animate Anyone インテリジェントコンピュータ研究所アリババ DreaMoving VISCUIT Scratch スクラッチビスケットプログラミング教育 VALL-E Deepdub.ai AUDIOGEN Evoke Music AutoFoley Colourlab.Ai ディズニー Largo.ai Cinelytic Taskade Pika.art AI Filmmaking Assistant AI Screenwriter 芥川賞文学恋愛タップル Abema TV NEC 木村屋 GPT Store 生成AIチェッカーユーザーローカル九段理江東京都同情塔 4Dオブジェクト生成モデル Align Your Gaussians AYG MAV3D ファーウェイ 4D Gaussian Splatting 4D-GS Glaze WebGlaze NightShade Spawning Have I Been Trained?Fortnite Unreal Editor For Fortnite Volumetrics AIワールドジェネレーター Rosebud AI Gamemaker Layer Charisma.ai 調査 Meta Quest IP 強いAI 弱いAI Lumiere UNet ImageFX MusicFX TextFX Keyframer Gemini 1.5 AI Studio Vertex AI Chat with RTX Slack Slack AI Pokémon Battle Scope kanaeru 占い行動ロジック生成AI Convai NTTドコモ Ememe Genie 汎用AIエージェント AIファッションウィーク Grok-1 Mixture-of-Experts MoE Claude 3 Claude 3 Haiku Claude 3 Sonnet Claude 3 Opus 森永乳業 C2PA ゲーミフィケーション Tomo Kihara Playfool 遊び tsukurun 地方創生吉田直樹素材 OpenAI Japan Voice Engine Command R+Oracle Cloud Infrastructure Google Workspace Udio 立命館大学京都精華大学 TacticAI NPMP FOOH Project Astra Google I/O 2024 感情認識音声加工マルタ大学田中達大 Move AI ICRA2024 大規模基盤モデル Torobo 東京ロボティクスインピーダンス制御深層予測学習日立製作所尾形哲也 AIREC 汎用ロボットオムロンサイニックエックス ViLaIn PDDL ニューサウスウェールズ大学 Claude Sammut オックスフォード大学 Lars Kunze 杉浦孔明田向権 VASA-1 VoxCeleb2 AniTalker 上海大学 Luma Dream Machine NTT AI野々村真 GPT-4-turbo 佐藤恵助大道麻由物語構造分析慶応義塾大学渡邉謙吾ここ掘れ！プッカ大柳裕⼠加納基晴研究開発事例赤羽進亮 UDI（Universal Duel Interface）第一工科大学小林篤史荻野宏実ビヘイビアブランチ WPP General Computer Control（GCC）Cradle Spiral.AI ItakoLLM-7b 静岡大学明治大学北原鉄朗中村栄太日本大学ヤマハ前澤陽増田聡採用科学史 AIサイエンティスト Terra AI Overview 電通 AICO2 BitSummit Drift Omega Crafter SPACE INVADIANS 西島大介吉田伸一郎 SIGGRAPH2024 Motion-I2V Toonify3D 生成対向ネットワーク拡散モデル Diffusion うめ小沢高広ドリコム ai and SaaS インサイトカスタマーサポート ComfyUI-AdvancedLivePortrait GUI Video to Video iPhone 16 OpenAI o1 AIスマートリンクシャープウェアラブル CE-LLM Communication Edge-LLM AIペット Yahoo!ニュース AI Comic Factory AI comic Generator ComicsMaker.ai LlamaGen.ai GAZAI Flame Planner 動画ゲーム生成モデル Virtuals Protocol MarioVGG 松原卓二 Art Transfer 2 Art Selfie 2 Musical Canvas The Forever Labyrinth Refik Anadol Alexander Reben Rhizomatiks Molmo PixMo Qwen2 72B Depth Pro VARIETAS AI面接官キリンホールディングス空間コンピューティング Dream Screen Firefly Video Model Stable Video 4D AI受託開発事例田中志弥 Playable!3D Adobe MAX 2024 Illustrator Meta Quest 3 XR-Objects Orion 防犯 O2 Scam Detection Live Threat Detection 乗換NAVITIME Kaedim 3DFY.ai Luma AI Avaturn Bestat Oasis Decart Dejaboom!Unbounded Etched パブリシティ権日本俳優連合日本芸能マネージメント事業者協会日本声優事業社協議会 IAPP Tripo 2.0 Meta 3D Gen スマートシティ都市計画松本雄太 Genie 2 World Labs Cybever Third Dimension AI 東北大学 Gemini 2.0 フロンティアワークス Simplified AI Voice over Generator AI Audio Enhancer エーアイ AITalk コエステーション PlayStation VRML Techno Magic ゴーストバスターズスパイダーマンポリフォニー・デジタル荒牧伸志 Altera Robert Yang Project AVA Streamlabs Intelligent Streaming Assistant Project DIGITS スーパーコンピューターエージェンテック AI Shorts テルアビブ大学 DiffUHaul TrailBlazer ヴィクトリア大学ウェリントン zeroscope QNeRF カーネギーメロン大学 RALF グラフィックメイク Canvas Projects DeepSeek-R1 Loopy リップシンク CyberHost OmniHuman-1 CSAM Imagen 3 Google Labs Microsoft Muse ゲーム生成モデル WHAMデモンストレーター ChatGPT Edu 滋賀大学キリンビール桜AIカメラ Solist-AI ローム Factorio カリフォルニア大学 GamingAgent Claude 3.7 Sonnet Factorio Learning Environment FLE Deepseek-v3 Gemini-2-Flash Llama-3.3-70B GPT-4o-Mini ZOZO NEXT ZOZO Fashion Intelligence System Partial Visual-Semantic Embedding WEAR GPT-4V ソイル大学 AIパズルジェネレーター DolphinGemma Wild Dolphin Project SoundStreamトークナイザー音声処理技術 GPT-4.1 GPT-4.1 mini GPT-4.1 nano LINE AI LINE AIトークサジェスト GTC2025 Fuxi Lab Naraka:Bladepoint Mobile バトルロイヤルビヘイビアツリー SoftServe ALNAIR AMRI BLADE GAGA QUEEN Runway Gen-4 SkyReels Stable Virtual Camera Intangible ブライアン・イーノ Eno Brain One AlphaEvolve Continuous Thought Machine（CTM）Arm Stable Audio Open Small Word2World STORY2GAME ウィットウォーターランド大学森川の頭の中花森リド Google I/O 2025 Lyra 2 MusicFX DJ Animon.ai ツインズひなひま Maya Deep Q-Learning AlphaGO スペースインベーダープリンス・オブ・ペルシャドラゴンクエストIV 堀井雄二山名学タイトーカプコン Ubi Anvilエンジン V1 Video Model Artificial Analysis Video Arena Video Model Leaderboard Claude 3.5 Mistral 樋口恭介 Claude 4 小川昴ホラーゲーム Stable Diffusion 1.5 階層型物語構造夏目漱石漱石書簡京都情報大学院大学上野未貴ブラウザ Comet Kiro Aww Inc.Visual Bank THE PEN FUJIYAMA AI SOUND 富士通西浦めめヘッドウォータース下斗米貴之ディプロマシー Cluade Opus 4 ChatGPT o3 カリフォルニア大学サンディエゴ校 Every テトリス逆転裁判ロゼッタ広報 Mavericks NoLang 4.0 gpt-oss 金井大組織作り Cygnus Taurus 笠原達也バグチケット都築圭太仁木一順ライフレビュー SIGGRAPH 2025 Text-to-Motion Miegakure Side International Razer Cortex: Playtest Program - Powered by Side Stable Audio 2.5 Veo 3 Fast Genie 3 Dynamics Lab Magica 2 Mirage 2 ペンシルバニア大学コーネル大学 HOLODECK 2.0 市場調査 Googleクラウドゲームエイト Q-STAR 小栗伸重藤井啓祐水野弘之 AnimeGamer 香港城市大学ニューヨーク大学 God's Innovation Project GIP マインドスポーツチェス Grok 4 華南理工大学池上⾼志ミュージックビデオ TOWA TEI 椎名林檎中村剛森山尋西健一スキップ E-ONE PICTOY 任天堂ギフトピアちびロボ！いきものづくりクリエイトーイ大盛り！いきものづくりクリエイトーイドラゴンリーグドラゴンポーカー城とドラゴン koROBO コンパニオンAI character.ai Nomi.ai META LOOP DESIGN LTD.MEO HiClub SynClub Starley Cotomo Livetoon kaiwa コンパニオンロボットヒューマノイド Realbotix 顔認識 Cluade 1X NEO ジュネーブ大学 Nadine MIXI Panasonic NICOBO Gemini Robotics 1.5 XR Blocks LLMER ペンシルバニア州立大学 SIMA 2 日本IBM シリアスゲームセガXD AI俳優世永玲生 Adobe MAX 2025 Gemini 3 GenTabs Disco イレブンラボジャパン日本郵便年賀状 #Geminiで年賀状 Nano Banana Pro ENCODE Jewelry Planner (AI)EncodeRing Jewelry Designer Story Jewelry Designer AI JEWELRY MODEL 中国・西安交通大学 LacAIDes 工芸宝飾品ソウル文化高等学校 MineDojo Text-to-Video OmnimatteZero Snap X-UniMotion DreamO 人工知能のための哲学塾犬飼博士瀬尾浩二郎 Steam Larian Studios Divinity Clair Obscur: Expedition 33 Indie Game Award Playtika Krafton TranslateGemma ChatGPT ヘルスケアマインスイーパーバイブコーディング GPT-5.1-Codex-Max Claude Opus 4.5 Gemini 3 Pro Game Arena ポーカー Gemini 3 Pro Preview GPT-5.2 polarix So Long Sucker TextQuests

CGへの扉 Vol.22：言葉から画像を生成、DALL-Eはクリエイティブなのか？

2021.1.14アート

OpenAIから、言葉から画像を生成するDALL-Eが登場

汎用人工知能の実現を目指して研究を進める団体OpenAIが、2021年1月5日に文章から画像を生成するDALL-Eと、言葉と画像を関係づけるCLIPを発表しました（もともとOpenAIは、非営利団体でしたが、2019年3月より利益に上限のある営利団体に変わっています）。

DALL-E：https://openai.com/blog/dall-e/
CLIP：https://openai.com/blog/clip/

OpenAIは、TESLAやSpaceXの創業者として知られるイーロン・マスク氏やMicrosoftが支援している汎用人工知能の研究機関で、OpenAIのチーフサイエンティストを務めるIlya Sutskever氏が、今回の研究を牽引しています。DALL-Eはテレビのクイズ番組や、伝言ゲーム等でよくある、言葉だけで説明した図柄を正確に画像で表現するというものです。

Webページや雑誌に画像や写真が掲載されている場合、その画像についての適切で短い文章の説明として「キャプション」が書かれていることがあります。一般的にキャプションはその原稿の執筆者や編集者が考えて書いていますが、DALL-Eでは逆に、いわゆるそのキャプションの文章から、適切な画像を生成するという汎用言語モデルです。

DALL-Eの名前は、シュルレアリスムと呼ばれるシュールで独特の雰囲気をもった絵画で知られるサルバドール・ダリの名前と、PIXARの長編アニメ映画に登場するゴミ集めロボットWALL-Eに由来しています。DALL-Eは大量のテキスト情報と画像情報の組み合わせ例を学習し、120億個のパラメータを持ったGPT-3の活用事例でもあります。

DALL-Eのベースとなっているのは、同じくOpenAIが開発している高精度なAI文章生成ツールGPT-3（Generative Pre-Training3）とVQ-VAE-2（Vector Quantised-Variational AutoEncoder：ベクトル量子化-変分オートエンコーダ）と呼ばれるノイズからシグナルを分離する仕組みです。

GPT-3は、1,750億のパラメータを備えた自然言語の文章生成言語モデルであり、文章の生成だけでなく、プログラムも生成できるとのことで話題になりました。ここでいうところの文章生成言語モデルは、文章の作られ方をモデル化したもので、大量の例文をもとに構築されています。

例えばある言語モデルで

　「今日のランチは…」という言葉の次に、

　「今日のランチは」→「ラーメン」「にしよう」
　　　　　　　　　　→「何を」「作ろうかな？」
　　　　　　　　　　→「抜きだな」

といったさまざまなパターンがモデル化されており、これらを活用して巷によくある文章を生成することができるのです。実際、簡単なお題からGPT-3で生成した文章をAmazon Mechanical Turkで一般の人に確認してもらったところ、人間が書いたものではないとバレたのは52%とのことでした。これはコイントスでランダムに裏か表かを当てる割合に近いものです。

現在GPT-3はフェイクニュースなどでの悪用を避けるためAPIでのみの公開となっており、クローズドベータと呼ばれる一部のテスター、報道関係者のみに公開されている状態です。一般公開の予定、費用などは今のところ未定です。十数億円規模と試算されている、これだけの規模の事前学習を考えると、そう安くはないと考えられます。

以下に示すのがDALL-Eの活用例です。DALL-Eの紹介ページでは完全に自由な文章でサンプルを試すことはできませんが、いくつかのキーワードを変更して新しい画像生成を試すことが可能で、その結果には大変驚かされます。まるでGoogleで画像検索した結果のような、キーワードに合致した画像が並びます。それらが実は人工知能が生成した画像だとは信じられないかもしれません。

属性、質感の制御
複数のオブジェクトの描画
遠近感と立体感の可視化
内部構造と外部構造の可視化
文脈の詳細を類推する

「ブルーベリーのステンドグラス」で生成。実際、世の中にブルーベリーのステンドグラスはほとんどない

「OpenAIの看板を掲げた店舗」で生成。実際にOpenAIというお店は無いが、それっぽい画像が生成できている

ファッションやインテリアのための活用事例を探る

「黒革のジャケットに金のプリーツスカートを履いたフェミニンなファッション」で生成

無関係な組み合わせを試す（例：カタツムリ型のハープ（楽器）の画像）
動物のイラストを描く
追加の学習なしで、指定した画像を描く
地理的条件や知識を生かす（例：中国風の料理の画像）

過去や未来の知識を生かす（例：古い電話機の画像）

「◯◯年代の電話の写真」で生成。年代ごとにそれっぽい雰囲気の電話機が生成されている。実際の電話機では無い。

DALL-Eに追従する研究者たち

OpenAIのDALL-Eの発表に刺激を受け、世界中の人工知能研究者がDALL-Eの実装を類推したり、サンプル実装を試してみたりしています。このようなスピード感や情報共有の気概が昨今の人工知能研究の勢いにもつながっているように感じられます。

ソースコード：人工知能活用の定番フレームワークPytorchによるサンプル実装「DALL-E in Pytorch」

ソースコード：GPTの代わりにTensorFlowを活用したDALL-Eサンプル実装「EleutherAI/DALLE-mtf」

DALL-Eと双璧をなすCLIPとは？

左上：頭が欠けているがカンガルーだと判別、右上：犬の品種シベリアンハスキーの絵だと認識、左下：メインクーンという猫の品種を判別、右下：画像が荒いがヘビだと認識

OpenAIがDALL-Eと同時に発表したCLIP（Contrastive Language-Image Pre-training）は、画像に写っているものが何であるのかをカテゴリ名を与えることで、個別の学習なし事前学習のみで、ある程度類推可能にする手法です。CLIPはネット上にある4億の画像とそのキャプションを集めて事前学習したもので、今までに見たことがないものを類推することのできる、いわゆる「ゼロショット学習」に対応しています。

一般公開されているCLIPのソースコード：https://github.com/openai/CLIP
OpenAI公式のCLIPの解説：https://openai.com/blog/clip/

人工知能とクリエイティビティの現状

よくある議論ですが、DALL-Eがここまで自由気ままにクオリティの高い画像を生成することができるようになった今、デザイナーや画家や写真家の仕事はなくなってしまうのでしょうか？バリエーションを数多く素早く作るのであれば人工知能が有利かもしれません。けれどもどれが良いのかを最終的に判断するのは現在のところまだ人間です。

ただし今後GAN（敵対的ネットワーク）の考えと同じように、有識者の正しい選択を学習していけば、気分に左右されたり依怙贔屓（えこひいき）したりすることのない、ブレのない判断ができる人工知能活用の可能性も考えらせます。また、数多くあるバリエーションから良いものを判断する際にも、ある一人の天才デザイナーや天才プランナーの判断ではない、多くの人々による集合知の結果から導き出される判断も今後増えてくるかもしれません。

現在多くの話題を集めているGPT-3の成績が良いのは、世の中にすでに存在するデータ、つまり教科書すべてを暗記したからです。そこから考えると、ゼロから何か価値のあるものを生み出すのは苦手だということになります。従って、現在のDALL-Eに対する私たちの驚きは「成績が良い」ことに対する驚きであり、生み出された画像に感動を覚えたり、美しさや情緒を感じたりしているわけではありません。

ここで、画家サルバドール・ダリの言葉が思い出されます。

　”Those who do not want to imitate anything, produce nothing.”
　「何も真似ようとしない者は、何も生み出しはしない」

現在の人工知能研究が置かれている状況は、オリジナリティ云々、クリエイティビティ云々ではなく、まずは人間の真似をしながらスキルやセンスを磨いている、いわば研鑽や修行の段階なのだと見て取れるのです。OpenAIでは、DALL-EやCLIPの社会的影響を十分に考えており、ネット上のデータを活用したことによる情報の偏りや、意図しないバイアス、長期的な倫理的課題や著作権の課題などを十分に考えながら展開していくとのことです。

本連載の今後の予定：「CGへの扉」では、単なるAIの話題とは少し異なり、CG/VFX, アートの文脈から話題を切り取り紹介していきます。映像制作の現場におけるAI活用や、AIで価値が高まった先進的なツール、これからの可能性を感じさせるような話題、テクノロジーの話題にご期待ください。なにか取り上げて欲しいテーマやご希望などがございましたら、ぜひ編集部までお知らせください。

CGへの扉：

Vol.20：Adobeと人工知能の将来を見極める #AdobeMAX2020

Vol.19：コミュニケーションツールの新境地「NVIDIA MAXINE」

Vol.18：SIGGRAPH2020レポート映像制作の現場で活躍する人工知能

Vol.17：描画を進化させるTensorFlow Graphicsの真価

Vol.16：バーチャル開催SIGGRAPH論文を先取り

Vol.15：撮影に革新をもたらすAIによる照明

Vol.14：AIが生み出す顔と人間の表情

Vol.13：AIのクリエイティブとクリエイティビティ再考

Vol.12：AIのおかげで映像の拡大やノイズ除去が高品質に

Vol.11：動き、ダンスに新しい要素を加えるAIの役目

Vol.10：老齢とは無縁、De-Aging技術の台頭