モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。

TAG LIST: CG CGへの扉生成AI 安藤幸央吉本幸記月刊エンタメAIニュース河合律子 LLM 機械学習 OpenAI 大規模言語モデルディープラーニング Google グーグル音楽モリカトロン森川幸人 NVIDIA ChatGPT GAN 三宅陽一郎 DeepMind 強化学習 Stable Diffusion 人工知能学会ニューラルネットワークシナリオ QA マイクロソフト自然言語処理 AIと倫理 GPT-3 スクウェア・エニックス倫理映画 SIGGRAPH Facebook 大内孝子音楽生成AI ルールベースアート著作権 3DCG 動画生成AI キャラクターAI NPC デバッグ敵対的生成ネットワークアニメーションロボットゲームプレイAI Minecraft モリカトロンAIラボインタビューディープフェイク NFT 画像生成 VFX ファッション StyleGAN プロシージャル DALL-E2 マルチモーダル Adobe 遺伝的アルゴリズム自動生成テストプレイ Midjourney Red Ram Gemini VR メタAI 教育マンガ Meta Stability AI 画像生成AI GPT-4o インタビューゲームAI 小説ボードゲーム深層学習 CEDEC2019 toio Microsoft マインクラフト CLIP テキスト画像生成 NeRF Sora 不完全情報ゲームビヘイビア・ツリー DALL-E CEDEC2021 バーチャルヒューマンデジタルツインメタバース Playable!高橋力斗作曲アストロノーカロボティクスナビゲーションAI 畳み込みニューラルネットワーク AR アップルスポーツ手塚治虫汎用人工知能 3D 広告 CEDEC2020 AIアートはこだて未来大学エージェント GDC 2021 メタ市場分析デジタルヒューマン東京大学 JSAI2022 ELSI プロンプト GPT-4 GDC 2019 マルチエージェント HTN ソニー栗原聡 CNN マーケティング懐ゲーから辿るゲームAI技術史鴫原盛之アドベンチャーゲーム NVIDIA Omniverse CEDEC2022 ジェネレーティブAI DALL-E 3 言霊の迷宮 CM 音声認識 Ubisoft SIGGRAPH ASIA 階層型タスクネットワーク YouTube JSAI2020 Microsoft Azure Unity インディーゲーム音声合成 BERT Omniverse Roblox がんばれ森川君2号 Netflix GPT-3.5 AIQVE ONE 世界モデル GTC2023 JSAI2023 電気通信大学 Apple JSAI2024 ブロックチェーンイベントレポート対話型エージェント人狼知能シーマン水野勇太ガイスター斎藤由多加 SF 研究シムシティシムピープル TEZUKA2020 スパーシャルAI Electronic Arts メタデータ TensorFlow キャリア模倣学習 Amazon DQN SIE アバター Genvid Technologies StyleGAN2 JSAI2021 Zork MCS-AI動的連携モデルモーションキャプチャー AGI 高橋ミレイ Cygames サイバーエージェント合成音声モリカトロン開発者インタビュー宮本茂則チャットボット AWS 徳井直生 GTC2022 Unreal Engine テキスト生成トレーディングカードメディアアート Adobe MAX Open AI ベリサーブ音声生成AI 松木晋祐 Bard ブラック・ジャック村井源稲葉通将マーダーミステリー CEDEC2023 XR Veo Runway GPT-5 Amadeus Code eSports ワークショップクラウド AlphaZero AIりんなカメラ環世界中島秀之宮路洋一理化学研究所テンセント人事 DARPA ドローン人工生命 ASBS ぱいどん AI美空ひばり手塚眞 GDC Summer 岡島学 eスポーツスタンフォード大学テニス BLUE PROTOCOL aibo 銭起揚自動運転車 Transformer GPT-2 シミュレーション哲学現代アートバンダイナムコ研究所 ELYZA NVIDIA Riva Epic Games rinna SNS 松尾豊データマイニングゲームエンジン Imagen バイアスサム・アルトマンデザイン NEDO 森山和道自動翻訳アーケードゲームセガ類家利直大澤博隆 SFプロトタイピングコナミデジタルエンタテインメント text-to-image text-to-3D DreamFusion AIロボ「迷キュー」に挑戦 Preferred Networks PaLM GitHub Copilot Gen-1 ControlNet 大阪大学建築イーロン・マスク Stable Diffusion XL Audio2Face Google I/O Firefly TikTok 立教大学 KLab LLaMA ハリウッドテキスト画像生成AI ユニバーサルミュージック法律 LoRA 論文 Niantic 新清士 Apple Vision Pro CEDEC2024 Runway Gen-3 Alpha スーパーマリオブラザーズ Whisk SIGGRAPH Asia 2024 DeepSeek モリカトロンAIコネクト GDC 2025 Veo 3 JSAI2025 OpenAI o3 CEDEC2025 Sora 2 OpenAI Five ピクサービッグデータナラティブエージェントシミュレーション眞鍋和子齊藤陽介成沢理恵お知らせ Magic Leap One サルでもわかる人工知能リップシンキング Ubisoft La Forge 知識表現 IGDA どうぶつしょうぎジェイ・コウガミ音楽ストリーミングマシンラーニング 5G 対話エンジンシーマン人工知能研究所ゴブレット・ゴブラーズ完全情報ゲームウェイポイントパス検索藤澤仁画像認識 DeNA 長谷洋平ぎゅわんぶらあ自己中心派ウロチョロス NBA フェイクニュースウィル・ライトレベルデザイン GPU ALife オルタナティヴ・マシンサウンドスケープ TRPG AI Dungeon ゼビウス不気味の谷写真松井俊浩パックマン通しプレイ本間翔太馬淵浩希中嶋謙互レコメンドシステム軍事 PyTorch モンテカルロ木探索バンダイナムコスタジオ田中章愛サッカーバスケットボール VAE RNN ウォッチドッグスレギオン HALO MIT MuZero Rival Peak リトル・コンピュータ・ピープルコンピューティショナル・フォトグラフィー絵画坂本洋典釜屋憲彦生物学 StyleCLIP masumi toyota TextWorld Bing Magenta GTC2021 CycleGAN NetHack AIボイスアクター南カリフォルニア大学 NVIDIA Canvas NetEase ナビゲーションメッシュ深層強化学習 ELYZA DIGEST ELIZA LEFT 4 DEAD プラチナエッグイーサリアムボエダ・ゴティエ Omniverse Replicator NVIDIA DRIVE Sim NVIDIA Isaac Sim Disney AI会話ジェネレーターグランツーリスモ・ソフィー VTuber フォートナイト Qosmo ポケモン Codex Soul Machines バーチャルキャラクター対談 GTC 2022 Siemens クラウドコンピューティング OpenSea GDC 2022 Earth-2 エコロジー ELYZA Pencil 医療キャラクターモーション RPG SIGGRAPH 2022 LaMDA マジック：ザ・ギャザリング介護 Romi 松原仁武田英明フルコトデータ分析 MILE WCCF WORLD CLUB Champion Football 柏田知大田邊雅彦トレカ Max Cooper 京都芸術大学ラベル付け秋期GTC2022 野々下裕子 pixiv セキュリティ 3Dスキャン Microsoft Designer イラスト柿沼太一 Scenario AIピカソ AI素材.com Andreessen Horowitz QA Tech Night 下田純也桑野範久 DreamerV3 Blender ゲーム背景 Point-E アパレル BIM GPT Photoshop ChatGPT4 コミコパ Tencent TEZUKA2023 大阪公立大学オムロンサイニックエックス橋本敦史宮本道人 LLaMA 2 Hugging Face xAI ストライキ Voyager IBM ソフトバンク SIGGRAPH2023 音源分離 Web3 BitSummit ファインチューニンググランツーリスモ量子コンピュータ北野宏明立福寛 FSM-DNN MindAgent 効果音 NVIDIA ACE 慶應義塾大学ヒストリア AI Frog Interactive ComfyUI Suno AI KaKa Creation VOICEVOX GPTs 3D Gaussian Splatting GDC 2024 ポケットモンスターインフルエンサー SIMA Gemma 2 Inworld AI IEEE 早稲田大学 Apple Intelligence WWDC WWDC 2024 Perplexity くまうた濱田直希ソニー・インタラクティブエンタテインメント遊戯王佐竹空良九州大学伊藤黎 Sakana AI ByteDance LINEヤフー DOOM GameNGen 社員インタビュー Movie Gen SynthID Playable!Mobile Sneaks Peridot 早瀬悠真 Veo 2 SONY Project Sid Razer GDC Cube 3D ベンチマーク Hao AI Lab Claude モリカコミックジョージア工科大学 Meshy Flow Gemini 2.5-pro Gemini 2.5 Flash Image Keep4o EXPO2025 大阪・関西万博アトラクチャー中村政義森旭彦 Veo 3.1 ゲーム映像パラメータ設計バランス調整 Dota 2 ソーシャルゲーム淡路滋グリムノーツゴティエ・ボエダ Gautier Boeda Julius TPRG バーチャル・ヒューマン・エージェントクーガー石井敦茂谷保伯マジック・リープノンファンジブルトークン里井大輝 GEMS COMPANY 初音ミク転移学習デバッギング北尾まどか将棋ナップサック問題 Spotify Replica Studio amuse クラウドゲーミング和田洋一 Stadia SIGGRAPH 2019 iPhone AIGraph 予期知能ドラゴンクエスト PAIR アルスエレクトロニカ2019 逆転オセロニア奥村エルネスト純齋藤精一高橋智隆ロボユニ泉幸典ロボコレ2019 意思決定モデル LEFT ALIVE 長谷川誠 Baby X ロバート・ダウニー・Jr.The Age of A.I.レコメンデーション MOBA 研修 mynet.ai 人工音声プレイ動画群知能 Spore デノイズ画像処理 CPU GMAI ウィザードリィ西川善司サムライスピリッツストリートファイター山野辺一記大里飛鳥 13フェイズ構造 Oculus Quest 生体情報照明山崎陽斗立木創太 GameGAN ソサエティ5.0 SIGGRAPH 2020 DIB-R Apex Legends Ninja TENTUPLAY MARVEL Future Fight タイムラプスバスキア階層型強化学習 WANN 竹内将セリア・ホデント UX 認知科学ゲームデザイン LUMINOUS ENGINE Luminous Productions パターン・ランゲージちょまど FPS マルコフ決定過程協調フィルタリング AlphaDogfight Trials StarCraft II Future of Life Institute Intel LAIKA Rotomation ドラゴンクエストライバルズ不確定ゲーム Embedding GTC2020 NVIDIA MAXINE ビデオ会議階層的クラスタリング toio SDK for Unity GDMC MITメディアラボ Magenda DDSP Kaggle Assassin’s Creed Origins Sea of Thieves monoAI technology Oculus テスト Baldur's Gate 3 Candy Crush Saga SIGGRAPH ASIA 2020 BigGAN MaterialGAN ReBeL Volvo Rival Prak ユービーアイソフトメタルギアソリッドV FSM 汎用言語モデル Chitrakar 巡回セールスマン問題ジョルダン曲線リアリティ番組ジョンソン裕子 MILEs インタラクティブ・ストリーミングインタラクティブ・メディア Ludo ArtEmis GROVER FAIR チート検出オンラインカジノ RealFlow Deep Fluids MeInGame ブレイン・コンピュータ・インタフェース BCI Learning from Video ユクスキュルカントエージェントアーキテクチャ OCTOPATH TRAVELER 西木康智 OCTOPATH TRAVELER 大陸の覇者 StyleRig いただきストリート大森田不可止ザナック仁井谷正充 Azure Machine Learning 脱出ゲーム Hybrid Reward Architecture Super Phoenix Project Malmo Project Paidia Project Lookout Watch For ジミ・ヘンドリックスカート・コバーンエイミー・ワインハウスダフト・パンク Glenn Marshall Story2Hallucination Jukebox SIFT DCGAN DANNCE ハーバード大学デューク大学ローグライクゲーム NeurIPS 2021 ヒップホップ詩サイレント映画環境音粒子群最適化法進化差分法下川大樹高津芳希大石真史 BEiT DETR Sentropy Discord CALM プログラミングソースコード生成シチズンデベロッパー GitHub MCN-AI連携モデル並木幸介森寅嘉 SIGGRAPH 2021 半導体 Topaz Video Enhance AI DLSS Dynamixyz U-Net ADV XLand DEATH STRANDING Eric Johnson コジマプロダクションデシマエンジン Maxim Peter Joshua Romoff ハイパースケープミライ小町テスラ Tesla Bot Tesla AI Day バズグラフニュースタンテキ東芝倉田宜典韻律射影韻律転移コンピュータRPG アップルタウン物語 KELDIC メロディ言語 Astro Ego4D 日経イノベーション・ラボ敵対的強化学習 GOSU Data Lab GOSU Voice Assistant SenpAI.GG Mobalytics AWS Sagemaker 形態素解析 AWS Lambda 誤字検出 SentencePiece 竹村也哉 GOAP Adobe MAX 2021 Omniverse Avatar NVIDIA Megatron NVIDIA Merlin NVIDIA Metropolis テキサス大学 AI Messenger Voicebot OpenAI Codex HyperStyle Rendering with Style Disneyリサーチ GauGAN GauGAN2 画像言語表現モデル SIGGRAPH ASIA 2021 ディズニーリサーチ Mitsuba2 ワイツマン科学研究所 CG衣装 VRファッション Artflow Eponym 音声クローニング Gopher 鑑定 Oxia Palus Art Recognition NHC 2021 池田利夫新刊案内マーベル・シネマティック・ユニバース MCU アベンジャーズ Digital Domain Masquerade2.0 フェイシャルキャプチャー山田暉 LSTM モリカトロンAIソリューションコード生成AI AlphaCode Codeforces 自己増強型AI COLMAP ADOP GANverse3D グランツーリスモSPORT GTソフィー FIAグランツーリスモチャンピオンシップ DGX A100 Webcam VTuber 星新一賞 Live Nation Web3.0 AIOps スマートコントラクトメディア政治 NightCafe Luis Ruiz 東京工業大学博報堂ラップ Z世代 AIラッパーシステムプラスリンクス～キミと繋がる想い～STC Style Transfer Conversation RCP Rinna Character Platform Amelia Gatebox ANIMAK 逢妻ヒカリセコムバーチャル警備システム損保ジャパン上原利之アッパーグラウンド品質保証 Autodesk Bentley Systems ワールドシミュレーター H100 COBOL DGX H100 DGX SuperPOD Instant NeRF artonomous bitGANs コミュニティ管理オンラインゲーム気候変動マックス・プランク気象研究所ビョルン・スティーブンス気象モデル気象シミュレーション環境問題 SDGs メモリスタ音声変換 Veap Japan EAP 福井千春メンタルケア Edgar Handy 東京理科大学産業技術総合研究所リザバーコンピューティングソニーマーケティングもじぱ暗号通貨 FUZZLE Alteration オープンワールド AIFA P2E StyleGAN-NADA Unity for Industry GLIDE AvatarCLIP Synthetic Data Sonantic Cohere Urzas.ai Kiki Zoetic AI ペット Digital Dream Labs Cozmo タカラトミー LOVOT MOFLIN ミクシィユニロボットユニボ Gato 汎用強化学習AI ロンドン芸術大学 Google Brain Sound Control SYNTH SUPER Karl Sims Artnome ICONATE 浜中雅俊福井健策 Wikipedia Sphere Xaver 1000 養蜂 Beewise フィンテック投資 MILIZE 三菱UFJ信託銀行西成活裕群衆マネジメントライブビジネス新型コロナ周済涛清田陽司サイバネティックス人工知能史 AI哲学マップ星新一 StyleGAN-XL StyleGAN3 GANimator VoLux-GAN Projected GAN Self-Distilled StyleGAN ニューラルレンダリング PLATO frame.io Foodly 中川友紀子アールティ BlenderBot 3 Meta AI マーク・ザッカーバーグ WACUL AIライティング AIのべりすと QuillBot Copysmith Jasper ヴィトゲンシュタイン論理哲学論考 PromptBase バンダイナムコネクサスユーザーレビュー mimic Baidu ERNIE-ViLG 古文書凸版印刷 AI-OCR 画像判定実況パワフルサッカー桃太郎電鉄桃鉄パワサカ岩倉宏介 PPO Machine Learning Project Canvas 国立情報学研究所石川冬樹スパコンスーパーコンピュータ松岡聡 TSUBAME 1.0 TSUBAME 2.0 ABCI 富岳 Society 5.0 夏の電脳甲子園座談会 NVIDIA GET3D AI絵師 UGC PGC NovelAI NovelAI Diffusion モーションデータポーズ推定メッシュ生成メルセデス・ベンツ Magic Leap Epyllion マシュー・ボールムーアの法則 Adobe MAX 2022 Adobe Research Galactica 映像解析東芝デジタルソリューションズ SATLYS 映像解析AI PFN 3D Scan PFN 4D Scan DreamUp DeviantArt Waifu Diffusion 元素法典 Novel AI CALA アフォーダンス PaLM-SayCan Code as Policies CaP コリジョンチェック山口情報芸術センター［YCAM］YCAM アンラーニング・ランゲージカイル・マクドナルドローレン・リー・マッカーシー鎖国［Walled Garden］プロジェクト SIGGRAPH ASIA 2022 VToonify ControlVAE 変分オートエンコーダーフォトグラメトリ回帰型ニューラルネットワーク DeepJoin Azure OpenAI Service DeepL DeepL Write シンギュラリティレイ・カーツワイルヴァーナー・ヴィンジ Runway Research Make-A-Video Phenaki Dreamix Text-to-Imageモデル Latitude neoAI DreamIcon mign studiffuse 対話型AIモデル note note AIアシスタント Ketchup AI News Art Selfie Art Transfer Pet Portraits Blob Opera クリムトクリティックネットワークアクターネットワーク DMLab Control Suite Atari 100k Atari 200M Yann LeCun 鈴木雅大コンセプトアート Colie Wertz リドリー・スコット絵コンテストーリーボード PaLM API MakerSuite Skeb Dreambooth-Stable-Diffusion Google Earth GEPPETTO AI Stable Diffusion web UI AI model AI Models ZMO.AI MOBBY’S モビーディックダイビングアウトドア AIスキャニング自動採寸 3DLOOK Sizer ワコールスニーカー UNSTREET Newelse CheckGoods 二次流通中古市場 Dupe Killer 偽ブランド配信ソニー・ピクチャーズアニメーション Fosters+Partners Zaha Hadid Architects ライブポートレイト Wonder Studio 土木インフラ Amazon Bedrock X.AI X Corp.Twitter Xホールディングス Magi SDXL RTFKT NIKE Clone X 村上隆 Digital Mark Snapchat クリエイターコミュニティバーチャルペット NVIDIA NeMo Service ヴァネッサ・ローザ Vanessa A Rosa 陶芸 Play.ht 音声AI LiDAR Polycam deforum ハーベスト ForGames ゲームマーケット岡野翔太郡山喜彦ジェフリー・ヒントン Google I/O 2023 武蔵野美術大学 BingAI Lightroom Canva BOOTH pixivFANBOX 虎の穴 Fantia とらのあな集英社少年ジャンプ＋ComicCopilot ゲームマスター Inowrld AI MOD Ghostwriter Skyrim スカイリム RPGツクールMZ ChatGPT_APIMZ ダンジョンズ&ドラゴンズ Oracle RPG 深津貴之 xVASynth Laser-NV MERF Alibaba VQRF nvdiffrec NeRFMeshing LERF マスタリングリアム・ギャラガーグライムス Boomy ジョン・レジェンドザ・ウィークエンドドレイクエッジワークス日本音楽作家団体協議会 FCA Voicebox さくらインターネットぷよぷよ TCG QRコード囲碁デンソーデンソーウェーブ原昌宏日本機械学会ロボティクス・メカトロニクス講演会トヨタ自動車かんばん方式プロット生成 FastGAN 4コママンガ ElevenLabs HeyGen After Effects 絵本出版 Ammaar Reshi Stories StoryBird Versed ProlificDreamer Unity Sentis Unity Muse Caleb Ward 宮田龍清河幸子西中美和安野貴博斧田小夜 CM3leon Stable Doodle T2I-Adapter 日本マネジメント総合研究所 Lily Hughes-Robinson Colossal Cave Adventure AdventureGPT リリー・ヒューズ＝ロビンソン BabyAGI GPT-3.5 Turbo カーリングウィンブルドン戦術分析パフォーマンス測定 IoT ProFitX Watsonx Athletica コーチング北見工業大学北見カーリングホール画像解析じりつくん NTT Sportict AIカメラ STADIUM TUBE Pixelllot S3 AIスマートコーチ Dreambooth ヤン・ルカン Perfusion ニューラル物理学毛髪荒牧英治中ザワヒデキ大屋雄裕中川裕志 Adreeseen Horowitz NVIDIA Avatar Cloud Engine Replica Studios Smart NPCs Roblox Studio Promethean AI Musiio Endel Sonar Sonar+D Dolby Atmos Sonar Music Festival ライゾマティクス真鍋大度花井裕也 Ritchie Hawtin Erica Synth Ufuk Barış Mutlu Japanese InstructBLIP Alpha 日本新聞協会 AIいらすとや AI Picasso Emposy AIタレント AIタレントエージェンシー modi.ai BitSummit Let’s Go!!デジタルレプリカ GOT7 synthesia HumanRF Actors-HQ SAG-AFTRA WGA チャーリー・ブルッカー岡野原大輔自己教師あり学習 In-Context Learning（ICL）qubit IBM Quantum System 2 ダリオ・ヒルジェン・スン・フアン HuggingFace Stable Audio 宗教仏教コカ・コーラ食品 Coca‑Cola Y3000 Zero Sugar Copilot Copyright Commitment テラバース京都大学音声解析感情分析周済涛ステートマシンディープニューラルネットワークハイブリッドアーキテクチャ Adobe Max 2023 Bing Chat Bing Image Creator Assistant with Bard The Arcade Search Generative Experience Dynalang VLE-CE AI Act EU Ars Electronica AI規制欧州委員会欧州議会欧州理事会 MusicLM AudioLM MusicCaps AudioCraft Mubert Mubert Render Gen-2 Runway AI Film Festival PreViz Character-LLM 復旦大学 Chat-Haruhi-Suzumiya 涼宮ハルヒ Emu Video ペリドット Dream Track Music AI Tools Lyria Yahoo!知恵袋インタラクティブプロンプトAI 石渡正人手塚プロダクション林海象古川善規大規模再構成モデル LRM Objaverse MVImgNet One-2-3-45 3Dガウシアンスプラッティングワンショット3D生成技術 FGDC Future Game Development Conference 佐々木瞬 Anique 中村太一エグゼリオ Copilot serial experiments lain AI lain PCG PCGRL Dungeons&Dragons ビートルズザ・ビートルズ: Get Back Demucs 音楽編集ソフト Adobe Audition iZotope RX10 Moises レベルファイブ Genie AI SIGGRAPH Asia 2023 C·ASE FLARE ダンス MagicAnimate Animate Anyone インテリジェントコンピュータ研究所アリババ DreaMoving VISCUIT Scratch スクラッチビスケットプログラミング教育 VALL-E Deepdub.ai AUDIOGEN Evoke Music AutoFoley Colourlab.Ai ディズニー Largo.ai Cinelytic Taskade Pika.art AI Filmmaking Assistant AI Screenwriter 芥川賞文学恋愛タップル Abema TV NEC 木村屋 GPT Store 生成AIチェッカーユーザーローカル九段理江東京都同情塔 4Dオブジェクト生成モデル Align Your Gaussians AYG MAV3D ファーウェイ 4D Gaussian Splatting 4D-GS Glaze WebGlaze NightShade Spawning Have I Been Trained?Fortnite Unreal Editor For Fortnite Volumetrics AIワールドジェネレーター Rosebud AI Gamemaker Layer Charisma.ai 調査 Meta Quest IP 強いAI 弱いAI Lumiere UNet ImageFX MusicFX TextFX Keyframer Gemini 1.5 AI Studio Vertex AI Chat with RTX Slack Slack AI Pokémon Battle Scope kanaeru 占い行動ロジック生成AI Convai NTTドコモ Ememe Genie 汎用AIエージェント AIファッションウィーク Grok-1 Mixture-of-Experts MoE Claude 3 Claude 3 Haiku Claude 3 Sonnet Claude 3 Opus 森永乳業 C2PA ゲーミフィケーション Tomo Kihara Playfool 遊び tsukurun 地方創生吉田直樹素材 OpenAI Japan Voice Engine Command R+Oracle Cloud Infrastructure Google Workspace Udio 立命館大学京都精華大学 TacticAI NPMP FOOH Project Astra Google I/O 2024 感情認識音声加工マルタ大学田中達大 Move AI ICRA2024 大規模基盤モデル Torobo 東京ロボティクスインピーダンス制御深層予測学習日立製作所尾形哲也 AIREC 汎用ロボットオムロンサイニックエックス ViLaIn PDDL ニューサウスウェールズ大学 Claude Sammut オックスフォード大学 Lars Kunze 杉浦孔明田向権 VASA-1 VoxCeleb2 AniTalker 上海大学 Luma Dream Machine NTT AI野々村真 GPT-4-turbo 佐藤恵助大道麻由物語構造分析慶応義塾大学渡邉謙吾ここ掘れ！プッカ大柳裕⼠加納基晴研究開発事例赤羽進亮 UDI（Universal Duel Interface）第一工科大学小林篤史荻野宏実ビヘイビアブランチ WPP General Computer Control（GCC）Cradle Spiral.AI ItakoLLM-7b 静岡大学明治大学北原鉄朗中村栄太日本大学ヤマハ前澤陽増田聡採用科学史 AIサイエンティスト Terra AI Overview 電通 AICO2 BitSummit Drift Omega Crafter SPACE INVADIANS 西島大介吉田伸一郎 SIGGRAPH2024 Motion-I2V Toonify3D 生成対向ネットワーク拡散モデル Diffusion うめ小沢高広ドリコム ai and SaaS インサイトカスタマーサポート ComfyUI-AdvancedLivePortrait GUI Video to Video iPhone 16 OpenAI o1 AIスマートリンクシャープウェアラブル CE-LLM Communication Edge-LLM AIペット Yahoo!ニュース AI Comic Factory AI comic Generator ComicsMaker.ai LlamaGen.ai GAZAI Flame Planner 動画ゲーム生成モデル Virtuals Protocol MarioVGG 松原卓二 Art Transfer 2 Art Selfie 2 Musical Canvas The Forever Labyrinth Refik Anadol Alexander Reben Rhizomatiks Molmo PixMo Qwen2 72B Depth Pro VARIETAS AI面接官キリンホールディングス空間コンピューティング Dream Screen Firefly Video Model Stable Video 4D AI受託開発事例田中志弥 Playable!3D Adobe MAX 2024 Illustrator Meta Quest 3 XR-Objects Orion 防犯 O2 Scam Detection Live Threat Detection 乗換NAVITIME Kaedim 3DFY.ai Luma AI Avaturn Bestat Oasis Decart Dejaboom!Unbounded Etched 声優パブリシティ権日本俳優連合日本芸能マネージメント事業者協会日本声優事業社協議会 IAPP Tripo 2.0 Meta 3D Gen スマートシティ都市計画松本雄太 Genie 2 World Labs Cybever Third Dimension AI 東北大学 Gemini 2.0 フロンティアワークス機械翻訳 Simplified AI Voice over Generator AI Audio Enhancer エーアイ AITalk コエステーション PlayStation VRML Techno Magic ゴーストバスターズスパイダーマンポリフォニー・デジタル荒牧伸志 Altera Robert Yang Project AVA Streamlabs Intelligent Streaming Assistant Project DIGITS スーパーコンピューターエージェンテック AI Shorts テルアビブ大学 DiffUHaul TrailBlazer ヴィクトリア大学ウェリントン zeroscope QNeRF カーネギーメロン大学 RALF グラフィックメイク Canvas Projects DeepSeek-R1 Loopy リップシンク CyberHost OmniHuman-1 CSAM Imagen 3 Google Labs Microsoft Muse ゲーム生成モデル WHAMデモンストレーター ChatGPT Edu 滋賀大学キリンビール桜AIカメラ Solist-AI ローム Factorio カリフォルニア大学 GamingAgent Anthropic Claude 3.7 Sonnet Factorio Learning Environment FLE Deepseek-v3 Gemini-2-Flash Llama-3.3-70B GPT-4o-Mini ZOZO NEXT ZOZO Fashion Intelligence System Partial Visual-Semantic Embedding WEAR GPT-4V ソイル大学 AIパズルジェネレーター DolphinGemma Wild Dolphin Project SoundStreamトークナイザー音声処理技術 GPT-4.1 GPT-4.1 mini GPT-4.1 nano LINE AI LINE AIトークサジェスト GTC2025 Fuxi Lab Naraka:Bladepoint Mobile バトルロイヤルビヘイビアツリー SoftServe ALNAIR AMRI BLADE GAGA QUEEN Runway Gen-4 SkyReels Stable Virtual Camera Intangible ブライアン・イーノ Eno Brain One AlphaEvolve Continuous Thought Machine（CTM）Arm Stable Audio Open Small Word2World STORY2GAME ウィットウォーターランド大学森川の頭の中花森リド Google I/O 2025 Lyra 2 MusicFX DJ Animon.ai ツインズひなひま Maya Deep Q-Learning AlphaGO スペースインベーダープリンス・オブ・ペルシャドラゴンクエストIV 堀井雄二山名学タイトーカプコン Ubi Anvilエンジン V1 Video Model Artificial Analysis Video Arena Video Model Leaderboard Claude 3.5 Mistral 樋口恭介 Claude 4 小川昴ホラーゲーム Stable Diffusion 1.5 階層型物語構造夏目漱石漱石書簡京都情報大学院大学上野未貴ブラウザ Comet Kiro Aww Inc.Visual Bank THE PEN FUJIYAMA AI SOUND 富士通西浦めめヘッドウォータース下斗米貴之ディプロマシー Cluade Opus 4 ChatGPT o3 カリフォルニア大学サンディエゴ校 Every テトリス逆転裁判ロゼッタ広報 Mavericks NoLang 4.0 gpt-oss 金井大組織作り Cygnus Taurus 笠原達也バグチケット都築圭太仁木一順ライフレビュー SIGGRAPH 2025 Text-to-Motion Miegakure Side International Razer Cortex: Playtest Program - Powered by Side Stable Audio 2.5 Veo 3 Fast Genie 3 Dynamics Lab Magica 2 Mirage 2 ペンシルバニア大学コーネル大学 HOLODECK 2.0 Nano Banana 市場調査 Googleクラウドゲームエイト Q-STAR 小栗伸重藤井啓祐水野弘之 AnimeGamer 香港城市大学ニューヨーク大学 God's Innovation Project GIP マインドスポーツチェス Grok 4 華南理工大学池上⾼志ミュージックビデオ TOWA TEI 椎名林檎中村剛森山尋西健一スキップ E-ONE PICTOY はらぺこミーム任天堂ギフトピアちびロボ！いきものづくりクリエイトーイ大盛り！いきものづくりクリエイトーイドラゴンリーグドラゴンポーカー城とドラゴン koROBO コンパニオンAI character.ai Nomi.ai META LOOP DESIGN LTD.MEO HiClub SynClub Starley Cotomo Livetoon kaiwa コンパニオンロボットヒューマノイド Realbotix 顔認識 Cluade 1X NEO ジュネーブ大学 Nadine MIXI Panasonic NICOBO Gemini Robotics 1.5 XR Blocks LLMER ペンシルバニア州立大学 SIMA 2 日本IBM シリアスゲームセガXD AI俳優世永玲生 Adobe MAX 2025

CGへの扉 Vol.39：言葉から生み出されるアートとは？

2022.6.17アート

言葉から生み出される画像

「立てば芍薬、座れば牡丹、歩く姿は百合の花」美しい人を表現する言葉ですが、人によってとらえ方はさまざまです。そもそも牡丹がどんな花なのか知らなければ牡丹よりも服のボタンを思い浮かべてしまうかもしれません。この言葉は江戸時代から落語や講談に出てきますが、はっきりとした由来は分かりません。もともとは薬効を示した言葉で、気が立っている人には芍薬の根を、疲れやすくすぐ座ってしまう人には牡丹の根、ふらふらと歩いている人には百合の球根が効くということらしいのですが、その本来の意味ではない事柄が今では一般的に知られています。

最近、言葉から画像を生成する人工知能を活用した事例として DALL-E の後継である DALL-E2 が話題になりました。
また、それに続いて同様の研究プロダクトであるグーグルのImagen が話題性の意味でも技術的要素としても追従してきています。

人間は理解や認識の多くを視覚に頼っています。とは言いつつも現代のコミュニケーションの多くは言葉に依存しています。先ほどの「立てば芍薬〜」と同様に言葉から想像する様相は人それぞれですが、膨大な言語体系の抽出と機械学習によって、言葉の表現どおりの画像を生成するというテクノロジーが登場しました。今まではプロのイラストレーターに言葉や例を示して描いてもらっていた絵が、テイストやその出来栄えはとにかく、人工知能が手軽に画像として合成してくれる時代がやってきたのです。

DALL-E2 の登場

DELL-E2で言葉から描いた画像。チャンピオンデータと呼ばれる良質の結果を並べたものであるが、それでもちょっとしたイラストのレベルにある

OpenAI DALL-E2：https://openai.com/dall-e-2/

2021年はじめにOpenAI社からDALL-Eが登場し、人工知能業界に衝撃を与えました。その機械学習の規模、精度とも人工知能研究に関わる人であれば容易ではないことが分かり、驚きをもって迎えられたのです。

【参考記事】CGへの扉 Vol.22：言葉から画像を生成、DALL-Eはクリエイティブなのか？

それから約一年後、満を持して登場した DALL-E2 はどう進化しているのでしょうか。

リサーチペーパーによると、DALL-E2は旧 DALL-E1に比べ、写実的で文言と画像との一致度が高いと評価されています。さらに解像度が4倍になった点も歓迎されています。

論文：Hierarchical Text-Conditional Image Generation with CLIP Latents

また、DALL-E2 は DALL-Eでの応用事例を反映し、意図しない不当な利用がなされないよう、さまざまな工夫が進んでいます。例えばフェイク画像として使われないように生成される画像に制限がかかる機構が組み込まれているなど配慮が進んでいます。そのため政治家や俳優などの画像を生成しないように、また成人向けの露骨な画像を生成しないよう、工夫がなされています。

画像生成のために指定する文言も、ポリシーに違反した言葉を扱わないよう自動的にフィルタリングするとともに、人の目でもチェックしているとのこと。現在の DALL-E2 は DALL-E1 と同様、APIは一般に公開されておらず、信頼できる限られたユーザーにのみ公開し、利用方法を探っていると言われています。DALL-E2 は素晴らしい成果と受け取られていつつも、逆に DALL-E2 が苦手とする画像や文言の研究も進んでいます。今後は研究成果というだけでなく、実用に向かっての工夫や制限を考慮することで、さらに用途が広がってくることが予想されます。

DALL-E2 の発表に合わせてInstagramのアカウントも開設されており「何かアイデアがあればDMで送ってくれれば実現するよ！」と書かれています。

DALL-E2はOpenAIが開発している、テキストと画像のペアを学習したCLIPと、テキストから画像を生成するGLIDEというテクノロジーを組み合わせて使われています。

CLIP：https://openai.com/blog/clip/
CLIPに関する論文：Learning Transferable Visual Models From Natural Language Supervision
GLIDEに関する論文：Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models

DALL-E2も次に紹介するGoogle Imagenも拡散モデル（Diffusion Model）と呼ばれる方式を用いています。最初はランダムな点のパターンの組み合わせから始まり、そこで生成された画像に指定された言葉の要素がふくまれていれば、そのまま画像を徐々に精細に変化させていきます。一方、画像が指定された言葉からかけ離れてきた場合は、そこで計算を打ち切ります。膨大なトライ＆エラーの結果、指定された言葉を描いた画像が生成されるわけです。今後ますます精度やリアルさ、様々な言葉の扱いを広げてくると考えられます。DALL-E3はどう進化してくるのか今から楽しみです。

Google Imagenの登場

毎度、グーグルのプロダクトは名前が普通すぎて冴えない気がしていますが、Google Imagen（正式名：Imagen diffusion model）もDALL-E 同様言葉で表現したイメージ画像を生成するテクノロジーです。Imagenは印象、画像、姿といった意味です。

論文：Photorealistic Text-to-Image Diffusion Models with Deep Language Understanding

グーグルは「DrawBench」と呼ばれる大量のテキストリストからGoogle Imagenで生成した画像と、DALL-E2 で生成した画像を人が比較し、言葉とその言葉が示すであろう画像との一致度を図ったところ、Imagen の方が評価が高かったと報告されています。

DALL-E2ではいち早く不適切な画像が生成されないよう配慮を進めている一方、Google Imagen はバイアスを考慮してか（？）あえて不適切な画像データも学習データとして用いてしまっているため、場合によっては一般的な閲覧には適さない画像も生成されるのが現状とのこと。学習のデータセットのベースとして用いられているのはLAION-400M。今後、意図的に不適切な画像を抜いておくのか、それを踏まえた上でありとあらゆる画像を扱うのか、論争が広がってくると考えられます。機械学習の教師データとして自動生成した画像を活用する合成データ「Synthetic Data」の考えも広がっており、一筋縄ではいかないことが分かります。

Google Imagen 開発の際に発見された特徴として、画像のモデルを大きく扱おうとするよりも、言語モデルの扱いを大きくした方が効率よく良い画像が得られるという意外な結果です。そう考えると、今まで思い込みで考えてきた研究や実装も、人工知能にとっては何か違う重要な要素が隠されている箇所がいろいろ見つかっていきそうです。

Google Imagen では 64×64 ピクセルサイズの画像であたりをつけ、そこから 256×256, 1024×1024 にアップコンバートする流れで、高精細な目的画像を生成しています。

ブルーチェックのベレー帽と赤いドット柄のタートルネックを着たゴールデンレトリバー

言葉から三次元アバターを生成する AvatarCLIP

コンピュータグラフィックスの最新研究論文が発表される今年の SIGGRAPH 2022 は、カナダのバンクーバーにて 8月8日から11日の5日間、現地会場とオンラインとハイブリッド環境で実施される予定です。SIGGRAPH 2022 で発表される論文が徐々に明らかになってきており、話題を先取りすると、その中でも注目の論文のひとつが、言葉から三次元アバターを生成するAvatarCLIP です。

AvatarCLIPは、事前学習済みの環境だけで、あらかじめデータが無いものについてもある程度の予測から目的の結果を出力できる「ゼロショット学習」と呼ばれる実装がなされています。AvatarCLIP は DELL-E2 や Google Imagen の 3D版ともいえるもので、自然言語から3Dアバターの形状と、テクスチャ（柄や色の情報）、動きといった情報を生成することができます。出力事例をみると、まだまだぎこちない感は否めませんが、今後ゲーム内の NPC（ノンプレイヤーキャラクター）や、群衆もののCG/VFXで活用できる可能がみてとれます。

AvatarCLIP: Zero-Shot Text-Driven Generation and Animation of 3D Avatars

論文：https://arxiv.org/abs/2205.08535
プロジェクトページ：https://hongfz16.github.io/projects/AvatarCLIP.html
ソースコード：https://github.com/kaz12tech/ai_demos/blob/main/AvatarCLIP_demo.ipynb

人が生み出すアートと、人工知能が生み出すアート

DALL-E2もGoogle Imagenも、現在は一般公開されていないこともあり、Twitterのネタとして扱われてしまいます。ちょっとしたイラストであれば、素早く的確なものを瞬時に用意できることから、これもまた「人工知能が人間の仕事を奪う」事例として考える人が出てくるかもしれません。DALL-E2やGoogle Imagenが生成する画像は、人間ぽっさも少し感じますが、その理由は面白そうな画像を生み出そうと考えている人間が考えた生成キーワードに由来しているとも言えます。妙なリアルさと、かすかに感じる人間ではない何かの知性らしきものが感じられる画像が生み出されており、若干妙な雰囲気が感じられるのも確かです。

DALL-Eの名前は、シュルレアリスムと呼ばれるシュールで独特の雰囲気をもった絵画で知られるサルバドール・ダリの名前と、廃墟となった惑星のゴミ拾いを続けるロボットWALL-Eから取られているので、その奇妙さも納得できるかもしれません。ただ、そういって笑っていられるのは今だけで、気づかないうちに日頃目にする広告画像や商品パッケージ、イラストを描いたのは実は人工知能という世の中がやってくるかもしれません。

本連載の今後の予定：「CGへの扉」では、単なるAIの話題とは少し異なり、CG/VFX, アートの文脈から話題を切り取り紹介していきます。映像制作の現場におけるAI活用や、AIで価値が高まった先進的なツール、これからの可能性を感じさせるような話題、テクノロジーの話題にご期待ください。何か取り上げて欲しいテーマやご希望などがございましたら、ぜひ編集部までお知らせください。

CGへの扉：

Vol.38：AIで作りAIで届ける映像作品

Vol.37：NVIDIA GTC 2022 レポート／アートとAIの視点で

Vol.36：創るためのAI〜AIと人間の創造性の未来：徳井直生氏講演レポート

Vol.35：マーベル・シネマティック・ユニバースを支える機械学習

Vol.34：注目論文よりCGの祭典 #SIGGRAPHAsia2021 を振り返る

Vol.33：AIの必然性 #SIGGRAPHAsia2021 レポート

Vol.32：Adobe Sneaks より進化の方向性を知る

Vol.31：人工知能が考える「顔」と、人が考える「顔」

Vol.30：SIGGRAPH2021レポート「ディープフェイクとの戦い」

Vol.29：AIの恩恵を受けるCG研究の世界。#SIGGRAPH2021 論文より

Vol.28：定番手法の他分野応用、自然言語処理AI由来の画像処理AI