モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。

TAG LIST: CG CGへの扉安藤幸央生成AI 月刊エンタメAIニュース機械学習河合律子ディープラーニング吉本幸記 OpenAI GAN 音楽 NVIDIA ChatGPT Google 強化学習三宅陽一郎森川幸人グーグル Stable Diffusion ニューラルネットワーク大規模言語モデル LLM シナリオ DeepMind 人工知能学会モリカトロンマイクロソフト QA AIと倫理 GPT-3 自然言語処理 Facebook 大内孝子倫理映画著作権ルールベースアートゲームプレイAI キャラクターAI スクウェア・エニックス敵対的生成ネットワーク SIGGRAPH モリカトロンAIラボインタビュー NPC 画像生成 NFT Minecraft ロボット DALL-E2 音楽生成AI プロシージャル Midjourney デバッグファッション StyleGAN 自動生成ディープフェイク遺伝的アルゴリズム画像生成AI ゲームAI VFX Adobe テストプレイメタAI アニメーションテキスト画像生成深層学習 CEDEC2019 Microsoft デジタルツインメタバース VR 小説ボードゲーム DALL-E CLIP toio ビヘイビア・ツリーマンガ CEDEC2021 CEDEC2020 作曲不完全情報ゲームロボティクスナビゲーションAI マインクラフト畳み込みニューラルネットワークスポーツエージェント GDC 2021 GPT-4 手塚治虫マルチモーダル汎用人工知能 JSAI2022 バーチャルヒューマン NVIDIA Omniverse GDC 2019 動画生成AI マルチエージェント CEDEC2022 Meta AIアート 3DCG Stability AI メタデジタルヒューマン懐ゲーから辿るゲームAI技術史教育ジェネレーティブAI はこだて未来大学プロンプト Red Ram 栗原聡 CNN NeRF DALL-E 3 BERT Microsoft Azure Unity Omniverse JSAI2023 ELSI 鴫原盛之 HTN 階層型タスクネットワークソニー東京大学 JSAI2020 GTC2023 3D マーケティング TensorFlow インタビューブロックチェーン CM イベントレポートアストロノーカ模倣学習対話型エージェント Amazon トレーディングカードメディアアート DQN 高橋力斗合成音声水野勇太アバターブラック・ジャック Ubisoft Genvid Technologies ガイスター StyleGAN2 電気通信大学稲葉通将 AR アップル GTC2022 GPT-3.5 Sora SIGGRAPH ASIA Netflix JSAI2021 Bard 研究シムピープル世界モデル MCS-AI動的連携モデルマーダーミステリーモーションキャプチャーアドベンチャーゲーム TEZUKA2020 CEDEC2023 AGI テキスト生成インディーゲーム Electronic Arts 音声合成広告 JSAI2024 メタデータ GDC Summer イーロン・マスク Stable Diffusion XL 森山和道キャリア eスポーツスタンフォード大学アーケードゲームテニスサイバーエージェント音声認識類家利直 eSports BLUE PROTOCOL シーマン aibo SIE 大澤博隆 SFプロトタイピングモリカトロン開発者インタビュー宮本茂則チャットボット Gemini ワークショップ Epic Games AIロボ「迷キュー」に挑戦 AWS 徳井直生村井源クラウド斎藤由多加 AlphaZero Transformer GPT-2 rinna AIりんなカメラ環世界中島秀之 PaLM GitHub Copilot 哲学ベリサーブ Playable!ハリウッド理化学研究所 Gen-1 SF テキスト画像生成AI 松尾豊 AIQVE ONE データマイニング現代アート DARPA ドローンシムシティゲームエンジン Imagen Zork バイアス ASBS ぱいどん AI美空ひばり手塚眞バンダイナムコ研究所スパーシャルAI ELYZA NEDO FSM-DNN MindAgent LEFT 4 DEAD 通しプレイ論文 OpenAI Five 本間翔太馬淵浩希 Cygames Audio2Face ピクサープラチナエッグイーサリアム効果音ボエダ・ゴティエビッグデータ中嶋謙互 Amadeus Code データ分析 MILE NVIDIA ACE ナラティブ NVIDIA Riva Omniverse Replicator WCCF レコメンドシステム NVIDIA DRIVE Sim WORLD CLUB Champion Football NVIDIA Isaac Sim セガ柏田知大軍事田邊雅彦 Google I/O トレカ慶應義塾大学 Max Cooper GPT Disney Firefly PyTorch 京都芸術大学 ChatGPT4 モンテカルロ木探索眞鍋和子バンダイナムコスタジオヒストリア AI Frog Interactive 新清士田中章愛銭起揚齊藤陽介コナミデジタルエンタテインメント成沢理恵お知らせ Magic Leap One Tencent サッカーバスケットボール TikTok Suno AI text-to-image サルでもわかる人工知能 text-to-3D VAE DreamFusion TEZUKA2023 リップシンキング RNN Ubisoft La Forge 自動運転車知識表現ウォッチドッグスレギオン VTuber IGDA 立教大学秋期GTC2022 市場分析フォートナイト KLab どうぶつしょうぎ Roblox ジェイ・コウガミ音楽ストリーミング MIT 野々下裕子 Adobe MAX マシンラーニング 5G MuZero Rival Peak がんばれ森川君2号 pixiv オムロンサイニックエックス GPTs 対話エンジンポケモン 3Dスキャン橋本敦史リトル・コンピュータ・ピープル Codex シーマン人工知能研究所コンピューティショナル・フォトグラフィー Preferred Networks ゴブレット・ゴブラーズ絵画 Open AI 3D Gaussian Splatting Microsoft Designer イラストシミュレーション Soul Machines 柿沼太一完全情報ゲームバーチャルキャラクター坂本洋典宮本道人釜屋憲彦ウェイポイント LLaMA パス検索 Hugging Face 対談藤澤仁生物学 GTC 2022 xAI Apple Vision Pro 画像認識 Siemens ストライキ StyleCLIP DeNA Voyager 長谷洋平 GDC 2024 クラウドコンピューティング masumi toyota IBM 宮路洋一 OpenSea GDC 2022 SNS TextWorld Earth-2 Apple Bing Magenta ソフトバンク YouTube 音声生成AI ELYZA Pencil Scenario SIGGRAPH2023 AIピカソ GTC2021 AI素材.com CycleGAN テンセント Andreessen Horowitz QA Tech Night 松木晋祐 NetHack 下田純也桑野範久キャラクターモーション ControlNet 音源分離 NBA フェイクニュースユニバーサルミュージック RPG 法律 Web3 SIGGRAPH 2022 レベルデザイン DreamerV3 AIボイスアクター Unreal Engine 南カリフォルニア大学 NVIDIA Canvas GPU ALife 人工生命オルタナティヴ・マシンサム・アルトマンサウンドスケープ LaMDA TRPG マジック：ザ・ギャザリング AI Dungeon 介護ゲーム背景アパレル不気味の谷ナビゲーションメッシュデザイン写真高橋ミレイ深層強化学習松原仁松井俊浩武田英明フルコト ELYZA DIGEST WWDC WWDC 2024 建築西成活裕ハイブリッドアーキテクチャ AI野々村真 Apex Legends ELIZA 群衆マネジメントライブポートレイト Ninja コンピュータRPG ライブビジネス Wonder Studio Adobe Max 2023 GPT-4-turbo アップルタウン物語新型コロナ土木佐藤恵助 KELDIC 周済涛 BIM Bing Chat 大道麻由メロディ言語清田陽司インフラ Bing Image Creator 物語構造分析ゲーム TENTUPLAY サイバネティックス慶応義塾大学 MARVEL Future Fight Astro 人工知能史 Amazon Bedrock Assistant with Bard 渡邉謙吾タイムラプス Ego4D AI哲学マップ The Arcade ここ掘れ！プッカバスキア星新一 X.AI Search Generative Experience くまうた日経イノベーション・ラボ StyleGAN-XL X Corp.Dynalang 濱田直希敵対的強化学習 StyleGAN3 Twitter VLE-CE 大柳裕⼠階層型強化学習 GOSU Data Lab GANimator Xホールディングス加納基晴 WANN GOSU Voice Assistant VoLux-GAN Magi AI Act ソニー・インタラクティブエンタテインメント竹内将 SenpAI.GG Projected GAN EU 研究開発事例 Mobalytics Self-Distilled StyleGAN SDXL Ars Electronica 赤羽進亮ニューラルレンダリング RTFKT AI規制遊戯王岡島学 AWS Sagemaker PLATO NIKE 欧州委員会 UDI（Universal Duel Interface）映像セリア・ホデント形態素解析 frame.io Clone X 欧州議会第一工科大学 UX AWS Lambda Foodly 村上隆欧州理事会佐竹空良誤字検出 MusicLM 小林篤史認知科学中川友紀子 Digital Mark AudioLM 九州大学ゲームデザイン SentencePiece アールティ Snapchat MusicCaps 荻野宏実 LUMINOUS ENGINE クリエイターコミュニティ AudioCraft 伊藤黎 Luminous Productions BlenderBot 3 バーチャルペットビヘイビアブランチパターン・ランゲージ竹村也哉 Meta AI NVIDIA NeMo Service Mubert WPP ちょまどマーク・ザッカーバーグヴァネッサ・ローザ Mubert Render General Computer Control（GCC）GOAP WACUL Vanessa A Rosa Gen-2 Cradle Adobe MAX 2021 陶芸 Runway AI Film Festival 自動翻訳 Play.ht PreViz 音声AI AIライティング LiDAR Character-LLM Omniverse Avatar AIのべりすと Polycam 復旦大学 FPS QuillBot deforum Chat-Haruhi-Suzumiya マルコフ決定過程 NVIDIA Megatron Copysmith 涼宮ハルヒ NVIDIA Merlin Jasper ハーベスト Emu Video NVIDIA Metropolis ForGames Niantic パラメータ設計ゲームマーケットペリドットバランス調整岡野翔太 Dream Track 協調フィルタリング郡山喜彦 Music AI Tools 人狼知能テキサス大学ジェフリー・ヒントン Lyria Google I/O 2023 Yahoo!知恵袋 AlphaDogfight Trials AI Messenger Voicebot インタラクティブプロンプトAI エージェントシミュレーション OpenAI Codex 武蔵野美術大学 StarCraft II HyperStyle BingAI 石渡正人 Future of Life Institute Rendering with Style 手塚プロダクション Intel 林海象 LAIKA Disneyリサーチヴィトゲンシュタイン Photoshop 古川善規 Rotomation GauGAN 論理哲学論考 Lightroom 大規模再構成モデル GauGAN2 Canva LRM ドラゴンクエストライバルズ画像言語表現モデル Objaverse 不確定ゲーム SIGGRAPH ASIA 2021 PromptBase BOOTH MVImgNet Dota 2 ディズニーリサーチ pixivFANBOX One-2-3-45 Mitsuba2 バンダイナムコネクサス虎の穴 3Dガウシアンスプラッティングソーシャルゲーム Embedding ワイツマン科学研究所ユーザーレビュー Fantia ワンショット3D生成技術 GTC2020 CG衣装 mimic とらのあな NVIDIA MAXINE VRファッション Baidu 集英社 FGDC 淡路滋ビデオ会議 Artflow ERNIE-ViLG 少年ジャンプ＋Future Game Development Conference グリムノーツ Eponym 古文書 ComicCopilot 佐々木瞬ゴティエ・ボエダ音声クローニング凸版印刷コミコパ Gautier Boeda 階層的クラスタリング Gopher AI-OCR ゲームマスター画像判定 Inowrld AI Julius 鑑定ラベル付け MOD Anique TPRG Oxia Palus Ghostwriter 中村太一バーチャル・ヒューマン・エージェント toio SDK for Unity Art Recognition Skyrim エグゼリオクーガー実況パワフルサッカースカイリム Copilot 石井敦 NHC 2021 桃太郎電鉄 RPGツクールMZ ComfyUI 茂谷保伯池田利夫桃鉄 ChatGPT_APIMZ serial experiments lain GDMC 新刊案内パワサカダンジョンズ&ドラゴンズ AI lain マーベル・シネマティック・ユニバース Oracle RPG PCG MITメディアラボ MCU 岩倉宏介深津貴之 PCGRL アベンジャーズ PPO xVASynth Dungeons&Dragons マジック・リープ Digital Domain Machine Learning Project Canvas Laser-NV ビートルズ Magenda Masquerade2.0 国立情報学研究所ザ・ビートルズ: Get Back ノンファンジブルトークン DDSP フェイシャルキャプチャー石川冬樹 MERF Demucs スパコン Alibaba 音楽編集ソフト里井大輝 Kaggle スーパーコンピュータ VQRF Adobe Audition 山田暉松岡聡 nvdiffrec iZotope Assassin’s Creed Origins AI会話ジェネレーター TSUBAME 1.0 NeRFMeshing RX10 Sea of Thieves TSUBAME 2.0 LERF Moises GEMS COMPANY monoAI technology LSTM ABCI マスタリングモリカトロンAIソリューション富岳レベルファイブ初音ミク Oculus コード生成AI Society 5.0 リアム・ギャラガー転移学習テスト AlphaCode 夏の電脳甲子園グライムス KaKa Creation Baldur's Gate 3 Codeforces 座談会 Boomy VOICEVOX Candy Crush Saga 自己増強型AI ジョン・レジェンド Genie AI SIGGRAPH ASIA 2020 COLMAP ザ・ウィークエンド SIGGRAPH Asia 2023 ADOP NVIDIA GET3D ドレイク C·ASE デバッギング BigGAN GANverse3D FLARE MaterialGAN ダンスグランツーリスモSPORT AI絵師エッジワークス MagicAnimate ReBeL グランツーリスモ・ソフィー UGC 日本音楽作家団体協議会 Animate Anyone GTソフィー PGC FCA インテリジェントコンピュータ研究所 Volvo FIAグランツーリスモチャンピオンシップ Voicebox アリババ NovelAI さくらインターネット DreaMoving Rival Prak DGX A100 NovelAI Diffusion VISCUIT ぷよぷよ Scratch ユービーアイソフト Webcam VTuber モーションデータスクラッチ星新一賞大阪公立大学ビスケット北尾まどか HALO ポーズ推定 TCG プログラミング教育将棋メタルギアソリッドV メッシュ生成 FSM メルセデス・ベンツ QRコード VALL-E Magic Leap 囲碁 Deepdub.ai ナップサック問題 Live Nation Epyllion デンソー AUDIOGEN 汎用言語モデル Web3.0 マシュー・ボールデンソーウェーブ Evoke Music AIOps ムーアの法則原昌宏 AutoFoley Spotify スマートコントラクト日本機械学会 Colourlab.Ai Replica Studio ロボティクス・メカトロニクス講演会ディズニー amuse Chitrakar Qosmo Adobe MAX 2022 トヨタ自動車 Largo.ai 巡回セールスマン問題かんばん方式 Cinelytic ジョルダン曲線メディア Adobe Research Taskade 政治 Galactica プロット生成 Pika.art クラウドゲーミング AI Filmmaking Assistant 和田洋一リアリティ番組映像解析 FastGAN Stadia ジョンソン裕子セキュリティ 4コママンガ AI Screenwriter MILEs NightCafe 東芝デジタルソリューションズ芥川賞インタラクティブ・ストリーミング Luis Ruiz SATLYS 映像解析AI 文学インタラクティブ・メディア恋愛 PFN 3D Scan ElevenLabs タップル東京工業大学 HeyGen Abema TV Ludo 博報堂 After Effects NEC ラップ PFN 4D Scan 絵本木村屋 SIGGRAPH 2019 ArtEmis Z世代 DreamUp 出版 GPT Store AIラッパーシステム DeviantArt Ammaar Reshi 生成AIチェッカー Waifu Diffusion Stories ユーザーローカル GROVER プラスリンクス～キミと繋がる想い～元素法典 StoryBird 九段理江 FAIR STC Novel AI Versed 東京都同情塔チート検出 Style Transfer Conversation ProlificDreamer オンラインカジノ RCP Unity Sentis 4Dオブジェクト生成モデル RealFlow Rinna Character Platform Unity Muse Align Your Gaussians iPhone CALA Caleb Ward AYG Deep Fluids 宮田龍 MAV3D MeInGame Amelia 清河幸子ファーウェイ AIGraph ブレイン・コンピュータ・インタフェース西中美和 4D Gaussian Splatting BCI Gatebox アフォーダンス安野貴博 4D-GS Learning from Video ANIMAK PaLM-SayCan 斧田小夜 Glaze 予期知能逢妻ヒカリ WebGlaze セコム LLaMA 2 NightShade ユクスキュルバーチャル警備システム Code as Policies Spawning カント損保ジャパン CaP Have I Been Trained?CM3leon Fortnite 上原利之 Stable Doodle Unreal Editor For Fortnite ドラゴンクエストエージェントアーキテクチャアッパーグラウンドコリジョンチェック T2I-Adapter XR PAIR OCTOPATH TRAVELER 西木康智 Volumetrics OCTOPATH TRAVELER 大陸の覇者山口情報芸術センター［YCAM］AIワールドジェネレーターアルスエレクトロニカ2019 品質保証 YCAM 日本マネジメント総合研究所 Rosebud AI Gamemaker StyleRig Autodesk アンラーニング・ランゲージ Layer 逆転オセロニア Bentley Systems カイル・マクドナルド Lily Hughes-Robinson Charisma.ai ワールドシミュレーターローレン・リー・マッカーシー Colossal Cave Adventure 奥村エルネスト純いただきストリート H100 鎖国［Walled Garden］プロジェクト AdventureGPT 調査齋藤精一大森田不可止 COBOL SIGGRAPH ASIA 2022 リリー・ヒューズ＝ロビンソン Meta Quest 高橋智隆 DGX H100 VToonify BabyAGI IP ロボユニザナック DGX SuperPOD ControlVAE GPT-3.5 Turbo 泉幸典仁井谷正充変分オートエンコーダーカーリング強いAI ロボコレ2019 Instant NeRF フォトグラメトリウィンブルドン弱いAI artonomous 回帰型ニューラルネットワーク bitGANs DeepJoin 戦術分析ぎゅわんぶらあ自己中心派 Azure Machine Learning Azure OpenAI Service パフォーマンス測定 Lumiere 意思決定モデル脱出ゲーム DeepL IoT UNet Hybrid Reward Architecture コミュニティ管理 DeepL Write ProFitX ImageFX ウロチョロス Super Phoenix Watsonx MusicFX Project Malmo オンラインゲーム Athletica TextFX 気候変動コーチング Project Paidia シンギュラリティ北見工業大学 Keyframer Project Lookout マックス・プランク気象研究所レイ・カーツワイル北見カーリングホール Watch For ビョルン・スティーブンスヴァーナー・ヴィンジ画像解析 Gemini 1.5 気象モデル Runway Research じりつくん AI Studio LEFT ALIVE 気象シミュレーション Make-A-Video NTT Sportict Vertex AI 長谷川誠ジミ・ヘンドリックス環境問題 Phenaki AIカメラ Chat with RTX Baby X カート・コバーンエコロジー Dreamix STADIUM TUBE Slack ロバート・ダウニー・Jr.エイミー・ワインハウス SDGs Text-to-Imageモデル Pixelllot S3 Slack AI Pokémon Battle Scope ダフト・パンクメモリスタ AIスマートコーチポケットモンスター Glenn Marshall kanaeru The Age of A.I.Story2Hallucination 音声変換 Latitude 占いレコメンデーション Jukebox Dreambooth 行動ロジック生成AI Veap Japan ヤン・ルカン Convai EAP neoAI Perfusion NTTドコモ SIFT 福井千春 DreamIcon ニューラル物理学 Ememe DCGAN 医療 mign 毛髪 Genie MOBA DANNCE メンタルケア studiffuse 荒牧英治汎用AIエージェント人事ハーバード大学 Edgar Handy 中ザワヒデキ AIファッションウィーク研修デューク大学大屋雄裕インフルエンサー中川裕志 Grok-1 mynet.ai ローグライクゲーム Adreeseen Horowitz Mixture-of-Experts 東京理科大学 NVIDIA Avatar Cloud Engine MoE 人工音声 NeurIPS 2021 産業技術総合研究所 Replica Studios Claude 3 リザバーコンピューティング Smart NPCs Claude 3 Haiku プレイ動画ヒップホップ対話型AIモデル Roblox Studio Claude 3 Sonnet 詩ソニーマーケティング Promethean AI Claude 3 Opus サイレント映画もじぱ note 森永乳業環境音暗号通貨 note AIアシスタント Musiio C2PA FUZZLE Ketchup Endel ゲーミフィケーション Alteration AI News Tomo Kihara 粒子群最適化法 Art Selfie Playfool 進化差分法オープンワールド Art Transfer Sonar 遊び群知能下川大樹 AIFA Pet Portraits Sonar+D tsukurun ウィル・ライト高津芳希 P2E Blob Opera 地方創生大石真史クリムト Dolby Atmos 吉田直樹 BEiT StyleGAN-NADA Sonar Music Festival 素材 DETR ライゾマティクス SIMA Spore クリティックネットワーク真鍋大度 OpenAI Japan デノイズ Unity for Industry アクターネットワーク花井裕也 Voice Engine 画像処理 DMLab Ritchie Hawtin Command R+Sentropy GLIDE Control Suite Erica Synth Oracle Cloud Infrastructure CPU Discord AvatarCLIP Atari 100k Ufuk Barış Mutlu Google Workspace Synthetic Data Atari 200M Japanese InstructBLIP Alpha Udio CALM Yann LeCun 日本新聞協会立命館大学プログラミング鈴木雅大 AIいらすとや京都精華大学ソースコード生成コンセプトアート AI Picasso TacticAI GMAI シチズンデベロッパー Sonantic Colie Wertz Emposy NPMP GitHub Cohere リドリー・スコット AIタレント FOOH ウィザードリィ MCN-AI連携モデル絵コンテ AIタレントエージェンシー GPT-4o Urzas.ai ストーリーボード modi.ai Project Astra 大阪大学 BitSummit Google I/O 2024 西川善司並木幸介 Kiki Blender BitSummit Let’s Go!!Gemma 2 サムライスピリッツ森寅嘉 Zoetic AI Veo ゼビウス SIGGRAPH 2021 ペット感情認識ストリートファイター半導体 Digital Dream Labs PaLM API デジタルレプリカ音声加工 Topaz Video Enhance AI Cozmo MakerSuite GOT7 マルタ大学 DLSS タカラトミー Skeb synthesia 田中達大山野辺一記 NetEase LOVOT Dreambooth-Stable-Diffusion HumanRF Inworld AI 大里飛鳥 Dynamixyz MOFLIN Actors-HQ Move AI Romi Google Earth SAG-AFTRA ICRA2024 U-Net ミクシィ GEPPETTO AI WGA IEEE 13フェイズ構造ユニロボット Stable Diffusion web UI チャーリー・ブルッカー大規模基盤モデル ADV ユニボ Point-E Torobo XLand Gato 岡野原大輔東京ロボティクス AI model 自己教師あり学習インピーダンス制御 DEATH STRANDING AI Models In-Context Learning（ICL）深層予測学習 Eric Johnson 汎用強化学習AI ZMO.AI LoRA 日立製作所 MOBBY’S ファインチューニング早稲田大学 Oculus Quest コジマプロダクションロンドン芸術大学モビーディックグランツーリスモ尾形哲也生体情報デシマエンジン Google Brain ダイビング量子コンピュータ AIREC Sound Control アウトドア qubit 汎用ロボット SYNTH SUPER AIスキャニング IBM Quantum System 2 オムロンサイニックエックス照明 Maxim Peter Karl Sims 自動採寸北野宏明 ViLaIn Joshua Romoff Artnome 3DLOOK ダリオ・ヒル PDDL ハイパースケープ ICONATE Sizer ジェン・スン・フアンニューサウスウェールズ大学山崎陽斗ワコール HuggingFace Claude Sammut 立木創太スニーカー Stable Audio オックスフォード大学浜中雅俊 UNSTREET 宗教 Lars Kunze ミライ小町 Newelse 仏教杉浦孔明テスラ福井健策 CheckGoods コカ・コーラ田向権 GameGAN 二次流通食品 VASA-1 パックマン Tesla Bot 中古市場 Coca‑Cola Y3000 Zero Sugar VoxCeleb2 Tesla AI Day Wikipedia Dupe Killer Copilot Copyright Commitment AniTalker ソサエティ5.0 Sphere 偽ブランドテラバース上海大学 SIGGRAPH 2020 バズグラフ Xaver 1000 配信京都大学 Apple Intelligence ニュースタンテキ養蜂立福寛東芝 Beewise ソニー・ピクチャーズアニメーション音声解析 DIB-R 倉田宜典フィンテック感情分析 Luma 投資 Fosters+Partners 周済涛 Dream Machine 韻律射影 MILIZE Zaha Hadid Architects ステートマシン NTT 韻律転移三菱UFJ信託銀行ディープニューラルネットワーク Perplexity

CGへの扉 Vol.43：AI絵師は3DCGの領域へ

2022.10.17アート

AIはどこへ向かう？

2022年も残るところ数か月、ここ数週間で、人工知能が描く画像（いわゆるAI絵師）の進展が驚くべき状況になりつつあります。また、テクノロジーの観点ばかりではなく、利用方法や著作権、絵描きの心情も含め、多くの意見が錯綜している段階です。側から見ると、短い期間で、ものすごい勢いでさまざまな人工知能が開発されているように見えますが、実は数年前から研究開発されてきたものが、このタイミングで一気に、先を争うようにお披露目されている印象があります。

技術論文登録サイトarXiv の統計によると、2020年から2022年にかけて、人工知能（とくに機械学習）関連の論文が指数的に増加していることが分かっています。日に数百本の勢いで増加する論文は、人工知能専門の研究者であってもすべての関連論文を読み解けないほどの量になっていることが指摘されています。

サーベイ論文：Predicting the Future of AI with AI:High-Quality link prediction in an exponentially growing knowledge network

人工知能が描く画像に関する話題が広がったひとつの契機は Stable Diffusion のオープンソースとしての公開でした。Stable Diffusion公開以前、OpenAIやGoogleが人工知能ソリューションを一般公開せずに一部の利用者に限定していたのも、さまざまな問題や課題が発生することが予想されたことや、世間的にどう受け止められるのかが分からないことがひとつの要因だったと考えられます。そういった懸念をものともせず、公開されたStable Diffusionにより、利用者とともに、Stable Diffusionを元としたサービスも数多く登場してきました。

その中では、機械学習の学習素材となっている画像群の出所が著作権上はっきりしないものであったり、
あまりにも学習元の画像にそっくりな画像が生成できてしまうなどといった、自分で絵を描く人からすると許容できない状況が問題になりました。

人工知能に画像を描かせるのは、あくまでツールであると考える人もいれば、自身の創作活動が阻害されたり侵食されると考える人、悪さを思いつく人、嫌悪感を抱く人もいて、さまざまな受け取られ方がされています。カメラの登場、コンピュータの登場など、過去にもさまざまなテクノロジーが、人間の創作活動を奪うと考えてきましたが、人間は一度便利さを手に入れると、元には戻れなくなるという習性があります。今回の人工知能を取り巻く一連の状況も同じ状況です。技術は一度生まれてしまったら、それがなかった時代には戻れないのです。

text-to-?? の広がり

text-to-image文字列から画像を生成する仕組みから、音声を生成するtext-to-speech、環境音などを生成するtext-to-sound、音楽を生成するtext-to-audio、三次元形状を生成するtext-to-3Dなど、文字列からさまざまなデータが生成できるソリューションが広がってきました。そこで使われるpromptと呼ばれる、生成を指示する文字列も、カメラや3DCGの業界用語が大きく影響を与えることが分かってきました。

promptとして、画質向上のヒントとなるのは、3DCGツールの製品名や、画像生成（レンダリング）ツールの名前などです。

【promptに使用される単語の例】
3DCG関連：3D renders, 3D realism, unreal engine, octane render, vray, houdini render, cinema4d, arnold render, raytracing, cgi, lumen reflections, cgsociety, ultra realistic
カメラ関係：bokeh, depth of field (or dof), macro photography, polaroid, film photography, studio quality

以下の3つの画像は”Laboratory” と、上記キーワードを付与して生成したtext-to-image 画像です。3DCGツールで制作したかのような雰囲気の画像が生成されています。

text-to-?? は一種の発想実験でもあり、人工知能の活用の場を考えるヒントともなる事象です。例えば、text-to-AD（広告）、text-to-sourcecode、text-to-novel、text-to-game、text-to-scenario、text-to-movie などなど考え始めるとキリがありません。

文字列から三次元形状へ text-to-3D

text-to-image の二次元コンテンツから次の展開は三次元です。ここにきて text-to-3D 研究がいくつも話題になってきています。ただし、まだまだ万能なものではなく、得意不得意や向き不向きがあるといった状況です。

DreamFusion

DreamFusion: Text-to-3D using 2D Diffusion（Googleリサーチと、UCバークレイの共同研究）

人工知能が画像を生成するために、大量の画像とテキストの組み合わせを機械学習で実現していますが、残念ながら3D形状データに関しては、こういった大量データセットの存在や精度を高めるためのノイズ除去の手法が無い状況です。DreamFusionでは、ランダムに生成された3次元モデルを勾配降下法（訓練テストに対してコストが最小になるように、モデルパラメータを少しずつ操作し収束させる手法）により最適化し、ランダムな角度からの2次元レンダリングが低損失になるよう導いています。このアプローチによって事前学習によりさまざまな形状が生成可能になりました。内部的にはGoogleのImagenというtext-to-image技術が使われています。

NVIDIA GET3D

NVIDIA GET3D（NVIDIA社）
解説ブログ：https://blogs.nvidia.com/blog/2022/09/23/3d-generative-ai-research-virtual-worlds/

NVIDIA GET3D (Generate Explicit Textured 3D meshes) は、2D画像のみの機械学習の結果から、高精細なテクスチャと複雑な3D形状を生成することができます。ここで生成される3Dオブジェクトは、一般的な3DCGソフトで使用されるのと同じフォーマットで作成されるため、すぐにCGツールに取り込んで活用することができます。とくにゲームの景観や建築設計、都市の設計などで、大量かつ現実世界におけるの3D形状モデルを平易に揃えたい場合には重宝するでしょう。

例えば、さまざまな車種の車の画像を学習させることで、車の3D形状データを手に入れたり、動物や家具といったさまざまな用途に使えます。さらにVR空間に必要な要素を自動的に大量に揃えるためにもこういった text-to-3D ツールは重宝することでしょう。

このtext-to-3Dソリューションが登場するまでは複数の二次元画像から3D形状を抽出したり、二次元画像からの類推で3D形状を生成していたため、精度や自由度に関して制限がありました。GET3Dでは、1台の最新GPU搭載PCを用いると、1秒間に約20の形状を次々に生成することができます。元となる機械学習の素材の数が多ければ多いほど、出力される3D形状も多種多様なものになっていきます。実際の利用には NVIDIA のStyleGAN-NADAとGET3D を組み合わせることで、テキスト入力から3D形状データを生成することになります。今後は、あらかじめ用意されたデータセットからの学習ではなく実世界の写真からの学習や、より多くの種別に対応していく予定とのこと。

空間データ形式3D SDFからテクスチャフィールドを生成する。そこからDMTetを用いて3次元メッシュを抽出、表面に対応したテクスチャフィールドを照会し色を取得。2次元画像として定義された敵対的損失を用いて学習を行う。ラスタライゼーションの過程でRGB画像とシルエットを取得。2つの2次元識別器（それぞれRGB画像とシルエット）を用いて、入力が本物か偽物かを評価しこれを繰り返す。モデル全体を一気に学習することが可能

創作活動の尊重と、AIはあくまでツールという考え方

人工知能による画像生成はルールや倫理、法律や著作権などではすべてコントロールできない状況が考えられます。こういったテクノロジーを嫌がる人もいれば、積極的に受け入れる人もいるのは当然です。

映画ダイハードなどで知られる俳優、ブルース・ウィリス氏が、自身の失語症を理由に2022年3月に俳優業を引退しました。その後、「ディープフェイクで生成した自分のキャラクタを映画や広告に出演させる権利」をエージェントに売却したのです。最新のハリウッド映画では、俳優のスタント映像や特殊効果のために体中のデータをスキャンし、デジタルツインと呼ばれるデータで3DCGのキャラクタに演技させることがあります。これを受け入れる俳優も、嫌がる俳優もいます。

ディープフェイクを用いれば、多言語対応できたり、年齢の壁を取り払った演技を可能になるというポジティブな可能性が広がります。ブルース・ウィリスの事例は、本人の置かれている状況が特殊（自身でこれ以上演技を続けられない）という事も影響していますが、今後テクノロジーを受け入れるタイプのクリエーターと、受け入れないタイプのクリエーターが共存していかなければいけない困難な状況が続くでしょう。

Lexicaや、Magic StudioのImagineでは、人工知能が生成した画像を次々と見ることができ、SNSやクリエーター作品投稿サイトとは、またちょっと違った雰囲気が感じられます。Imagineには “Ghibli” というタグが用意されています。このことを突き詰めると一悶着ありそうですが、どんな生成画像も、ジブリ風になるのが、驚きを超えてなにか不思議な感覚に没入していくようです。

一方、機械学習の素材として自身らの作品が使われることを懸念している作家も多く、自分の描いた画像が機械学習の素材として使われているのかどうかを調べるサイトHave I Been Trained?や、自分の作品を機械学習の素材として使って欲しく無いことを表明するサイトSpawningも登場しました。著作権や法律でコントロールできない部分、規定等が追いつかない部分は、倫理や配慮、業界ルールといった形で当分は対処していくことになるのかもしれません。

NovelAI Improvements on Stable Diffusion（NovelAIの改善状況の報告）

アルゴリズムの修正や内部の仕組みの開示により、クリエーター界隈に受け入れてもらえるよう、模索を進めているサービスもあり、一言で「良い」「悪い」と割り切れない事柄を、少しつづ改善し、良い状況に持っていこうと、世界中の研究者やアーティストが、ぶつかり合いながらも協力していく状況はしばらく続くのかもしれません。

本連載の今後の予定：「CGへの扉」では、単なるAIの話題とは少し異なり、CG/VFX, アートの文脈から話題を切り取り紹介していきます。映像制作の現場におけるAI活用や、AIで価値が高まった先進的なツール、これからの可能性を感じさせるような話題、テクノロジーの話題にご期待ください。なにか取り上げて欲しいテーマやご希望などがございましたら、ぜひ編集部までお知らせください。

CGへの扉：

Vol.42：現代の呪文promptが生み出すAIとの新しい関係性

Vol.41：AIが促進させるCG研究。SIGGRAPH2022論文より

Vol.40：知見の宝庫。MITの機械学習オンラインコース

Vol.39：言葉から生み出されるアートとは？

Vol.38：AIで作りAIで届ける映像作品

Vol.37：NVIDIA GTC 2022 レポート／アートとAIの視点で

Vol.36：創るためのAI〜AIと人間の創造性の未来：徳井直生氏講演レポート

Vol.35：マーベル・シネマティック・ユニバースを支える機械学習

Vol.34：注目論文よりCGの祭典 #SIGGRAPHAsia2021 を振り返る

Vol.33：AIの必然性 #SIGGRAPHAsia2021 レポート

Vol.32：Adobe Sneaks より進化の方向性を知る