モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。

TAG LIST: CG CGへの扉生成AI 安藤幸央吉本幸記月刊エンタメAIニュース河合律子機械学習ディープラーニング OpenAI LLM Google NVIDIA 大規模言語モデルグーグル GAN 音楽モリカトロン森川幸人 ChatGPT 三宅陽一郎 DeepMind 強化学習 Stable Diffusion 人工知能学会ニューラルネットワークシナリオマイクロソフト QA 自然言語処理 AIと倫理 GPT-3 倫理 Facebook 大内孝子映画 SIGGRAPH スクウェア・エニックス著作権アートキャラクターAI ルールベースゲームプレイAI Minecraft 敵対的生成ネットワーク NPC 音楽生成AI 動画生成AI モリカトロンAIラボインタビューアニメーション 3DCG 画像生成 NFT ロボットファッション DALL-E2 StyleGAN プロシージャルディープフェイクマルチモーダル VFX Midjourney 遺伝的アルゴリズムデバッグ自動生成 VR メタAI Meta 画像生成AI Red Ram マンガインタビューゲームAI Adobe Microsoft テストプレイマインクラフト CLIP テキスト画像生成深層学習 CEDEC2019 toio 教育 NeRF デジタルツインメタバース不完全情報ゲーム小説 Stability AI ボードゲーム DALL-E Sora ビヘイビア・ツリー CEDEC2021 CEDEC2020 作曲アストロノーカロボティクスナビゲーションAI 高橋力斗 AIアート Gemini メタ畳み込みニューラルネットワークアップルデジタルヒューマン ELSI Playable!スポーツエージェント GDC 2021 プロンプト GPT-4 手塚治虫汎用人工知能 JSAI2022 3D 広告 DALL-E 3 バーチャルヒューマン NVIDIA Omniverse GDC 2019 マルチエージェント CEDEC2022 市場分析 AR 懐ゲーから辿るゲームAI技術史鴫原盛之ジェネレーティブAI ソニー東京大学はこだて未来大学栗原聡 CNN マーケティング JSAI2024 CM BERT Microsoft Azure 音声認識言霊の迷宮 Unity Omniverse Ubisoft JSAI2023 Roblox がんばれ森川君2号電気通信大学 SIGGRAPH ASIA HTN Apple 階層型タスクネットワーク AIQVE ONE 世界モデルアドベンチャーゲームインディーゲーム JSAI2020 GTC2023 音声合成メタデータ TensorFlow ブロックチェーンイベントレポートキャリア模倣学習対話型エージェント Amazon サイバーエージェントトレーディングカードメディアアート DQN シーマン合成音声 SIE Runway 水野勇太モリカトロン開発者インタビュー宮本茂則アバターブラック・ジャック Genvid Technologies ガイスター StyleGAN2 徳井直生稲葉通将斎藤由多加 Open AI ベリサーブ GTC2022 GPT-3.5 YouTube 音声生成AI SF Netflix JSAI2021 松木晋祐 Bard 研究シムシティシムピープル Zork GPT-4o MCS-AI動的連携モデルマーダーミステリーモーションキャプチャー TEZUKA2020 CEDEC2023 AGI テキスト生成スパーシャルAI Electronic Arts GDC Summer イーロン・マスク論文 Stable Diffusion XL 森山和道 Audio2Face NVIDIA Riva eスポーツスタンフォード大学アーケードゲームテニスセガ人狼知能 Google I/O 類家利直 Firefly eSports BLUE PROTOCOL CEDEC2024 aibo 大澤博隆 SFプロトタイピング銭起揚 Runway Gen-3 Alpha チャットボット TikTok text-to-3D DreamFusion 自動運転車ワークショップ Epic Games AIロボ「迷キュー」に挑戦 AWS Adobe MAX 村井源クラウド AlphaZero Preferred Networks Transformer GPT-2 rinna AIりんなカメラ環世界中島秀之 PaLM GitHub Copilot LLaMA 哲学 Apple Vision Pro ハリウッド宮路洋一 Whisk 理化学研究所 Gen-1 SIGGRAPH Asia 2024 テキスト画像生成AI 松尾豊人事データマイニング ControlNet 現代アート DARPA 法律ドローンゲームエンジン Unreal Engine Imagen 人工生命バイアスサム・アルトマン Veo ASBS ぱいどん AI美空ひばり手塚眞デザイン GDC 2025 バンダイナムコ研究所 ELYZA NEDO 建築 ELIZA FSM-DNN MindAgent BIM LEFT 4 DEAD くまうた通しプレイソニー・インタラクティブエンタテインメント OpenAI Five Meshy 本間翔太馬淵浩希 Cygames 岡島学ピクサー九州大学プラチナエッグイーサリアム効果音ボエダ・ゴティエビッグデータ中嶋謙互 Amadeus Code データ分析自動翻訳 MILE NVIDIA ACE Veo 3 ナラティブ Niantic Omniverse Replicator WCCF レコメンドシステム NVIDIA DRIVE Sim WORLD CLUB Champion Football NVIDIA Isaac Sim Sakana AI 柏田知大軍事田邊雅彦トレカ慶應義塾大学 Max Cooper GPT Disney Photoshop PyTorch 京都芸術大学 ChatGPT4 モンテカルロ木探索 ByteDance 眞鍋和子バンダイナムコスタジオコミコパヒストリア AI Frog Interactive 新清士ラベル付け田中章愛 ComfyUI 齊藤陽介コナミデジタルエンタテインメント成沢理恵お知らせ Magic Leap One Tencent サッカーバスケットボール LINEヤフー Suno AI KaKa Creation VOICEVOX text-to-image サルでもわかる人工知能 VAE TEZUKA2023 DOOM リップシンキング RNN GameNGen グランツーリスモ・ソフィー Ubisoft La Forge スーパーマリオブラザーズ社員インタビュー知識表現ウォッチドッグスレギオン VTuber IGDA 立教大学秋期GTC2022 大阪公立大学 HALO フォートナイト KLab どうぶつしょうぎジェイ・コウガミ音楽ストリーミング MIT 野々下裕子 Movie Gen Qosmo マシンラーニング 5G MuZero Rival Peak pixiv オムロンサイニックエックス GPTs セキュリティ対話エンジンポケモン 3Dスキャン橋本敦史リトル・コンピュータ・ピープル Codex シーマン人工知能研究所コンピューティショナル・フォトグラフィーゴブレット・ゴブラーズ絵画 3D Gaussian Splatting Microsoft Designer イラストシミュレーション Soul Machines 柿沼太一完全情報ゲームバーチャルキャラクター坂本洋典宮本道人釜屋憲彦 LLaMA 2 ウェイポイントパス検索 Hugging Face 対談藤澤仁生物学 XR GTC 2022 xAI 画像認識 Siemens ストライキ StyleCLIP DeNA Voyager 長谷洋平 GDC 2024 クラウドコンピューティング masumi toyota IBM ぎゅわんぶらあ自己中心派 OpenSea GDC 2022 Veo 2 ウロチョロス SNS TextWorld Earth-2 Bing エコロジー Magenta ソフトバンク SONY ポケットモンスター ELYZA Pencil Scenario SIGGRAPH2023 AIピカソ GTC2021 AI素材.com CycleGAN テンセント Andreessen Horowitz QA Tech Night NetHack 下田純也桑野範久キャラクターモーション音源分離 NBA フェイクニュースユニバーサルミュージック RPG ウィル・ライト Web3 SIGGRAPH 2022 レベルデザイン DreamerV3 SIMA AIボイスアクター南カリフォルニア大学 NVIDIA Canvas GDC GPU ALife オルタナティヴ・マシンサウンドスケープ LaMDA TRPG マジック：ザ・ギャザリング AI Dungeon 介護 BitSummit Gemma 2 Cube 3D ゼビウス NetEase Inworld AI モリカトロンAIコネクトゲーム背景 IEEE Point-E アパレル不気味の谷 LoRA ナビゲーションメッシュファインチューニング早稲田大学グランツーリスモ写真高橋ミレイ北野宏明深層強化学習松原仁松井俊浩武田英明フルコトモリカコミックパックマン ELYZA DIGEST ジョージア工科大学 Apple Intelligence WWDC WWDC 2024 西成活裕ハイブリッドアーキテクチャ AI野々村真 LINE AIトークサジェスト Apex Legends 群衆マネジメントライブポートレイト GTC2025 Ninja コンピュータRPG ライブビジネス Wonder Studio Adobe Max 2023 GPT-4-turbo Fuxi Lab アップルタウン物語新型コロナ土木佐藤恵助 Naraka:Bladepoint Mobile KELDIC 周済涛 Bing Chat 大道麻由バトルロイヤルメロディ言語清田陽司インフラ Bing Image Creator 物語構造分析ビヘイビアツリーゲーム TENTUPLAY サイバネティックス慶応義塾大学 SoftServe MARVEL Future Fight Astro 人工知能史 Amazon Bedrock Assistant with Bard 渡邉謙吾 ALNAIR タイムラプス Ego4D AI哲学マップ The Arcade ここ掘れ！プッカ AMRI バスキア星新一 X.AI Search Generative Experience BLADE 日経イノベーション・ラボ StyleGAN-XL X Corp.Dynalang 濱田直希 GAGA 敵対的強化学習 StyleGAN3 Twitter VLE-CE 大柳裕⼠QUEEN 階層型強化学習 GOSU Data Lab GANimator Xホールディングス加納基晴 Runway Gen-4 WANN GOSU Voice Assistant VoLux-GAN Magi AI Act SkyReels 竹内将 SenpAI.GG Projected GAN EU 研究開発事例 Mobalytics Self-Distilled StyleGAN SDXL Ars Electronica 赤羽進亮 Stable Virtual Camera ニューラルレンダリング RTFKT AI規制遊戯王 Intangible AWS Sagemaker PLATO NIKE 欧州委員会 UDI（Universal Duel Interface）ブライアン・イーノ映像セリア・ホデント形態素解析 frame.io Clone X 欧州議会第一工科大学 Eno UX AWS Lambda Foodly 村上隆欧州理事会佐竹空良 Brain One 誤字検出 MusicLM 小林篤史 AlphaEvolve 認知科学中川友紀子 Digital Mark AudioLM Continuous Thought Machine（CTM）ゲームデザイン SentencePiece アールティ Snapchat MusicCaps 荻野宏実 Arm LUMINOUS ENGINE クリエイターコミュニティ AudioCraft 伊藤黎 Stable Audio Open Small Luminous Productions BlenderBot 3 バーチャルペットビヘイビアブランチ Word2World パターン・ランゲージ竹村也哉 Meta AI NVIDIA NeMo Service Mubert WPP STORY2GAME ちょまどマーク・ザッカーバーグヴァネッサ・ローザ Mubert Render General Computer Control（GCC）ウィットウォーターランド大学 GOAP WACUL Vanessa A Rosa Gen-2 Cradle 森川の頭の中 Adobe MAX 2021 陶芸 Runway AI Film Festival Spiral.AI 花森リド Play.ht PreViz ItakoLLM-7b Google I/O 2025 音声AI 静岡大学 AIライティング LiDAR Character-LLM 明治大学 Flow Omniverse Avatar AIのべりすと Polycam 復旦大学北原鉄朗 Lyra 2 FPS QuillBot deforum Chat-Haruhi-Suzumiya 中村栄太 MusicFX DJ マルコフ決定過程 NVIDIA Megatron Copysmith 涼宮ハルヒ日本大学 Animon.ai NVIDIA Merlin Jasper ハーベスト Emu Video ヤマハツインズひなひま NVIDIA Metropolis ForGames 前澤陽 Maya パラメータ設計ゲームマーケットペリドット増田聡 Deep Q-Learning バランス調整岡野翔太 Dream Track 採用 AlphaGO 協調フィルタリング郡山喜彦 Music AI Tools スペースインベーダーテキサス大学ジェフリー・ヒントン Lyria 科学史プリンス・オブ・ペルシャ Google I/O 2023 Yahoo!知恵袋 AIサイエンティストドラゴンクエストIV AlphaDogfight Trials AI Messenger Voicebot インタラクティブプロンプトAI Terra 堀井雄二エージェントシミュレーション OpenAI Codex 武蔵野美術大学 AI Overview 山名学 StarCraft II HyperStyle BingAI 石渡正人電通タイトー Future of Life Institute Rendering with Style 手塚プロダクション AICO2 カプコン Intel 林海象 BitSummit Drift Ubi Anvilエンジン LAIKA Disneyリサーチヴィトゲンシュタイン古川善規 V1 Video Model Rotomation GauGAN 論理哲学論考 Lightroom 大規模再構成モデル Omega Crafter Artificial Analysis GauGAN2 Canva LRM SPACE INVADIANS Video Arena ドラゴンクエストライバルズ画像言語表現モデル Objaverse 西島大介 Video Model Leaderboard 不確定ゲーム SIGGRAPH ASIA 2021 PromptBase BOOTH MVImgNet 吉田伸一郎 Claude 3.5 Dota 2 ディズニーリサーチ pixivFANBOX One-2-3-45 SIGGRAPH2024 Mistral Mitsuba2 バンダイナムコネクサス虎の穴 3Dガウシアンスプラッティング Motion-I2V JSAI2025 ソーシャルゲーム Embedding ワイツマン科学研究所ユーザーレビュー Fantia ワンショット3D生成技術 GTC2020 CG衣装 mimic とらのあな Toonify3D NVIDIA MAXINE VRファッション Baidu 集英社 FGDC 生成対向ネットワーク淡路滋ビデオ会議 Artflow ERNIE-ViLG 少年ジャンプ＋Future Game Development Conference 拡散モデルグリムノーツ Eponym 古文書 ComicCopilot 佐々木瞬 Diffusion ゴティエ・ボエダ音声クローニング凸版印刷 Gautier Boeda 階層的クラスタリング Gopher AI-OCR ゲームマスターうめ画像判定 Inowrld AI 小沢高広 Julius 鑑定 MOD Anique ドリコム TPRG Oxia Palus Ghostwriter 中村太一 ai and バーチャル・ヒューマン・エージェント toio SDK for Unity Art Recognition Skyrim エグゼリオ SaaS クーガー実況パワフルサッカースカイリム Copilot インサイト石井敦 NHC 2021 桃太郎電鉄 RPGツクールMZ カスタマーサポート茂谷保伯池田利夫桃鉄 ChatGPT_APIMZ serial experiments lain ComfyUI-AdvancedLivePortrait GDMC 新刊案内パワサカダンジョンズ&ドラゴンズ AI lain GUI マーベル・シネマティック・ユニバース Oracle RPG PCG MITメディアラボ MCU 岩倉宏介深津貴之 PCGRL アベンジャーズ PPO xVASynth Dungeons&Dragons Video to Video マジック・リープ Digital Domain Machine Learning Project Canvas Laser-NV ビートルズ iPhone 16 Magenda Masquerade2.0 国立情報学研究所ザ・ビートルズ: Get Back OpenAI o1 ノンファンジブルトークン DDSP フェイシャルキャプチャー石川冬樹 MERF Demucs AIスマートリンクスパコン Alibaba 音楽編集ソフトシャープ里井大輝 Kaggle スーパーコンピュータ VQRF Adobe Audition ウェアラブル山田暉松岡聡 nvdiffrec iZotope CE-LLM Assassin’s Creed Origins AI会話ジェネレーター TSUBAME 1.0 NeRFMeshing RX10 Communication Edge-LLM Sea of Thieves TSUBAME 2.0 LERF Moises GEMS COMPANY monoAI technology LSTM ABCI マスタリング AIペットモリカトロンAIソリューション富岳レベルファイブ Yahoo!ニュース初音ミク Oculus コード生成AI Society 5.0 リアム・ギャラガー AI Comic Factory 転移学習テスト AlphaCode 夏の電脳甲子園グライムス AI comic Generator Baldur's Gate 3 Codeforces 座談会 Boomy ComicsMaker.ai Candy Crush Saga 自己増強型AI ジョン・レジェンド Genie AI LlamaGen.ai SIGGRAPH ASIA 2020 COLMAP ザ・ウィークエンド SIGGRAPH Asia 2023 GAZAI ADOP NVIDIA GET3D ドレイク C·ASE Flame Planner デバッギング BigGAN GANverse3D FLARE 動画ゲーム生成モデル MaterialGAN ダンスグランツーリスモSPORT AI絵師エッジワークス MagicAnimate ReBeL UGC 日本音楽作家団体協議会 Animate Anyone Virtuals Protocol GTソフィー PGC FCA インテリジェントコンピュータ研究所 Volvo FIAグランツーリスモチャンピオンシップ Voicebox アリババ MarioVGG NovelAI さくらインターネット DreaMoving Rival Prak DGX A100 NovelAI Diffusion VISCUIT 松原卓二ぷよぷよ Scratch Art Transfer 2 ユービーアイソフト Webcam VTuber モーションデータスクラッチ Art Selfie 2 星新一賞ビスケット Musical Canvas 北尾まどかポーズ推定 TCG プログラミング教育 The Forever Labyrinth 将棋メタルギアソリッドV メッシュ生成 Refik Anadol FSM メルセデス・ベンツ QRコード VALL-E Alexander Reben Magic Leap 囲碁 Deepdub.ai Rhizomatiks ナップサック問題 Live Nation Epyllion デンソー AUDIOGEN Molmo 汎用言語モデル Web3.0 マシュー・ボールデンソーウェーブ Evoke Music PixMo AIOps ムーアの法則原昌宏 AutoFoley Qwen2 72B Spotify スマートコントラクト日本機械学会 Colourlab.Ai Depth Pro Replica Studio ロボティクス・メカトロニクス講演会ディズニー amuse Chitrakar Adobe MAX 2022 トヨタ自動車 Largo.ai VARIETAS 巡回セールスマン問題かんばん方式 Cinelytic AI面接官ジョルダン曲線メディア Adobe Research Taskade キリンホールディングス政治 Galactica プロット生成 Pika.art 空間コンピューティングクラウドゲーミング AI Filmmaking Assistant Dream Screen 和田洋一リアリティ番組映像解析 FastGAN SynthID Stadia ジョンソン裕子 4コママンガ AI Screenwriter Firefly Video Model MILEs NightCafe 東芝デジタルソリューションズ芥川賞 Stable Video 4D インタラクティブ・ストリーミング Luis Ruiz SATLYS 映像解析AI 文学 AI受託開発事例インタラクティブ・メディア恋愛田中志弥 PFN 3D Scan ElevenLabs タップル Playable!3D 東京工業大学 HeyGen Abema TV Playable!Mobile Ludo 博報堂 After Effects NEC Adobe MAX 2024 ラップ PFN 4D Scan 絵本木村屋 Sneaks SIGGRAPH 2019 ArtEmis Z世代 DreamUp 出版 GPT Store Illustrator AIラッパーシステム DeviantArt Ammaar Reshi 生成AIチェッカー Meta Quest 3 Waifu Diffusion Stories ユーザーローカル XR-Objects GROVER プラスリンクス～キミと繋がる想い～元素法典 StoryBird 九段理江 Peridot FAIR STC Novel AI Versed 東京都同情塔 Orion チート検出 Style Transfer Conversation ProlificDreamer 防犯オンラインカジノ RCP Unity Sentis 4Dオブジェクト生成モデル O2 RealFlow Rinna Character Platform Unity Muse Align Your Gaussians Scam Detection iPhone CALA Caleb Ward AYG Live Threat Detection Deep Fluids 宮田龍 MAV3D 乗換NAVITIME MeInGame Amelia 清河幸子ファーウェイ Kaedim AIGraph ブレイン・コンピュータ・インタフェース西中美和 4D Gaussian Splatting 3DFY.ai BCI Gatebox アフォーダンス安野貴博 4D-GS Luma AI Learning from Video ANIMAK PaLM-SayCan 斧田小夜 Glaze Avaturn 予期知能逢妻ヒカリ WebGlaze Bestat セコム NightShade Oasis ユクスキュルバーチャル警備システム Code as Policies Spawning Decart カント損保ジャパン CaP Have I Been Trained?Dejaboom!CM3leon Fortnite Unbounded 上原利之 Stable Doodle Unreal Editor For Fortnite Etched ドラゴンクエストエージェントアーキテクチャアッパーグラウンドコリジョンチェック T2I-Adapter 声優 PAIR OCTOPATH TRAVELER パブリシティ権西木康智 Volumetrics 日本俳優連合 OCTOPATH TRAVELER 大陸の覇者山口情報芸術センター［YCAM］AIワールドジェネレーター日本芸能マネージメント事業者協会アルスエレクトロニカ2019 品質保証 YCAM 日本マネジメント総合研究所 Rosebud AI Gamemaker 日本声優事業社協議会 StyleRig Autodesk アンラーニング・ランゲージ Layer IAPP 逆転オセロニア Bentley Systems カイル・マクドナルド Lily Hughes-Robinson Charisma.ai Tripo 2.0 ワールドシミュレーターローレン・リー・マッカーシー Colossal Cave Adventure Meta 3D Gen 奥村エルネスト純いただきストリート H100 鎖国［Walled Garden］プロジェクト AdventureGPT 調査スマートシティ齋藤精一大森田不可止 COBOL SIGGRAPH ASIA 2022 リリー・ヒューズ＝ロビンソン Meta Quest 都市計画高橋智隆 DGX H100 VToonify BabyAGI IP 松本雄太ロボユニザナック DGX SuperPOD ControlVAE GPT-3.5 Turbo 早瀬悠真泉幸典仁井谷正充変分オートエンコーダーカーリング強いAI Genie 2 ロボコレ2019 Instant NeRF フォトグラメトリウィンブルドン弱いAI World Labs artonomous 回帰型ニューラルネットワーク Cybever bitGANs DeepJoin 戦術分析 Third Dimension AI Azure Machine Learning Azure OpenAI Service パフォーマンス測定 Lumiere 東北大学意思決定モデル脱出ゲーム DeepL IoT UNet Gemini 2.0 Hybrid Reward Architecture コミュニティ管理 DeepL Write ProFitX ImageFX Super Phoenix Watsonx MusicFX Project Malmo オンラインゲーム Athletica TextFX フロンティアワークス気候変動コーチング機械翻訳 Project Paidia シンギュラリティ北見工業大学 Keyframer Simplified Project Lookout マックス・プランク気象研究所レイ・カーツワイル北見カーリングホール AI Voice over Generator Watch For ビョルン・スティーブンスヴァーナー・ヴィンジ画像解析 Gemini 1.5 AI Audio Enhancer 気象モデル Runway Research じりつくん AI Studio エーアイ LEFT ALIVE 気象シミュレーション Make-A-Video NTT Sportict Vertex AI AITalk 長谷川誠ジミ・ヘンドリックス環境問題 Phenaki AIカメラ Chat with RTX コエステーション Baby X カート・コバーン Dreamix STADIUM TUBE Slack ロバート・ダウニー・Jr.エイミー・ワインハウス SDGs Text-to-Imageモデル Pixelllot S3 Slack AI PlayStation Pokémon Battle Scope ダフト・パンクメモリスタ AIスマートコーチ VRML Glenn Marshall kanaeru Techno Magic The Age of A.I.Story2Hallucination 音声変換 Latitude 占いゴーストバスターズレコメンデーション Jukebox Dreambooth 行動ロジック生成AI スパイダーマン Veap Japan ヤン・ルカン Convai ポリフォニー・デジタル EAP neoAI Perfusion NTTドコモ荒牧伸志 SIFT 福井千春 DreamIcon ニューラル物理学 Ememe Project Sid DCGAN 医療 mign 毛髪 Genie Altera MOBA DANNCE メンタルケア studiffuse 荒牧英治汎用AIエージェント Robert Yang ハーバード大学 Edgar Handy 中ザワヒデキ AIファッションウィーク Razer 研修デューク大学大屋雄裕インフルエンサー Project AVA 中川裕志 Grok-1 Streamlabs mynet.ai ローグライクゲーム Adreeseen Horowitz Mixture-of-Experts Intelligent Streaming Assistant 東京理科大学 NVIDIA Avatar Cloud Engine MoE Project DIGITS 人工音声 NeurIPS 2021 産業技術総合研究所 Replica Studios Claude 3 スーパーコンピューターリザバーコンピューティング Smart NPCs Claude 3 Haiku エージェンテックプレイ動画ヒップホップ対話型AIモデル Roblox Studio Claude 3 Sonnet AI Shorts 詩ソニーマーケティング Promethean AI Claude 3 Opus テルアビブ大学サイレント映画もじぱ note 森永乳業 DiffUHaul 環境音暗号通貨 note AIアシスタント Musiio C2PA TrailBlazer FUZZLE Ketchup Endel ゲーミフィケーションヴィクトリア大学ウェリントン Alteration AI News Tomo Kihara zeroscope 粒子群最適化法 Art Selfie Playfool QNeRF 進化差分法オープンワールド Art Transfer Sonar 遊びカーネギーメロン大学群知能下川大樹 AIFA Pet Portraits Sonar+D tsukurun RALF 高津芳希 P2E Blob Opera 地方創生グラフィック大石真史クリムト Dolby Atmos 吉田直樹メイク BEiT StyleGAN-NADA Sonar Music Festival 素材 Canvas DETR ライゾマティクス Projects Spore クリティックネットワーク真鍋大度 OpenAI Japan DeepSeek デノイズ Unity for Industry アクターネットワーク花井裕也 Voice Engine DeepSeek-R1 画像処理 DMLab Ritchie Hawtin Command R+Sentropy GLIDE Control Suite Erica Synth Oracle Cloud Infrastructure Loopy CPU Discord AvatarCLIP Atari 100k Ufuk Barış Mutlu Google Workspace リップシンク Synthetic Data Atari 200M Japanese InstructBLIP Alpha Udio CyberHost CALM Yann LeCun 日本新聞協会立命館大学 OmniHuman-1 プログラミング鈴木雅大 AIいらすとや京都精華大学 CSAM ソースコード生成コンセプトアート AI Picasso TacticAI Imagen 3 GMAI シチズンデベロッパー Sonantic Colie Wertz Emposy NPMP Google Labs GitHub Cohere リドリー・スコット AIタレント FOOH Microsoft Muse ウィザードリィ MCN-AI連携モデル絵コンテ AIタレントエージェンシーゲーム生成モデル Urzas.ai ストーリーボード modi.ai Project Astra WHAMデモンストレーター大阪大学 Google I/O 2024 ChatGPT Edu 西川善司並木幸介 Kiki Blender BitSummit Let’s Go!!滋賀大学サムライスピリッツ森寅嘉 Zoetic AI SIGGRAPH 2021 ペット感情認識キリンビールストリートファイター半導体 Digital Dream Labs PaLM API デジタルレプリカ音声加工桜AIカメラ Topaz Video Enhance AI Cozmo MakerSuite GOT7 マルタ大学 Solist-AI DLSS タカラトミー Skeb synthesia 田中達大ローム山野辺一記 LOVOT Dreambooth-Stable-Diffusion HumanRF 大里飛鳥 Dynamixyz MOFLIN Actors-HQ Move AI ベンチマーク Romi Google Earth SAG-AFTRA ICRA2024 Factorio U-Net ミクシィ GEPPETTO AI WGA Hao AI Lab 13フェイズ構造ユニロボット Stable Diffusion web UI チャーリー・ブルッカー大規模基盤モデルカリフォルニア大学 ADV ユニボ Torobo GamingAgent XLand Gato 岡野原大輔東京ロボティクス Claude AI model 自己教師あり学習インピーダンス制御 Anthropic DEATH STRANDING AI Models In-Context Learning（ICL）深層予測学習 Claude 3.7 Sonnet Eric Johnson 汎用強化学習AI ZMO.AI 日立製作所 Factorio Learning Environment MOBBY’S FLE Oculus Quest コジマプロダクションロンドン芸術大学モビーディック尾形哲也 Deepseek-v3 生体情報デシマエンジン Google Brain ダイビング量子コンピュータ AIREC Gemini-2-Flash Sound Control アウトドア qubit 汎用ロボット Llama-3.3-70B SYNTH SUPER AIスキャニング IBM Quantum System 2 オムロンサイニックエックス GPT-4o-Mini 照明 Maxim Peter Karl Sims 自動採寸 ViLaIn Joshua Romoff Artnome 3DLOOK ダリオ・ヒル PDDL ZOZO NEXT ハイパースケープ ICONATE Sizer ジェン・スン・フアンニューサウスウェールズ大学 ZOZO 山崎陽斗ワコール HuggingFace Claude Sammut Fashion Intelligence System 立木創太スニーカー Stable Audio オックスフォード大学 Partial Visual-Semantic Embedding 浜中雅俊 UNSTREET 宗教 Lars Kunze WEAR ミライ小町 Newelse 仏教杉浦孔明 GPT-4V テスラ福井健策 CheckGoods コカ・コーラ田向権ソイル大学 GameGAN 二次流通食品 VASA-1 Tesla Bot 中古市場 Coca‑Cola Y3000 Zero Sugar VoxCeleb2 AIパズルジェネレーター Tesla AI Day Wikipedia Dupe Killer Copilot Copyright Commitment AniTalker DolphinGemma ソサエティ5.0 Sphere 偽ブランドテラバース上海大学 SIGGRAPH 2020 バズグラフ Xaver 1000 配信京都大学 Wild Dolphin Project ニュースタンテキ養蜂立福寛 SoundStreamトークナイザー東芝 Beewise ソニー・ピクチャーズアニメーション音声解析音声処理技術 DIB-R 倉田宜典フィンテック感情分析 Luma GPT-4.1 投資 Fosters+Partners 周済涛 Dream Machine GPT-4.1 mini 韻律射影 MILIZE Zaha Hadid Architects ステートマシン NTT GPT-4.1 nano 韻律転移三菱UFJ信託銀行ディープニューラルネットワーク Perplexity LINE AI

【CEDEC2021】ディー・エヌ・エーが推進する音声AI社会実装に関する最新事例

2021.9.28ゲーム

8月24日から26日にかけて、ゲームを中心とするコンピュータエンタメに関する技術的カンファレンス「CEDEC2021」がオンラインで開催されました。同カンファレンスにおいて、株式会社ディー・エヌ・エーの竹村伸太郎氏らは、同社の音声AIに関する取り組みを多角的に解説するセッション「エンタメから社会課題、チームで乗り越えた音声AIの研究開発と実用化」を行いました。以下では、同セッションを要約することで音声AI社会実装の最新事例を紹介します。

実装ハードルが低くなった音声合成

はじめに株式会社ディー・エヌ・エー・システム本部データ統括部AI研究開発第二グループ所属の豆谷浩輝氏は、音声合成に関する事例を発表しました。音声合成とは、テキストに人工的な音声を付与して発話させる技術です。この技術は古くから研究されており、かつての合成された音声は無機質かつ人工的なものでしたが、現在ではよりヒューマンライクな音声が合成できるようになりました。

音声合成の応用事例は多岐にわたり、実用的な分野ではロボットやスマートスピーカーの音声、そして音声広告などがあり、エンタメ分野ではVTuberやゲームの音声、さらにはオーディオブックの朗読などがあります。ディー・エヌ・エーは実用とエンタメの両分野で音声合成を実装しており、そうした事例としてセコム株式会社と共同開発した「バーチャル警備システム」やマルチメディア展開した美少女キャラコンテンツ「ハッカドール」があります。

日本語の音声合成においては、入力テキストから音素やアクセントといった言語特徴を抽出する「言語解析」、言語解析情報が入力となってスペクトログラムとして可視化できる音響特徴を生成する「音響モデル」、音響特徴を音声に変換する「ボコーダ」という3つのステップが実行されます。

音声合成においてもっとも重要となるステップが音響モデルによる処理です。この処理に関する研究はまさに日進月歩ですが、2017年に開発された「Tacotron2」は現在でも最高品質の音声を合成すると評価されています。もっとも、同モデルは過去の処理内容を継承する自己回帰型という構造を採用しているため合成が遅く、稀に壊滅的なエラーが起こるという欠点があります。また、声の高さを変えるといった操作性がないという難点もあります。

2020年に開発されたFastSpeech2も多用される音響モデルです。同モデルは合成速度が速く、声の高さなどを変えられる操作性があるのが長所です。その一方で、音質はTactron2に若干劣り、学習データにアライメントを付与する必要があるため音響に関する専門知識が求められるといった短所があります。

音声合成は、人間の肉声を学習データに使って合成音声を生成します。こうした肉声を学習する方法には、1人の話者から学習する「単一話者モデル」、複数の話者から学習する「複数話者モデル」、そして複数の話者から平均的な音声データを生成したうえでそのデータを（技術的には「Finetune」と呼ばれる）微調整して一人の話者から音声を合成したかのような結果を得る複合的な学習方法があります。もっとも高品質な結果が得られるのは複合的な学習方法ですが、手間がかかります。また、複数話者モデルと単一話者モデルを比べた場合、前者は後者より一人の話者から収録するデータが少なくて済むというメリットがあります。

前述のように人間の肉声を学習することによって音声合成が可能になるため、肉声を収録する工程が必要となります。そして、高品質な学習データを用意するためには台本が重要となります。台本の制作にあたっては、最終出力となる合成音声のキャラクター性と一致する話者（たいていは声優が担当する）を起用すべきです。また、（「プルィルークィ郡」のような）稀な音素も収録できるセリフを盛り込むのが望ましいです。さらにセリフにルビを振っておくと、音声収録の効率と精度が向上します。

音声収録体制は、少なくとも声優、ディレクター、録音技師が参加するのが一般的です。ディレクターは、「収録した音声を学習データに使えるか」を判断する役割を担います。効率的に音声を収録するには、複数音声を一度に収録してから、そのデータを文章ごとの音声に切り出すという進行が推奨されます。また、一定の調子で音声を収録するのが理想的です。

音声収録においては、データ修正も重要となります。収録中にアクセント辞典を参照しながら適宜修正することも可能ですが、この手法では収録時の負担が増大してしまいます。ディー・エヌ・エーでは、収録後にアクセントを修正する手法を採用しています。収録後修正の際には、収録音声をテキストとして可視化したうえでアクセントの位置を確認できるGUIを用意すると修正作業を効率的に進められます。

以上のように音声合成においては、開発済みの音響モデルを使えるうえに音声に関する専門知識も不要なので、現在ではかなり技術的な敷居が低くなっています。今日では技術的スキルよりも、学習データの整備のほうが重要です。とくに収録台本を新規作成するには、さまざまな工夫が必要になります。

学習データがあれば簡単に音声合成ができるので、社内で眠っている音声データが音声合成を経て新たなコンテンツとしてよみがえる可能性があります。それゆえ、音声合成の普及は潜在的な音声資産の有効活用につながるのです。

『七色ニーナ』に見る音声変換アプリ開発の現状

つづいて豆谷氏と同じくシステム本部データ統括部AI研究開発部第二グループ所属の滝口啓介氏は、音声変換に関する事例を発表しました。音声変換とは、入力した音声をほかの音声に変換する技術です。この技術を使えば、例えば発話者の音声を架空のアニメキャラのそれに変換できます。

音声変換においては、入力音声から特徴量を抽出する「音声分析処理」、抽出された音声特徴量を異なる値に変換する「音声変換処理」、変換された音声特徴量から音声波形を生成する「音声復元処理」という3つの処理が実行されます。こうした処理を実行するにあたり、入力音声を周波数領域に変換するフーリエ変換が行われます。音声変換において処理される特徴量は、この周波数領域から抽出されます。

音声変換のかなめとなる音声変換処理には、音響情報ベースのアプローチと言語情報ベースのそれがあります。音響情報ベースの音声変換では、入力音声の（スペクトログラムで表示されるような）音響情報から特徴量を抽出します。この技法ではイントネーションの情報が残りやすいので、抑揚の制御が容易となります。その一方で、声質情報も残りやすいため、声質の変換が難しくなります。音声変換においては声質の変換が重要となるため、この技法を使ったサービス開発は難しいとされています。

言語情報ベースのアプローチとは、入力音声の（音素や発音記号といった）言語に関する情報から特徴量を抽出する技法です。この技法では声質情報が残らないため、声質変換が容易となります。その反面、イントネーションも残りにくいため、抑揚の制御が難しくなります。短所があるものも声質情報を変換しやすい長所から、近年の音声変換サービスには同技法が多用されています。

ディー・エヌ・エーはエンタメ領域における音声変換の応用を推進しており、例えば動画配信における配信者音声の変換、ゲーム実況における実況者音声の変換、好きな声優になりきれるサービスなどを応用事例として考えています。そうした事例のひとつとして、2021年5月にはウェブブラウザで簡単に音声変換を体験できるサービス「七色ニーナ」をリリースしました。

七色ニーナのリリースにあたって、ディー・エヌ・エーは音声変換に関する4つの品質課題を掲げました。そうした課題とは「どんな声であっても変換可能であること」、「高品質な変換音声」、「短時間の変換による遅延の短縮」、「イントネーションも変換に反映させる」というものでした。

汎用的な音声変換を実現するために開発チームは、音声認識モデルと音声生成モデルをアーキテクチャに採用しました。音声認識モデルを採用したことにより、入力音声の話者が誰であっても適切に変換できるようになりました。

高品質な音声変換の実現にあたっては、前述したディー・エヌ・エーが手がけた音声合成事例から得られたノウハウを活用しました。音声合成を経験したことにより、音声AIの学習に必要なデータ量などの知識がすでに蓄積されていました。さらに、音声合成のために作成した学習データが流用できました。

低遅延な音声変換の実現のために、推論時間が比較的短いことで知られる非自己回帰モデルを採用しました。同モデルは、処理データの前後関係を考慮する自己回帰モデルよりシンプルな構造をしているため、処理が速いうえにモデルサイズも小さいという長所があります。

イントネーションの反映には、音声変換時にピッチ情報を付与する改良を行うことで実現しました。以上のような品質課題の達成方法をまとめると、以下のスライドのようになります。

滝口氏は、音声変換をより魅力的なものとするために追加すべき「プラスα」の要素にも言及しました。そうした要素にはさまざまな話者の音声に変換できること、音声に含まれる抑揚や感情も再現できる変換の実現、リアルタイムの音声変換によって可能となる（ボイスチャットや配信などの）双方向コンテンツの実現を挙げました。こうしたプラスαを実現できれば、音声変換の応用範囲がさらに広がることでしょう。

音声AI開発プロジェクトのノウハウ

さいごにシステム本部データ統括部AI基盤部所属の竹村伸太郎氏は、音声合成と音声変換をふくめた音声AIサービス開発プロジェクトのノウハウについて発表しました。

音声AIサービスは、音声処理を担うAIモデルのほかにもユーザデータを処理するためのサーバやユーザが使うスマホなどのエッジ端末といった複数のモジュールとデバイスから構成されています。サービスの構築にあたっては、その特徴をふまえたうえでさまざまな性能指標に関して優先順位を決定することが必要となります。こうした性能指標の優先順位決定に関して、竹村氏は3つの事例を引用しながら具体的に解説しました。

1つめの事例は前述の「七色ニーナ」です。ウェブブラウザから利用する同サービスは、ウェブニュース等で話題になることでよって、急激なアクセス数の増加が想定されます。それゆえ、最大同時接続数と定義できるスケーラビリティは可能な限り大きいことが望ましいです。また、変換した音声をユーザに返すまでに要する時間を意味するレイテンシは、リアルタイムである必要はないものも、ユーザが待てる3秒以内が望ましいです。単位時間あたりの処理音声量であるスループットは、入力される音声が最大10秒と少ないため、大きな値である必要はありません。以上を考慮すると、性能指標の優先順位は「スケーラビリティ＞レイテンシ＞スループット」となります。

2つめは、ゲーム実況者が使うようなライブ配信アプリに実装される音声AIの事例です。最近のライブ配信アプリは、音声処理をサーバ側ではなくエッジ端末側で実行するものもあります。こうしたオンデバイスAIアプリではサーバの増強が不要となるため、スケーラビリティを考慮する必要がなくなります。対して、レイテンシは非常に重要になります。というのも、処理された音声がユーザに届くまでの時間が遅いと、ライブ配信が成立しなくなるからです。スループットに関しては、一定値で安定しないとレイテンシが大きくなってしまうので軽視できません。それゆえ、性能指標の優先順位は「レイテンシ＞スループット＞スケーラビリティ」となります。

3つめの事例は、家庭で使われるような対話ロボットに実装する音声合成AIです。こうしたAIは、音声処理結果を利用するユーザはたいてい一人であるという製品の特徴により、多くのユーザに普及することが求められます。それゆえ、もっとも重要な性能指標は製品の価格に直結するコストとなります。レイテンシに関しては、対話が成立するのであれば多少の遅延は許容されます。スループットは音声AIの性能やロボットの演算能力に左右されますが、コストを犠牲にしてまで追求すべきではありません。以上より性能指標の優先順位は「コスト＞レイテンシ＞スループット」となります。

竹村氏は、チーム体制によるAI開発で役立つツールも紹介しました。そうしたツールには、AIの学習過程や実験結果を記録して共有できる「Comet.ml」、Markdownや数式も扱える情報共有ツール「Notion」、さまざまなスマホ端末を使ったテストをクラウド環境で実行できる「Firebase Test Lab」があります。