モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。

TAG LIST: CG CGへの扉生成AI 安藤幸央吉本幸記月刊エンタメAIニュース河合律子 LLM 機械学習大規模言語モデル OpenAI ディープラーニング Google グーグル音楽モリカトロン NVIDIA 森川幸人 ChatGPT GAN 三宅陽一郎 DeepMind 強化学習 Stable Diffusion 人工知能学会シナリオニューラルネットワーク QA マイクロソフト自然言語処理 SIGGRAPH AIと倫理 GPT-3 倫理スクウェア・エニックス映画アート Facebook 大内孝子音楽生成AI ルールベース著作権 3DCG 動画生成AI キャラクターAI NPC デバッグ敵対的生成ネットワークアニメーションロボットゲームプレイAI Minecraft モリカトロンAIラボインタビュープロシージャルディープフェイク NFT 画像生成 VFX ファッション StyleGAN DALL-E2 マルチモーダル Red Ram Gemini Adobe 遺伝的アルゴリズムメタAI 教育自動生成テストプレイ Midjourney VR 小説マンガ Meta Stability AI 画像生成AI GPT-4o インタビューゲームAI ボードゲーム深層学習 CEDEC2019 toio Microsoft マインクラフト CLIP テキスト画像生成 Playable!NeRF Sora 不完全情報ゲームビヘイビア・ツリー DALL-E CEDEC2021 バーチャルヒューマンデジタルツインメタバース高橋力斗作曲アストロノーカロボティクスナビゲーションAI 畳み込みニューラルネットワーク AR アップル SIGGRAPH ASIA スポーツ手塚治虫汎用人工知能 3D 広告 CEDEC2020 AIアートはこだて未来大学エージェント GDC 2021 メタ市場分析デジタルヒューマン東京大学 JSAI2022 ELSI プロンプト GPT-4 GDC 2019 マルチエージェント HTN ソニー栗原聡 CNN マーケティング懐ゲーから辿るゲームAI技術史鴫原盛之アドベンチャーゲーム NVIDIA Omniverse CEDEC2022 ジェネレーティブAI DALL-E 3 言霊の迷宮 CM 音声認識 Ubisoft 階層型タスクネットワーク YouTube JSAI2020 Microsoft Azure 模倣学習 Unity インディーゲーム音声合成 BERT Omniverse Roblox がんばれ森川君2号 Netflix GPT-3.5 AIQVE ONE 世界モデル GTC2023 JSAI2023 電気通信大学 Apple JSAI2024 ブロックチェーンイベントレポート対話型エージェント人狼知能シーマン水野勇太ガイスター斎藤由多加 SF 研究シムシティシムピープル TEZUKA2020 スパーシャルAI Electronic Arts メタデータ TensorFlow キャリア Amazon DQN SIE アバター Genvid Technologies StyleGAN2 JSAI2021 Zork MCS-AI動的連携モデルモーションキャプチャー AGI 高橋ミレイ Cygames サイバーエージェント合成音声モリカトロン開発者インタビュー宮本茂則チャットボット AWS 徳井直生 GTC2022 Unreal Engine テキスト生成デザイントレーディングカードメディアアート text-to-image Adobe MAX Open AI ベリサーブ音声生成AI 松木晋祐 Bard ControlNet ブラック・ジャック村井源稲葉通将マーダーミステリー CEDEC2023 LoRA XR Veo Runway GPT-5 Amadeus Code eSports ワークショップクラウド AlphaZero AIりんなカメラ環世界中島秀之宮路洋一理化学研究所テンセント人事 DARPA ドローン人工生命 ASBS ぱいどん AI美空ひばり手塚眞 GDC Summer 岡島学 eスポーツスタンフォード大学テニス BLUE PROTOCOL aibo 銭起揚自動運転車 Transformer GPT-2 シミュレーション哲学現代アートバンダイナムコ研究所 ELYZA NVIDIA Riva Epic Games rinna SNS 松尾豊データマイニングゲームエンジン Imagen バイアスサム・アルトマン NEDO 森山和道自動翻訳アーケードゲームセガ類家利直大澤博隆 SFプロトタイピングコナミデジタルエンタテインメント text-to-3D DreamFusion AIロボ「迷キュー」に挑戦 Preferred Networks PaLM GitHub Copilot Gen-1 大阪大学建築イーロン・マスク Stable Diffusion XL Audio2Face Google I/O Firefly TikTok 立教大学 KLab LLaMA ハリウッドテキスト画像生成AI ユニバーサルミュージック法律論文 Niantic 新清士 Apple Vision Pro ByteDance CEDEC2024 Runway Gen-3 Alpha スーパーマリオブラザーズ Whisk SIGGRAPH Asia 2024 DeepSeek モリカトロンAIコネクト GDC 2025 モリカコミック Veo 3 JSAI2025 OpenAI o3 CEDEC2025 Sora 2 OpenAI Five ピクサービッグデータナラティブエージェントシミュレーション眞鍋和子齊藤陽介成沢理恵お知らせ Magic Leap One サルでもわかる人工知能リップシンキング Ubisoft La Forge 知識表現 IGDA どうぶつしょうぎジェイ・コウガミ音楽ストリーミングマシンラーニング 5G 対話エンジンシーマン人工知能研究所ゴブレット・ゴブラーズ完全情報ゲームウェイポイントパス検索藤澤仁画像認識 DeNA 長谷洋平ぎゅわんぶらあ自己中心派ウロチョロス NBA フェイクニュースウィル・ライトレベルデザイン GPU ALife オルタナティヴ・マシンサウンドスケープ TRPG AI Dungeon ゼビウス不気味の谷写真松井俊浩パックマン通しプレイ本間翔太馬淵浩希中嶋謙互レコメンドシステム軍事 PyTorch モンテカルロ木探索バンダイナムコスタジオ田中章愛サッカーバスケットボール VAE RNN ウォッチドッグスレギオン HALO MIT MuZero Rival Peak リトル・コンピュータ・ピープルコンピューティショナル・フォトグラフィー絵画坂本洋典釜屋憲彦生物学 StyleCLIP masumi toyota TextWorld Bing Magenta GTC2021 CycleGAN NetHack AIボイスアクター南カリフォルニア大学 NVIDIA Canvas NetEase ナビゲーションメッシュ深層強化学習 ELYZA DIGEST ELIZA LEFT 4 DEAD プラチナエッグイーサリアムボエダ・ゴティエ Omniverse Replicator NVIDIA DRIVE Sim NVIDIA Isaac Sim Disney AI会話ジェネレーターグランツーリスモ・ソフィー VTuber フォートナイト Qosmo ポケモン Codex Soul Machines バーチャルキャラクター対談 GTC 2022 Siemens クラウドコンピューティング OpenSea GDC 2022 Earth-2 エコロジー ELYZA Pencil 医療キャラクターモーション RPG SIGGRAPH 2022 LaMDA マジック：ザ・ギャザリング介護 Romi 松原仁武田英明フルコトデータ分析 MILE WCCF WORLD CLUB Champion Football 柏田知大田邊雅彦トレカ Max Cooper 京都芸術大学ラベル付け秋期GTC2022 野々下裕子 pixiv セキュリティ 3Dスキャン Microsoft Designer イラスト柿沼太一 Scenario AIピカソ AI素材.com Andreessen Horowitz QA Tech Night 下田純也桑野範久 DreamerV3 Blender ゲーム背景 Point-E アパレル BIM GPT Photoshop ChatGPT4 コミコパ Tencent TEZUKA2023 大阪公立大学オムロンサイニックエックス FastGAN 橋本敦史宮本道人 LLaMA 2 Hugging Face xAI ストライキ Voyager IBM ソフトバンク SIGGRAPH2023 音源分離 Web3 BitSummit ファインチューニンググランツーリスモ量子コンピュータ北野宏明立福寛 FSM-DNN MindAgent 効果音 NVIDIA ACE 慶應義塾大学ヒストリア AI Frog Interactive ComfyUI Suno AI KaKa Creation VOICEVOX GPTs 3D Gaussian Splatting GDC 2024 ポケットモンスターインフルエンサー SIMA Gemma 2 Inworld AI IEEE 早稲田大学 Apple Intelligence WWDC WWDC 2024 Perplexity くまうた濱田直希ソニー・インタラクティブエンタテインメント遊戯王佐竹空良九州大学伊藤黎 Sakana AI LINEヤフー DOOM GameNGen 社員インタビュー Movie Gen SynthID Playable!Mobile Sneaks Peridot 声優早瀬悠真 Veo 2 SONY Project Sid Razer GDC Cube 3D ベンチマーク Hao AI Lab Claude ジョージア工科大学 Meshy Flow Gemini 2.5-pro Gemini 2.5 Flash Image Keep4o Nano Banana EXPO2025 大阪・関西万博アトラクチャー中村政義森旭彦 Veo 3.1 はらぺこミーム SIGGRAPH Asia 2025 ゲーム映像パラメータ設計バランス調整 Dota 2 ソーシャルゲーム淡路滋グリムノーツゴティエ・ボエダ Gautier Boeda Julius TPRG バーチャル・ヒューマン・エージェントクーガー石井敦茂谷保伯マジック・リープノンファンジブルトークン里井大輝 GEMS COMPANY 初音ミク転移学習デバッギング北尾まどか将棋ナップサック問題 Spotify Replica Studio amuse クラウドゲーミング和田洋一 Stadia SIGGRAPH 2019 iPhone AIGraph 予期知能ドラゴンクエスト PAIR アルスエレクトロニカ2019 逆転オセロニア奥村エルネスト純齋藤精一高橋智隆ロボユニ泉幸典ロボコレ2019 意思決定モデル LEFT ALIVE 長谷川誠 Baby X ロバート・ダウニー・Jr.The Age of A.I.レコメンデーション MOBA 研修 mynet.ai 人工音声プレイ動画群知能 Spore デノイズ画像処理 CPU GMAI ウィザードリィ西川善司サムライスピリッツストリートファイター山野辺一記大里飛鳥 13フェイズ構造 Oculus Quest 生体情報照明山崎陽斗立木創太 GameGAN ソサエティ5.0 SIGGRAPH 2020 DIB-R Apex Legends Ninja TENTUPLAY MARVEL Future Fight タイムラプスバスキア階層型強化学習 WANN 竹内将セリア・ホデント UX 認知科学ゲームデザイン LUMINOUS ENGINE Luminous Productions パターン・ランゲージちょまど FPS マルコフ決定過程協調フィルタリング AlphaDogfight Trials StarCraft II Future of Life Institute Intel LAIKA Rotomation ドラゴンクエストライバルズ不確定ゲーム Embedding GTC2020 NVIDIA MAXINE ビデオ会議階層的クラスタリング toio SDK for Unity GDMC MITメディアラボ Magenda DDSP Kaggle Assassin’s Creed Origins Sea of Thieves monoAI technology Oculus テスト Baldur's Gate 3 Candy Crush Saga SIGGRAPH ASIA 2020 BigGAN MaterialGAN ReBeL Volvo Rival Prak ユービーアイソフトメタルギアソリッドV FSM 汎用言語モデル Chitrakar 巡回セールスマン問題ジョルダン曲線リアリティ番組ジョンソン裕子 MILEs インタラクティブ・ストリーミングインタラクティブ・メディア Ludo ArtEmis GROVER FAIR チート検出オンラインカジノ RealFlow Deep Fluids MeInGame ブレイン・コンピュータ・インタフェース BCI Learning from Video ユクスキュルカントエージェントアーキテクチャ OCTOPATH TRAVELER 西木康智 OCTOPATH TRAVELER 大陸の覇者 StyleRig いただきストリート大森田不可止ザナック仁井谷正充 Azure Machine Learning 脱出ゲーム Hybrid Reward Architecture Super Phoenix Project Malmo Project Paidia Project Lookout Watch For ジミ・ヘンドリックスカート・コバーンエイミー・ワインハウスダフト・パンク Glenn Marshall Story2Hallucination Jukebox SIFT DCGAN DANNCE ハーバード大学デューク大学ローグライクゲーム NeurIPS 2021 ヒップホップ詩サイレント映画環境音粒子群最適化法進化差分法下川大樹高津芳希大石真史 BEiT DETR Sentropy Discord CALM プログラミングソースコード生成シチズンデベロッパー GitHub MCN-AI連携モデル並木幸介森寅嘉 SIGGRAPH 2021 半導体 Topaz Video Enhance AI DLSS Dynamixyz U-Net ADV XLand DEATH STRANDING Eric Johnson コジマプロダクションデシマエンジン Maxim Peter Joshua Romoff ハイパースケープミライ小町テスラ Tesla Bot Tesla AI Day バズグラフニュースタンテキ東芝倉田宜典韻律射影韻律転移コンピュータRPG アップルタウン物語 KELDIC メロディ言語 Astro Ego4D 日経イノベーション・ラボ敵対的強化学習 GOSU Data Lab GOSU Voice Assistant SenpAI.GG Mobalytics AWS Sagemaker 形態素解析 AWS Lambda 誤字検出 SentencePiece 竹村也哉 GOAP Adobe MAX 2021 Omniverse Avatar NVIDIA Megatron NVIDIA Merlin NVIDIA Metropolis テキサス大学 AI Messenger Voicebot OpenAI Codex HyperStyle Rendering with Style Disneyリサーチ GauGAN GauGAN2 画像言語表現モデル SIGGRAPH ASIA 2021 ディズニーリサーチ Mitsuba2 ワイツマン科学研究所 CG衣装 VRファッション Artflow Eponym 音声クローニング Gopher 鑑定 Oxia Palus Art Recognition NHC 2021 池田利夫新刊案内マーベル・シネマティック・ユニバース MCU アベンジャーズ Digital Domain Masquerade2.0 フェイシャルキャプチャー山田暉 LSTM モリカトロンAIソリューションコード生成AI AlphaCode Codeforces 自己増強型AI COLMAP ADOP GANverse3D グランツーリスモSPORT GTソフィー FIAグランツーリスモチャンピオンシップ DGX A100 Webcam VTuber 星新一賞 Live Nation Web3.0 AIOps スマートコントラクトメディア政治 NightCafe Luis Ruiz 東京工業大学博報堂ラップ Z世代 AIラッパーシステムプラスリンクス～キミと繋がる想い～STC Style Transfer Conversation RCP Rinna Character Platform Amelia Gatebox ANIMAK 逢妻ヒカリセコムバーチャル警備システム損保ジャパン上原利之アッパーグラウンド品質保証 Autodesk Bentley Systems ワールドシミュレーター H100 COBOL DGX H100 DGX SuperPOD Instant NeRF artonomous bitGANs コミュニティ管理オンラインゲーム気候変動マックス・プランク気象研究所ビョルン・スティーブンス気象モデル気象シミュレーション環境問題 SDGs メモリスタ音声変換 Veap Japan EAP 福井千春メンタルケア Edgar Handy 東京理科大学産業技術総合研究所リザバーコンピューティングソニーマーケティングもじぱ暗号通貨 FUZZLE Alteration オープンワールド AIFA P2E StyleGAN-NADA Unity for Industry GLIDE AvatarCLIP Synthetic Data Sonantic Cohere Urzas.ai Kiki Zoetic AI ペット Digital Dream Labs Cozmo タカラトミー LOVOT MOFLIN ミクシィユニロボットユニボ Gato 汎用強化学習AI ロンドン芸術大学 Google Brain Sound Control SYNTH SUPER Karl Sims Artnome ICONATE 浜中雅俊福井健策 Wikipedia Sphere Xaver 1000 養蜂 Beewise フィンテック投資 MILIZE 三菱UFJ信託銀行西成活裕群衆マネジメントライブビジネス新型コロナ周済涛清田陽司サイバネティックス人工知能史 AI哲学マップ星新一 StyleGAN-XL StyleGAN3 GANimator VoLux-GAN Projected GAN Self-Distilled StyleGAN ニューラルレンダリング PLATO frame.io Foodly 中川友紀子アールティ BlenderBot 3 Meta AI マーク・ザッカーバーグ WACUL AIライティング AIのべりすと QuillBot Copysmith Jasper ヴィトゲンシュタイン論理哲学論考 PromptBase バンダイナムコネクサスユーザーレビュー mimic Baidu ERNIE-ViLG 古文書凸版印刷 AI-OCR 画像判定実況パワフルサッカー桃太郎電鉄桃鉄パワサカ岩倉宏介 PPO Machine Learning Project Canvas 国立情報学研究所石川冬樹スパコンスーパーコンピュータ松岡聡 TSUBAME 1.0 TSUBAME 2.0 ABCI 富岳 Society 5.0 夏の電脳甲子園座談会 NVIDIA GET3D AI絵師 UGC PGC NovelAI NovelAI Diffusion モーションデータポーズ推定メッシュ生成メルセデス・ベンツ Magic Leap Epyllion マシュー・ボールムーアの法則 Adobe MAX 2022 Adobe Research Galactica 映像解析東芝デジタルソリューションズ SATLYS 映像解析AI PFN 3D Scan PFN 4D Scan DreamUp DeviantArt Waifu Diffusion 元素法典 Novel AI CALA アフォーダンス PaLM-SayCan Code as Policies CaP コリジョンチェック山口情報芸術センター［YCAM］YCAM アンラーニング・ランゲージカイル・マクドナルドローレン・リー・マッカーシー鎖国［Walled Garden］プロジェクト SIGGRAPH ASIA 2022 VToonify ControlVAE 変分オートエンコーダーフォトグラメトリ回帰型ニューラルネットワーク DeepJoin Azure OpenAI Service DeepL DeepL Write シンギュラリティレイ・カーツワイルヴァーナー・ヴィンジ Runway Research Make-A-Video Phenaki Dreamix Text-to-Imageモデル Latitude neoAI DreamIcon mign studiffuse 対話型AIモデル note note AIアシスタント Ketchup AI News Art Selfie Art Transfer Pet Portraits Blob Opera クリムトクリティックネットワークアクターネットワーク DMLab Control Suite Atari 100k Atari 200M Yann LeCun 鈴木雅大コンセプトアート Colie Wertz リドリー・スコット絵コンテストーリーボード PaLM API MakerSuite Skeb Dreambooth-Stable-Diffusion Google Earth GEPPETTO AI Stable Diffusion web UI AI model AI Models ZMO.AI MOBBY’S モビーディックダイビングアウトドア AIスキャニング自動採寸 3DLOOK Sizer ワコールスニーカー UNSTREET Newelse CheckGoods 二次流通中古市場 Dupe Killer 偽ブランド配信ソニー・ピクチャーズアニメーション Fosters+Partners Zaha Hadid Architects ライブポートレイト Wonder Studio 土木インフラ Amazon Bedrock X.AI X Corp.Twitter Xホールディングス Magi SDXL RTFKT NIKE Clone X 村上隆 Digital Mark Snapchat クリエイターコミュニティバーチャルペット NVIDIA NeMo Service ヴァネッサ・ローザ Vanessa A Rosa 陶芸 Play.ht 音声AI LiDAR Polycam deforum ハーベスト ForGames ゲームマーケット岡野翔太郡山喜彦ジェフリー・ヒントン Google I/O 2023 武蔵野美術大学 BingAI Lightroom Canva BOOTH pixivFANBOX 虎の穴 Fantia とらのあな集英社少年ジャンプ＋ComicCopilot ゲームマスター Inowrld AI MOD Ghostwriter Skyrim スカイリム RPGツクールMZ ChatGPT_APIMZ ダンジョンズ&ドラゴンズ Oracle RPG 深津貴之 xVASynth Laser-NV MERF Alibaba VQRF nvdiffrec NeRFMeshing LERF マスタリングリアム・ギャラガーグライムス Boomy ジョン・レジェンドザ・ウィークエンドドレイクエッジワークス日本音楽作家団体協議会 FCA Voicebox さくらインターネットぷよぷよ TCG QRコード囲碁デンソーデンソーウェーブ原昌宏日本機械学会ロボティクス・メカトロニクス講演会トヨタ自動車かんばん方式プロット生成 4コママンガ ElevenLabs HeyGen After Effects 絵本出版 Ammaar Reshi Stories StoryBird Versed ProlificDreamer Unity Sentis Unity Muse Caleb Ward 宮田龍清河幸子西中美和安野貴博斧田小夜 CM3leon Stable Doodle T2I-Adapter 日本マネジメント総合研究所 Lily Hughes-Robinson Colossal Cave Adventure AdventureGPT リリー・ヒューズ＝ロビンソン BabyAGI GPT-3.5 Turbo カーリングウィンブルドン戦術分析パフォーマンス測定 IoT ProFitX Watsonx Athletica コーチング北見工業大学北見カーリングホール画像解析じりつくん NTT Sportict AIカメラ STADIUM TUBE Pixelllot S3 AIスマートコーチ Dreambooth ヤン・ルカン Perfusion ニューラル物理学毛髪荒牧英治中ザワヒデキ大屋雄裕中川裕志 Adreeseen Horowitz NVIDIA Avatar Cloud Engine Replica Studios Smart NPCs Roblox Studio Promethean AI Musiio Endel Sonar Sonar+D Dolby Atmos Sonar Music Festival ライゾマティクス真鍋大度花井裕也 Ritchie Hawtin Erica Synth Ufuk Barış Mutlu Japanese InstructBLIP Alpha 日本新聞協会 AIいらすとや AI Picasso Emposy AIタレント AIタレントエージェンシー modi.ai BitSummit Let’s Go!!デジタルレプリカ GOT7 synthesia HumanRF Actors-HQ SAG-AFTRA WGA チャーリー・ブルッカー岡野原大輔自己教師あり学習 In-Context Learning（ICL）qubit IBM Quantum System 2 ダリオ・ヒルジェン・スン・フアン HuggingFace Stable Audio 宗教仏教コカ・コーラ食品 Coca‑Cola Y3000 Zero Sugar Copilot Copyright Commitment テラバース京都大学音声解析感情分析周済涛ステートマシンディープニューラルネットワークハイブリッドアーキテクチャ Adobe Max 2023 Bing Chat Bing Image Creator Assistant with Bard The Arcade Search Generative Experience Dynalang VLE-CE AI Act EU Ars Electronica AI規制欧州委員会欧州議会欧州理事会 MusicLM AudioLM MusicCaps AudioCraft Mubert Mubert Render Gen-2 Runway AI Film Festival PreViz Character-LLM 復旦大学 Chat-Haruhi-Suzumiya 涼宮ハルヒ Emu Video ペリドット Dream Track Music AI Tools Lyria Yahoo!知恵袋インタラクティブプロンプトAI 石渡正人手塚プロダクション林海象古川善規大規模再構成モデル LRM Objaverse MVImgNet One-2-3-45 3Dガウシアンスプラッティングワンショット3D生成技術 FGDC Future Game Development Conference 佐々木瞬 Anique 中村太一エグゼリオ Copilot serial experiments lain AI lain PCG PCGRL Dungeons&Dragons ビートルズザ・ビートルズ: Get Back Demucs 音楽編集ソフト Adobe Audition iZotope RX10 Moises レベルファイブ Genie AI SIGGRAPH Asia 2023 C·ASE FLARE ダンス MagicAnimate Animate Anyone インテリジェントコンピュータ研究所アリババ DreaMoving VISCUIT Scratch スクラッチビスケットプログラミング教育 VALL-E Deepdub.ai AUDIOGEN Evoke Music AutoFoley Colourlab.Ai ディズニー Largo.ai Cinelytic Taskade Pika.art AI Filmmaking Assistant AI Screenwriter 芥川賞文学恋愛タップル Abema TV NEC 木村屋 GPT Store 生成AIチェッカーユーザーローカル九段理江東京都同情塔 4Dオブジェクト生成モデル Align Your Gaussians AYG MAV3D ファーウェイ 4D Gaussian Splatting 4D-GS Glaze WebGlaze NightShade Spawning Have I Been Trained?Fortnite Unreal Editor For Fortnite Volumetrics AIワールドジェネレーター Rosebud AI Gamemaker Layer Charisma.ai 調査 Meta Quest IP 強いAI 弱いAI Lumiere UNet ImageFX MusicFX TextFX Keyframer Gemini 1.5 AI Studio Vertex AI Chat with RTX Slack Slack AI Pokémon Battle Scope kanaeru 占い行動ロジック生成AI Convai NTTドコモ Ememe Genie 汎用AIエージェント AIファッションウィーク Grok-1 Mixture-of-Experts MoE Claude 3 Claude 3 Haiku Claude 3 Sonnet Claude 3 Opus 森永乳業 C2PA ゲーミフィケーション Tomo Kihara Playfool 遊び tsukurun 地方創生吉田直樹素材 OpenAI Japan Voice Engine Command R+Oracle Cloud Infrastructure Google Workspace Udio 立命館大学京都精華大学 TacticAI NPMP FOOH Project Astra Google I/O 2024 感情認識音声加工マルタ大学田中達大 Move AI ICRA2024 大規模基盤モデル Torobo 東京ロボティクスインピーダンス制御深層予測学習日立製作所尾形哲也 AIREC 汎用ロボットオムロンサイニックエックス ViLaIn PDDL ニューサウスウェールズ大学 Claude Sammut オックスフォード大学 Lars Kunze 杉浦孔明田向権 VASA-1 VoxCeleb2 AniTalker 上海大学 Luma Dream Machine NTT AI野々村真 GPT-4-turbo 佐藤恵助大道麻由物語構造分析慶応義塾大学渡邉謙吾ここ掘れ！プッカ大柳裕⼠加納基晴研究開発事例赤羽進亮 UDI（Universal Duel Interface）第一工科大学小林篤史荻野宏実ビヘイビアブランチ WPP General Computer Control（GCC）Cradle Spiral.AI ItakoLLM-7b 静岡大学明治大学北原鉄朗中村栄太日本大学ヤマハ前澤陽増田聡採用科学史 AIサイエンティスト Terra AI Overview 電通 AICO2 BitSummit Drift Omega Crafter SPACE INVADIANS 西島大介吉田伸一郎 SIGGRAPH2024 Motion-I2V Toonify3D 生成対向ネットワーク拡散モデル Diffusion うめ小沢高広ドリコム ai and SaaS インサイトカスタマーサポート ComfyUI-AdvancedLivePortrait GUI Video to Video iPhone 16 OpenAI o1 AIスマートリンクシャープウェアラブル CE-LLM Communication Edge-LLM AIペット Yahoo!ニュース AI Comic Factory AI comic Generator ComicsMaker.ai LlamaGen.ai GAZAI Flame Planner 動画ゲーム生成モデル Virtuals Protocol MarioVGG 松原卓二 Art Transfer 2 Art Selfie 2 Musical Canvas The Forever Labyrinth Refik Anadol Alexander Reben Rhizomatiks Molmo PixMo Qwen2 72B Depth Pro VARIETAS AI面接官キリンホールディングス空間コンピューティング Dream Screen Firefly Video Model Stable Video 4D AI受託開発事例田中志弥 Playable!3D Adobe MAX 2024 Illustrator Meta Quest 3 XR-Objects Orion 防犯 O2 Scam Detection Live Threat Detection 乗換NAVITIME Kaedim 3DFY.ai Luma AI Avaturn Bestat Oasis Decart Dejaboom!Unbounded Etched パブリシティ権日本俳優連合日本芸能マネージメント事業者協会日本声優事業社協議会 IAPP Tripo 2.0 Meta 3D Gen スマートシティ都市計画松本雄太 Genie 2 World Labs Cybever Third Dimension AI 東北大学 Gemini 2.0 フロンティアワークス機械翻訳 Simplified AI Voice over Generator AI Audio Enhancer エーアイ AITalk コエステーション PlayStation VRML Techno Magic ゴーストバスターズスパイダーマンポリフォニー・デジタル荒牧伸志 Altera Robert Yang Project AVA Streamlabs Intelligent Streaming Assistant Project DIGITS スーパーコンピューターエージェンテック AI Shorts テルアビブ大学 DiffUHaul TrailBlazer ヴィクトリア大学ウェリントン zeroscope QNeRF カーネギーメロン大学 RALF グラフィックメイク Canvas Projects DeepSeek-R1 Loopy リップシンク CyberHost OmniHuman-1 CSAM Imagen 3 Google Labs Microsoft Muse ゲーム生成モデル WHAMデモンストレーター ChatGPT Edu 滋賀大学キリンビール桜AIカメラ Solist-AI ローム Factorio カリフォルニア大学 GamingAgent Anthropic Claude 3.7 Sonnet Factorio Learning Environment FLE Deepseek-v3 Gemini-2-Flash Llama-3.3-70B GPT-4o-Mini ZOZO NEXT ZOZO Fashion Intelligence System Partial Visual-Semantic Embedding WEAR GPT-4V ソイル大学 AIパズルジェネレーター DolphinGemma Wild Dolphin Project SoundStreamトークナイザー音声処理技術 GPT-4.1 GPT-4.1 mini GPT-4.1 nano LINE AI LINE AIトークサジェスト GTC2025 Fuxi Lab Naraka:Bladepoint Mobile バトルロイヤルビヘイビアツリー SoftServe ALNAIR AMRI BLADE GAGA QUEEN Runway Gen-4 SkyReels Stable Virtual Camera Intangible ブライアン・イーノ Eno Brain One AlphaEvolve Continuous Thought Machine（CTM）Arm Stable Audio Open Small Word2World STORY2GAME ウィットウォーターランド大学森川の頭の中花森リド Google I/O 2025 Lyra 2 MusicFX DJ Animon.ai ツインズひなひま Maya Deep Q-Learning AlphaGO スペースインベーダープリンス・オブ・ペルシャドラゴンクエストIV 堀井雄二山名学タイトーカプコン Ubi Anvilエンジン V1 Video Model Artificial Analysis Video Arena Video Model Leaderboard Claude 3.5 Mistral 樋口恭介 Claude 4 小川昴ホラーゲーム Stable Diffusion 1.5 階層型物語構造夏目漱石漱石書簡京都情報大学院大学上野未貴ブラウザ Comet Kiro Aww Inc.Visual Bank THE PEN FUJIYAMA AI SOUND 富士通西浦めめヘッドウォータース下斗米貴之ディプロマシー Cluade Opus 4 ChatGPT o3 カリフォルニア大学サンディエゴ校 Every テトリス逆転裁判ロゼッタ広報 Mavericks NoLang 4.0 gpt-oss 金井大組織作り Cygnus Taurus 笠原達也バグチケット都築圭太仁木一順ライフレビュー SIGGRAPH 2025 Text-to-Motion Miegakure Side International Razer Cortex: Playtest Program - Powered by Side Stable Audio 2.5 Veo 3 Fast Genie 3 Dynamics Lab Magica 2 Mirage 2 ペンシルバニア大学コーネル大学 HOLODECK 2.0 市場調査 Googleクラウドゲームエイト Q-STAR 小栗伸重藤井啓祐水野弘之 AnimeGamer 香港城市大学ニューヨーク大学 God's Innovation Project GIP マインドスポーツチェス Grok 4 華南理工大学池上⾼志ミュージックビデオ TOWA TEI 椎名林檎中村剛森山尋西健一スキップ E-ONE PICTOY 任天堂ギフトピアちびロボ！いきものづくりクリエイトーイ大盛り！いきものづくりクリエイトーイドラゴンリーグドラゴンポーカー城とドラゴン koROBO コンパニオンAI character.ai Nomi.ai META LOOP DESIGN LTD.MEO HiClub SynClub Starley Cotomo Livetoon kaiwa コンパニオンロボットヒューマノイド Realbotix 顔認識 Cluade 1X NEO ジュネーブ大学 Nadine MIXI Panasonic NICOBO Gemini Robotics 1.5 XR Blocks LLMER ペンシルバニア州立大学 SIMA 2 日本IBM シリアスゲームセガXD AI俳優世永玲生 Adobe MAX 2025 Gemini 3 GenTabs Disco イレブンラボジャパン日本郵便年賀状 #Geminiで年賀状 Nano Banana Pro ENCODE Jewelry Planner (AI)EncodeRing Jewelry Designer Story Jewelry Designer AI JEWELRY MODEL 中国・西安交通大学 LacAIDes 工芸宝飾品ソウル文化高等学校 MineDojo Text-to-Video OmnimatteZero Snap X-UniMotion DreamO

【CEDEC2021】ディー・エヌ・エーが推進する音声AI社会実装に関する最新事例

2021.9.28ゲーム

8月24日から26日にかけて、ゲームを中心とするコンピュータエンタメに関する技術的カンファレンス「CEDEC2021」がオンラインで開催されました。同カンファレンスにおいて、株式会社ディー・エヌ・エーの竹村伸太郎氏らは、同社の音声AIに関する取り組みを多角的に解説するセッション「エンタメから社会課題、チームで乗り越えた音声AIの研究開発と実用化」を行いました。以下では、同セッションを要約することで音声AI社会実装の最新事例を紹介します。

実装ハードルが低くなった音声合成

はじめに株式会社ディー・エヌ・エー・システム本部データ統括部AI研究開発第二グループ所属の豆谷浩輝氏は、音声合成に関する事例を発表しました。音声合成とは、テキストに人工的な音声を付与して発話させる技術です。この技術は古くから研究されており、かつての合成された音声は無機質かつ人工的なものでしたが、現在ではよりヒューマンライクな音声が合成できるようになりました。

音声合成の応用事例は多岐にわたり、実用的な分野ではロボットやスマートスピーカーの音声、そして音声広告などがあり、エンタメ分野ではVTuberやゲームの音声、さらにはオーディオブックの朗読などがあります。ディー・エヌ・エーは実用とエンタメの両分野で音声合成を実装しており、そうした事例としてセコム株式会社と共同開発した「バーチャル警備システム」やマルチメディア展開した美少女キャラコンテンツ「ハッカドール」があります。

日本語の音声合成においては、入力テキストから音素やアクセントといった言語特徴を抽出する「言語解析」、言語解析情報が入力となってスペクトログラムとして可視化できる音響特徴を生成する「音響モデル」、音響特徴を音声に変換する「ボコーダ」という3つのステップが実行されます。

音声合成においてもっとも重要となるステップが音響モデルによる処理です。この処理に関する研究はまさに日進月歩ですが、2017年に開発された「Tacotron2」は現在でも最高品質の音声を合成すると評価されています。もっとも、同モデルは過去の処理内容を継承する自己回帰型という構造を採用しているため合成が遅く、稀に壊滅的なエラーが起こるという欠点があります。また、声の高さを変えるといった操作性がないという難点もあります。

2020年に開発されたFastSpeech2も多用される音響モデルです。同モデルは合成速度が速く、声の高さなどを変えられる操作性があるのが長所です。その一方で、音質はTactron2に若干劣り、学習データにアライメントを付与する必要があるため音響に関する専門知識が求められるといった短所があります。

音声合成は、人間の肉声を学習データに使って合成音声を生成します。こうした肉声を学習する方法には、1人の話者から学習する「単一話者モデル」、複数の話者から学習する「複数話者モデル」、そして複数の話者から平均的な音声データを生成したうえでそのデータを（技術的には「Finetune」と呼ばれる）微調整して一人の話者から音声を合成したかのような結果を得る複合的な学習方法があります。もっとも高品質な結果が得られるのは複合的な学習方法ですが、手間がかかります。また、複数話者モデルと単一話者モデルを比べた場合、前者は後者より一人の話者から収録するデータが少なくて済むというメリットがあります。

前述のように人間の肉声を学習することによって音声合成が可能になるため、肉声を収録する工程が必要となります。そして、高品質な学習データを用意するためには台本が重要となります。台本の制作にあたっては、最終出力となる合成音声のキャラクター性と一致する話者（たいていは声優が担当する）を起用すべきです。また、（「プルィルークィ郡」のような）稀な音素も収録できるセリフを盛り込むのが望ましいです。さらにセリフにルビを振っておくと、音声収録の効率と精度が向上します。

音声収録体制は、少なくとも声優、ディレクター、録音技師が参加するのが一般的です。ディレクターは、「収録した音声を学習データに使えるか」を判断する役割を担います。効率的に音声を収録するには、複数音声を一度に収録してから、そのデータを文章ごとの音声に切り出すという進行が推奨されます。また、一定の調子で音声を収録するのが理想的です。

音声収録においては、データ修正も重要となります。収録中にアクセント辞典を参照しながら適宜修正することも可能ですが、この手法では収録時の負担が増大してしまいます。ディー・エヌ・エーでは、収録後にアクセントを修正する手法を採用しています。収録後修正の際には、収録音声をテキストとして可視化したうえでアクセントの位置を確認できるGUIを用意すると修正作業を効率的に進められます。

以上のように音声合成においては、開発済みの音響モデルを使えるうえに音声に関する専門知識も不要なので、現在ではかなり技術的な敷居が低くなっています。今日では技術的スキルよりも、学習データの整備のほうが重要です。とくに収録台本を新規作成するには、さまざまな工夫が必要になります。

学習データがあれば簡単に音声合成ができるので、社内で眠っている音声データが音声合成を経て新たなコンテンツとしてよみがえる可能性があります。それゆえ、音声合成の普及は潜在的な音声資産の有効活用につながるのです。

『七色ニーナ』に見る音声変換アプリ開発の現状

つづいて豆谷氏と同じくシステム本部データ統括部AI研究開発部第二グループ所属の滝口啓介氏は、音声変換に関する事例を発表しました。音声変換とは、入力した音声をほかの音声に変換する技術です。この技術を使えば、例えば発話者の音声を架空のアニメキャラのそれに変換できます。

音声変換においては、入力音声から特徴量を抽出する「音声分析処理」、抽出された音声特徴量を異なる値に変換する「音声変換処理」、変換された音声特徴量から音声波形を生成する「音声復元処理」という3つの処理が実行されます。こうした処理を実行するにあたり、入力音声を周波数領域に変換するフーリエ変換が行われます。音声変換において処理される特徴量は、この周波数領域から抽出されます。

音声変換のかなめとなる音声変換処理には、音響情報ベースのアプローチと言語情報ベースのそれがあります。音響情報ベースの音声変換では、入力音声の（スペクトログラムで表示されるような）音響情報から特徴量を抽出します。この技法ではイントネーションの情報が残りやすいので、抑揚の制御が容易となります。その一方で、声質情報も残りやすいため、声質の変換が難しくなります。音声変換においては声質の変換が重要となるため、この技法を使ったサービス開発は難しいとされています。

言語情報ベースのアプローチとは、入力音声の（音素や発音記号といった）言語に関する情報から特徴量を抽出する技法です。この技法では声質情報が残らないため、声質変換が容易となります。その反面、イントネーションも残りにくいため、抑揚の制御が難しくなります。短所があるものも声質情報を変換しやすい長所から、近年の音声変換サービスには同技法が多用されています。

ディー・エヌ・エーはエンタメ領域における音声変換の応用を推進しており、例えば動画配信における配信者音声の変換、ゲーム実況における実況者音声の変換、好きな声優になりきれるサービスなどを応用事例として考えています。そうした事例のひとつとして、2021年5月にはウェブブラウザで簡単に音声変換を体験できるサービス「七色ニーナ」をリリースしました。

七色ニーナのリリースにあたって、ディー・エヌ・エーは音声変換に関する4つの品質課題を掲げました。そうした課題とは「どんな声であっても変換可能であること」、「高品質な変換音声」、「短時間の変換による遅延の短縮」、「イントネーションも変換に反映させる」というものでした。

汎用的な音声変換を実現するために開発チームは、音声認識モデルと音声生成モデルをアーキテクチャに採用しました。音声認識モデルを採用したことにより、入力音声の話者が誰であっても適切に変換できるようになりました。

高品質な音声変換の実現にあたっては、前述したディー・エヌ・エーが手がけた音声合成事例から得られたノウハウを活用しました。音声合成を経験したことにより、音声AIの学習に必要なデータ量などの知識がすでに蓄積されていました。さらに、音声合成のために作成した学習データが流用できました。

低遅延な音声変換の実現のために、推論時間が比較的短いことで知られる非自己回帰モデルを採用しました。同モデルは、処理データの前後関係を考慮する自己回帰モデルよりシンプルな構造をしているため、処理が速いうえにモデルサイズも小さいという長所があります。

イントネーションの反映には、音声変換時にピッチ情報を付与する改良を行うことで実現しました。以上のような品質課題の達成方法をまとめると、以下のスライドのようになります。

滝口氏は、音声変換をより魅力的なものとするために追加すべき「プラスα」の要素にも言及しました。そうした要素にはさまざまな話者の音声に変換できること、音声に含まれる抑揚や感情も再現できる変換の実現、リアルタイムの音声変換によって可能となる（ボイスチャットや配信などの）双方向コンテンツの実現を挙げました。こうしたプラスαを実現できれば、音声変換の応用範囲がさらに広がることでしょう。

音声AI開発プロジェクトのノウハウ

さいごにシステム本部データ統括部AI基盤部所属の竹村伸太郎氏は、音声合成と音声変換をふくめた音声AIサービス開発プロジェクトのノウハウについて発表しました。

音声AIサービスは、音声処理を担うAIモデルのほかにもユーザデータを処理するためのサーバやユーザが使うスマホなどのエッジ端末といった複数のモジュールとデバイスから構成されています。サービスの構築にあたっては、その特徴をふまえたうえでさまざまな性能指標に関して優先順位を決定することが必要となります。こうした性能指標の優先順位決定に関して、竹村氏は3つの事例を引用しながら具体的に解説しました。

1つめの事例は前述の「七色ニーナ」です。ウェブブラウザから利用する同サービスは、ウェブニュース等で話題になることでよって、急激なアクセス数の増加が想定されます。それゆえ、最大同時接続数と定義できるスケーラビリティは可能な限り大きいことが望ましいです。また、変換した音声をユーザに返すまでに要する時間を意味するレイテンシは、リアルタイムである必要はないものも、ユーザが待てる3秒以内が望ましいです。単位時間あたりの処理音声量であるスループットは、入力される音声が最大10秒と少ないため、大きな値である必要はありません。以上を考慮すると、性能指標の優先順位は「スケーラビリティ＞レイテンシ＞スループット」となります。

2つめは、ゲーム実況者が使うようなライブ配信アプリに実装される音声AIの事例です。最近のライブ配信アプリは、音声処理をサーバ側ではなくエッジ端末側で実行するものもあります。こうしたオンデバイスAIアプリではサーバの増強が不要となるため、スケーラビリティを考慮する必要がなくなります。対して、レイテンシは非常に重要になります。というのも、処理された音声がユーザに届くまでの時間が遅いと、ライブ配信が成立しなくなるからです。スループットに関しては、一定値で安定しないとレイテンシが大きくなってしまうので軽視できません。それゆえ、性能指標の優先順位は「レイテンシ＞スループット＞スケーラビリティ」となります。

3つめの事例は、家庭で使われるような対話ロボットに実装する音声合成AIです。こうしたAIは、音声処理結果を利用するユーザはたいてい一人であるという製品の特徴により、多くのユーザに普及することが求められます。それゆえ、もっとも重要な性能指標は製品の価格に直結するコストとなります。レイテンシに関しては、対話が成立するのであれば多少の遅延は許容されます。スループットは音声AIの性能やロボットの演算能力に左右されますが、コストを犠牲にしてまで追求すべきではありません。以上より性能指標の優先順位は「コスト＞レイテンシ＞スループット」となります。

竹村氏は、チーム体制によるAI開発で役立つツールも紹介しました。そうしたツールには、AIの学習過程や実験結果を記録して共有できる「Comet.ml」、Markdownや数式も扱える情報共有ツール「Notion」、さまざまなスマホ端末を使ったテストをクラウド環境で実行できる「Firebase Test Lab」があります。