モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。

TAG LIST: CG CGへの扉安藤幸央生成AI 月刊エンタメAIニュース機械学習河合律子ディープラーニング吉本幸記 OpenAI GAN 音楽 NVIDIA ChatGPT Google 強化学習三宅陽一郎森川幸人グーグル Stable Diffusion ニューラルネットワーク大規模言語モデル LLM シナリオ DeepMind 人工知能学会モリカトロンマイクロソフト QA AIと倫理 GPT-3 自然言語処理 Facebook 大内孝子倫理映画著作権ルールベースアートゲームプレイAI キャラクターAI スクウェア・エニックス敵対的生成ネットワーク SIGGRAPH モリカトロンAIラボインタビュー NPC 画像生成 NFT Minecraft ロボット DALL-E2 音楽生成AI プロシージャル Midjourney デバッグファッション StyleGAN 自動生成ディープフェイク遺伝的アルゴリズム画像生成AI ゲームAI VFX Adobe テストプレイメタAI アニメーションテキスト画像生成深層学習 CEDEC2019 Microsoft デジタルツインメタバース VR 小説ボードゲーム DALL-E CLIP toio ビヘイビア・ツリーマンガ CEDEC2021 CEDEC2020 作曲不完全情報ゲームロボティクスナビゲーションAI マインクラフト畳み込みニューラルネットワークスポーツエージェント GDC 2021 GPT-4 手塚治虫マルチモーダル汎用人工知能 JSAI2022 バーチャルヒューマン NVIDIA Omniverse GDC 2019 動画生成AI マルチエージェント CEDEC2022 Meta AIアート 3DCG Stability AI メタデジタルヒューマン懐ゲーから辿るゲームAI技術史教育ジェネレーティブAI はこだて未来大学プロンプト Red Ram 栗原聡 CNN NeRF DALL-E 3 BERT Microsoft Azure Unity Omniverse JSAI2023 ELSI 鴫原盛之 HTN 階層型タスクネットワークソニー東京大学 JSAI2020 GTC2023 3D マーケティング TensorFlow インタビューブロックチェーン CM イベントレポートアストロノーカ模倣学習対話型エージェント Amazon トレーディングカードメディアアート DQN 高橋力斗合成音声水野勇太アバターブラック・ジャック Ubisoft Genvid Technologies ガイスター StyleGAN2 電気通信大学稲葉通将 AR アップル GTC2022 GPT-3.5 Sora SIGGRAPH ASIA Netflix JSAI2021 Bard 研究シムピープル世界モデル MCS-AI動的連携モデルマーダーミステリーモーションキャプチャーアドベンチャーゲーム TEZUKA2020 CEDEC2023 AGI テキスト生成インディーゲーム Electronic Arts 音声合成広告 JSAI2024 メタデータ GDC Summer イーロン・マスク Stable Diffusion XL 森山和道キャリア eスポーツスタンフォード大学アーケードゲームテニスサイバーエージェント音声認識類家利直 eSports BLUE PROTOCOL シーマン aibo SIE 大澤博隆 SFプロトタイピングモリカトロン開発者インタビュー宮本茂則チャットボット Gemini ワークショップ Epic Games AIロボ「迷キュー」に挑戦 AWS 徳井直生村井源クラウド斎藤由多加 AlphaZero Transformer GPT-2 rinna AIりんなカメラ環世界中島秀之 PaLM GitHub Copilot 哲学ベリサーブ Playable!ハリウッド理化学研究所 Gen-1 SF テキスト画像生成AI 松尾豊 AIQVE ONE データマイニング現代アート DARPA ドローンシムシティゲームエンジン Imagen Zork バイアス ASBS ぱいどん AI美空ひばり手塚眞バンダイナムコ研究所スパーシャルAI ELYZA NEDO FSM-DNN MindAgent LEFT 4 DEAD 通しプレイ論文 OpenAI Five 本間翔太馬淵浩希 Cygames Audio2Face ピクサープラチナエッグイーサリアム効果音ボエダ・ゴティエビッグデータ中嶋謙互 Amadeus Code データ分析 MILE NVIDIA ACE ナラティブ NVIDIA Riva Omniverse Replicator WCCF レコメンドシステム NVIDIA DRIVE Sim WORLD CLUB Champion Football NVIDIA Isaac Sim セガ柏田知大軍事田邊雅彦 Google I/O トレカ慶應義塾大学 Max Cooper GPT Disney Firefly PyTorch 京都芸術大学 ChatGPT4 モンテカルロ木探索眞鍋和子バンダイナムコスタジオヒストリア AI Frog Interactive 新清士田中章愛銭起揚齊藤陽介コナミデジタルエンタテインメント成沢理恵お知らせ Magic Leap One Tencent サッカーバスケットボール TikTok Suno AI text-to-image サルでもわかる人工知能 text-to-3D VAE DreamFusion TEZUKA2023 リップシンキング RNN Ubisoft La Forge 自動運転車知識表現ウォッチドッグスレギオン VTuber IGDA 立教大学秋期GTC2022 市場分析フォートナイト KLab どうぶつしょうぎ Roblox ジェイ・コウガミ音楽ストリーミング MIT 野々下裕子 Adobe MAX マシンラーニング 5G MuZero Rival Peak がんばれ森川君2号 pixiv オムロンサイニックエックス GPTs 対話エンジンポケモン 3Dスキャン橋本敦史リトル・コンピュータ・ピープル Codex シーマン人工知能研究所コンピューティショナル・フォトグラフィー Preferred Networks ゴブレット・ゴブラーズ絵画 Open AI 3D Gaussian Splatting Microsoft Designer イラストシミュレーション Soul Machines 柿沼太一完全情報ゲームバーチャルキャラクター坂本洋典宮本道人釜屋憲彦ウェイポイント LLaMA パス検索 Hugging Face 対談藤澤仁生物学 GTC 2022 xAI Apple Vision Pro 画像認識 Siemens ストライキ StyleCLIP DeNA Voyager 長谷洋平 GDC 2024 クラウドコンピューティング masumi toyota IBM 宮路洋一 OpenSea GDC 2022 SNS TextWorld Earth-2 Apple Bing Magenta ソフトバンク YouTube 音声生成AI ELYZA Pencil Scenario SIGGRAPH2023 AIピカソ GTC2021 AI素材.com CycleGAN テンセント Andreessen Horowitz QA Tech Night 松木晋祐 NetHack 下田純也桑野範久キャラクターモーション ControlNet 音源分離 NBA フェイクニュースユニバーサルミュージック RPG 法律 Web3 SIGGRAPH 2022 レベルデザイン DreamerV3 AIボイスアクター Unreal Engine 南カリフォルニア大学 NVIDIA Canvas GPU ALife 人工生命オルタナティヴ・マシンサム・アルトマンサウンドスケープ LaMDA TRPG マジック：ザ・ギャザリング AI Dungeon 介護ゲーム背景アパレル不気味の谷ナビゲーションメッシュデザイン写真高橋ミレイ深層強化学習松原仁松井俊浩武田英明フルコト ELYZA DIGEST WWDC WWDC 2024 建築西成活裕ハイブリッドアーキテクチャ AI野々村真 Apex Legends ELIZA 群衆マネジメントライブポートレイト Ninja コンピュータRPG ライブビジネス Wonder Studio Adobe Max 2023 GPT-4-turbo アップルタウン物語新型コロナ土木佐藤恵助 KELDIC 周済涛 BIM Bing Chat 大道麻由メロディ言語清田陽司インフラ Bing Image Creator 物語構造分析ゲーム TENTUPLAY サイバネティックス慶応義塾大学 MARVEL Future Fight Astro 人工知能史 Amazon Bedrock Assistant with Bard 渡邉謙吾タイムラプス Ego4D AI哲学マップ The Arcade ここ掘れ！プッカバスキア星新一 X.AI Search Generative Experience くまうた日経イノベーション・ラボ StyleGAN-XL X Corp.Dynalang 濱田直希敵対的強化学習 StyleGAN3 Twitter VLE-CE 大柳裕⼠階層型強化学習 GOSU Data Lab GANimator Xホールディングス加納基晴 WANN GOSU Voice Assistant VoLux-GAN Magi AI Act ソニー・インタラクティブエンタテインメント竹内将 SenpAI.GG Projected GAN EU 研究開発事例 Mobalytics Self-Distilled StyleGAN SDXL Ars Electronica 赤羽進亮ニューラルレンダリング RTFKT AI規制遊戯王岡島学 AWS Sagemaker PLATO NIKE 欧州委員会 UDI（Universal Duel Interface）映像セリア・ホデント形態素解析 frame.io Clone X 欧州議会第一工科大学 UX AWS Lambda Foodly 村上隆欧州理事会佐竹空良誤字検出 MusicLM 小林篤史認知科学中川友紀子 Digital Mark AudioLM 九州大学ゲームデザイン SentencePiece アールティ Snapchat MusicCaps 荻野宏実 LUMINOUS ENGINE クリエイターコミュニティ AudioCraft 伊藤黎 Luminous Productions BlenderBot 3 バーチャルペットビヘイビアブランチパターン・ランゲージ竹村也哉 Meta AI NVIDIA NeMo Service Mubert WPP ちょまどマーク・ザッカーバーグヴァネッサ・ローザ Mubert Render General Computer Control（GCC）GOAP WACUL Vanessa A Rosa Gen-2 Cradle Adobe MAX 2021 陶芸 Runway AI Film Festival 自動翻訳 Play.ht PreViz 音声AI AIライティング LiDAR Character-LLM Omniverse Avatar AIのべりすと Polycam 復旦大学 FPS QuillBot deforum Chat-Haruhi-Suzumiya マルコフ決定過程 NVIDIA Megatron Copysmith 涼宮ハルヒ NVIDIA Merlin Jasper ハーベスト Emu Video NVIDIA Metropolis ForGames Niantic パラメータ設計ゲームマーケットペリドットバランス調整岡野翔太 Dream Track 協調フィルタリング郡山喜彦 Music AI Tools 人狼知能テキサス大学ジェフリー・ヒントン Lyria Google I/O 2023 Yahoo!知恵袋 AlphaDogfight Trials AI Messenger Voicebot インタラクティブプロンプトAI エージェントシミュレーション OpenAI Codex 武蔵野美術大学 StarCraft II HyperStyle BingAI 石渡正人 Future of Life Institute Rendering with Style 手塚プロダクション Intel 林海象 LAIKA Disneyリサーチヴィトゲンシュタイン Photoshop 古川善規 Rotomation GauGAN 論理哲学論考 Lightroom 大規模再構成モデル GauGAN2 Canva LRM ドラゴンクエストライバルズ画像言語表現モデル Objaverse 不確定ゲーム SIGGRAPH ASIA 2021 PromptBase BOOTH MVImgNet Dota 2 ディズニーリサーチ pixivFANBOX One-2-3-45 Mitsuba2 バンダイナムコネクサス虎の穴 3Dガウシアンスプラッティングソーシャルゲーム Embedding ワイツマン科学研究所ユーザーレビュー Fantia ワンショット3D生成技術 GTC2020 CG衣装 mimic とらのあな NVIDIA MAXINE VRファッション Baidu 集英社 FGDC 淡路滋ビデオ会議 Artflow ERNIE-ViLG 少年ジャンプ＋Future Game Development Conference グリムノーツ Eponym 古文書 ComicCopilot 佐々木瞬ゴティエ・ボエダ音声クローニング凸版印刷コミコパ Gautier Boeda 階層的クラスタリング Gopher AI-OCR ゲームマスター画像判定 Inowrld AI Julius 鑑定ラベル付け MOD Anique TPRG Oxia Palus Ghostwriter 中村太一バーチャル・ヒューマン・エージェント toio SDK for Unity Art Recognition Skyrim エグゼリオクーガー実況パワフルサッカースカイリム Copilot 石井敦 NHC 2021 桃太郎電鉄 RPGツクールMZ ComfyUI 茂谷保伯池田利夫桃鉄 ChatGPT_APIMZ serial experiments lain GDMC 新刊案内パワサカダンジョンズ&ドラゴンズ AI lain マーベル・シネマティック・ユニバース Oracle RPG PCG MITメディアラボ MCU 岩倉宏介深津貴之 PCGRL アベンジャーズ PPO xVASynth Dungeons&Dragons マジック・リープ Digital Domain Machine Learning Project Canvas Laser-NV ビートルズ Magenda Masquerade2.0 国立情報学研究所ザ・ビートルズ: Get Back ノンファンジブルトークン DDSP フェイシャルキャプチャー石川冬樹 MERF Demucs スパコン Alibaba 音楽編集ソフト里井大輝 Kaggle スーパーコンピュータ VQRF Adobe Audition 山田暉松岡聡 nvdiffrec iZotope Assassin’s Creed Origins AI会話ジェネレーター TSUBAME 1.0 NeRFMeshing RX10 Sea of Thieves TSUBAME 2.0 LERF Moises GEMS COMPANY monoAI technology LSTM ABCI マスタリングモリカトロンAIソリューション富岳レベルファイブ初音ミク Oculus コード生成AI Society 5.0 リアム・ギャラガー転移学習テスト AlphaCode 夏の電脳甲子園グライムス KaKa Creation Baldur's Gate 3 Codeforces 座談会 Boomy VOICEVOX Candy Crush Saga 自己増強型AI ジョン・レジェンド Genie AI SIGGRAPH ASIA 2020 COLMAP ザ・ウィークエンド SIGGRAPH Asia 2023 ADOP NVIDIA GET3D ドレイク C·ASE デバッギング BigGAN GANverse3D FLARE MaterialGAN ダンスグランツーリスモSPORT AI絵師エッジワークス MagicAnimate ReBeL グランツーリスモ・ソフィー UGC 日本音楽作家団体協議会 Animate Anyone GTソフィー PGC FCA インテリジェントコンピュータ研究所 Volvo FIAグランツーリスモチャンピオンシップ Voicebox アリババ NovelAI さくらインターネット DreaMoving Rival Prak DGX A100 NovelAI Diffusion VISCUIT ぷよぷよ Scratch ユービーアイソフト Webcam VTuber モーションデータスクラッチ星新一賞大阪公立大学ビスケット北尾まどか HALO ポーズ推定 TCG プログラミング教育将棋メタルギアソリッドV メッシュ生成 FSM メルセデス・ベンツ QRコード VALL-E Magic Leap 囲碁 Deepdub.ai ナップサック問題 Live Nation Epyllion デンソー AUDIOGEN 汎用言語モデル Web3.0 マシュー・ボールデンソーウェーブ Evoke Music AIOps ムーアの法則原昌宏 AutoFoley Spotify スマートコントラクト日本機械学会 Colourlab.Ai Replica Studio ロボティクス・メカトロニクス講演会ディズニー amuse Chitrakar Qosmo Adobe MAX 2022 トヨタ自動車 Largo.ai 巡回セールスマン問題かんばん方式 Cinelytic ジョルダン曲線メディア Adobe Research Taskade 政治 Galactica プロット生成 Pika.art クラウドゲーミング AI Filmmaking Assistant 和田洋一リアリティ番組映像解析 FastGAN Stadia ジョンソン裕子セキュリティ 4コママンガ AI Screenwriter MILEs NightCafe 東芝デジタルソリューションズ芥川賞インタラクティブ・ストリーミング Luis Ruiz SATLYS 映像解析AI 文学インタラクティブ・メディア恋愛 PFN 3D Scan ElevenLabs タップル東京工業大学 HeyGen Abema TV Ludo 博報堂 After Effects NEC ラップ PFN 4D Scan 絵本木村屋 SIGGRAPH 2019 ArtEmis Z世代 DreamUp 出版 GPT Store AIラッパーシステム DeviantArt Ammaar Reshi 生成AIチェッカー Waifu Diffusion Stories ユーザーローカル GROVER プラスリンクス～キミと繋がる想い～元素法典 StoryBird 九段理江 FAIR STC Novel AI Versed 東京都同情塔チート検出 Style Transfer Conversation ProlificDreamer オンラインカジノ RCP Unity Sentis 4Dオブジェクト生成モデル RealFlow Rinna Character Platform Unity Muse Align Your Gaussians iPhone CALA Caleb Ward AYG Deep Fluids 宮田龍 MAV3D MeInGame Amelia 清河幸子ファーウェイ AIGraph ブレイン・コンピュータ・インタフェース西中美和 4D Gaussian Splatting BCI Gatebox アフォーダンス安野貴博 4D-GS Learning from Video ANIMAK PaLM-SayCan 斧田小夜 Glaze 予期知能逢妻ヒカリ WebGlaze セコム LLaMA 2 NightShade ユクスキュルバーチャル警備システム Code as Policies Spawning カント損保ジャパン CaP Have I Been Trained?CM3leon Fortnite 上原利之 Stable Doodle Unreal Editor For Fortnite ドラゴンクエストエージェントアーキテクチャアッパーグラウンドコリジョンチェック T2I-Adapter XR PAIR OCTOPATH TRAVELER 西木康智 Volumetrics OCTOPATH TRAVELER 大陸の覇者山口情報芸術センター［YCAM］AIワールドジェネレーターアルスエレクトロニカ2019 品質保証 YCAM 日本マネジメント総合研究所 Rosebud AI Gamemaker StyleRig Autodesk アンラーニング・ランゲージ Layer 逆転オセロニア Bentley Systems カイル・マクドナルド Lily Hughes-Robinson Charisma.ai ワールドシミュレーターローレン・リー・マッカーシー Colossal Cave Adventure 奥村エルネスト純いただきストリート H100 鎖国［Walled Garden］プロジェクト AdventureGPT 調査齋藤精一大森田不可止 COBOL SIGGRAPH ASIA 2022 リリー・ヒューズ＝ロビンソン Meta Quest 高橋智隆 DGX H100 VToonify BabyAGI IP ロボユニザナック DGX SuperPOD ControlVAE GPT-3.5 Turbo 泉幸典仁井谷正充変分オートエンコーダーカーリング強いAI ロボコレ2019 Instant NeRF フォトグラメトリウィンブルドン弱いAI artonomous 回帰型ニューラルネットワーク bitGANs DeepJoin 戦術分析ぎゅわんぶらあ自己中心派 Azure Machine Learning Azure OpenAI Service パフォーマンス測定 Lumiere 意思決定モデル脱出ゲーム DeepL IoT UNet Hybrid Reward Architecture コミュニティ管理 DeepL Write ProFitX ImageFX ウロチョロス Super Phoenix Watsonx MusicFX Project Malmo オンラインゲーム Athletica TextFX 気候変動コーチング Project Paidia シンギュラリティ北見工業大学 Keyframer Project Lookout マックス・プランク気象研究所レイ・カーツワイル北見カーリングホール Watch For ビョルン・スティーブンスヴァーナー・ヴィンジ画像解析 Gemini 1.5 気象モデル Runway Research じりつくん AI Studio LEFT ALIVE 気象シミュレーション Make-A-Video NTT Sportict Vertex AI 長谷川誠ジミ・ヘンドリックス環境問題 Phenaki AIカメラ Chat with RTX Baby X カート・コバーンエコロジー Dreamix STADIUM TUBE Slack ロバート・ダウニー・Jr.エイミー・ワインハウス SDGs Text-to-Imageモデル Pixelllot S3 Slack AI Pokémon Battle Scope ダフト・パンクメモリスタ AIスマートコーチポケットモンスター Glenn Marshall kanaeru The Age of A.I.Story2Hallucination 音声変換 Latitude 占いレコメンデーション Jukebox Dreambooth 行動ロジック生成AI Veap Japan ヤン・ルカン Convai EAP neoAI Perfusion NTTドコモ SIFT 福井千春 DreamIcon ニューラル物理学 Ememe DCGAN 医療 mign 毛髪 Genie MOBA DANNCE メンタルケア studiffuse 荒牧英治汎用AIエージェント人事ハーバード大学 Edgar Handy 中ザワヒデキ AIファッションウィーク研修デューク大学大屋雄裕インフルエンサー中川裕志 Grok-1 mynet.ai ローグライクゲーム Adreeseen Horowitz Mixture-of-Experts 東京理科大学 NVIDIA Avatar Cloud Engine MoE 人工音声 NeurIPS 2021 産業技術総合研究所 Replica Studios Claude 3 リザバーコンピューティング Smart NPCs Claude 3 Haiku プレイ動画ヒップホップ対話型AIモデル Roblox Studio Claude 3 Sonnet 詩ソニーマーケティング Promethean AI Claude 3 Opus サイレント映画もじぱ note 森永乳業環境音暗号通貨 note AIアシスタント Musiio C2PA FUZZLE Ketchup Endel ゲーミフィケーション Alteration AI News Tomo Kihara 粒子群最適化法 Art Selfie Playfool 進化差分法オープンワールド Art Transfer Sonar 遊び群知能下川大樹 AIFA Pet Portraits Sonar+D tsukurun ウィル・ライト高津芳希 P2E Blob Opera 地方創生大石真史クリムト Dolby Atmos 吉田直樹 BEiT StyleGAN-NADA Sonar Music Festival 素材 DETR ライゾマティクス SIMA Spore クリティックネットワーク真鍋大度 OpenAI Japan デノイズ Unity for Industry アクターネットワーク花井裕也 Voice Engine 画像処理 DMLab Ritchie Hawtin Command R+Sentropy GLIDE Control Suite Erica Synth Oracle Cloud Infrastructure CPU Discord AvatarCLIP Atari 100k Ufuk Barış Mutlu Google Workspace Synthetic Data Atari 200M Japanese InstructBLIP Alpha Udio CALM Yann LeCun 日本新聞協会立命館大学プログラミング鈴木雅大 AIいらすとや京都精華大学ソースコード生成コンセプトアート AI Picasso TacticAI GMAI シチズンデベロッパー Sonantic Colie Wertz Emposy NPMP GitHub Cohere リドリー・スコット AIタレント FOOH ウィザードリィ MCN-AI連携モデル絵コンテ AIタレントエージェンシー GPT-4o Urzas.ai ストーリーボード modi.ai Project Astra 大阪大学 BitSummit Google I/O 2024 西川善司並木幸介 Kiki Blender BitSummit Let’s Go!!Gemma 2 サムライスピリッツ森寅嘉 Zoetic AI Veo ゼビウス SIGGRAPH 2021 ペット感情認識ストリートファイター半導体 Digital Dream Labs PaLM API デジタルレプリカ音声加工 Topaz Video Enhance AI Cozmo MakerSuite GOT7 マルタ大学 DLSS タカラトミー Skeb synthesia 田中達大山野辺一記 NetEase LOVOT Dreambooth-Stable-Diffusion HumanRF Inworld AI 大里飛鳥 Dynamixyz MOFLIN Actors-HQ Move AI Romi Google Earth SAG-AFTRA ICRA2024 U-Net ミクシィ GEPPETTO AI WGA IEEE 13フェイズ構造ユニロボット Stable Diffusion web UI チャーリー・ブルッカー大規模基盤モデル ADV ユニボ Point-E Torobo XLand Gato 岡野原大輔東京ロボティクス AI model 自己教師あり学習インピーダンス制御 DEATH STRANDING AI Models In-Context Learning（ICL）深層予測学習 Eric Johnson 汎用強化学習AI ZMO.AI LoRA 日立製作所 MOBBY’S ファインチューニング早稲田大学 Oculus Quest コジマプロダクションロンドン芸術大学モビーディックグランツーリスモ尾形哲也生体情報デシマエンジン Google Brain ダイビング量子コンピュータ AIREC Sound Control アウトドア qubit 汎用ロボット SYNTH SUPER AIスキャニング IBM Quantum System 2 オムロンサイニックエックス照明 Maxim Peter Karl Sims 自動採寸北野宏明 ViLaIn Joshua Romoff Artnome 3DLOOK ダリオ・ヒル PDDL ハイパースケープ ICONATE Sizer ジェン・スン・フアンニューサウスウェールズ大学山崎陽斗ワコール HuggingFace Claude Sammut 立木創太スニーカー Stable Audio オックスフォード大学浜中雅俊 UNSTREET 宗教 Lars Kunze ミライ小町 Newelse 仏教杉浦孔明テスラ福井健策 CheckGoods コカ・コーラ田向権 GameGAN 二次流通食品 VASA-1 パックマン Tesla Bot 中古市場 Coca‑Cola Y3000 Zero Sugar VoxCeleb2 Tesla AI Day Wikipedia Dupe Killer Copilot Copyright Commitment AniTalker ソサエティ5.0 Sphere 偽ブランドテラバース上海大学 SIGGRAPH 2020 バズグラフ Xaver 1000 配信京都大学 Apple Intelligence ニュースタンテキ養蜂立福寛東芝 Beewise ソニー・ピクチャーズアニメーション音声解析 DIB-R 倉田宜典フィンテック感情分析 Luma 投資 Fosters+Partners 周済涛 Dream Machine 韻律射影 MILIZE Zaha Hadid Architects ステートマシン NTT 韻律転移三菱UFJ信託銀行ディープニューラルネットワーク Perplexity

【CEDEC2021】ゲーム制作をAIで効率化するCygamesのチャレンジ

2021.10.26ゲーム

CEDEC2021で行われたセッション「ゲーム制作効率化のためのAIによる画像認識・自然言語処理への取り組み」でCygamesの立福寛氏が講演したのは、社内の共通基盤ツールへのAI機能の導入についてです。AIモデルの学習プロセスについてはもちろん、インフラ構築、作業分担、デプロイ環境など、機能を支える背景の部分も取り上げた、新規にAI導入する際に非常に参考になる内容になっています。

物体検出/画像認識アルゴリズムを利用した自動タグ付け

まず取り掛かったのが、画像認識による自動タグ付けです。キャラクターが一人以上ふくまれる画像を入力すると、キャラクターの名前が表示される機能をリソース管理ツールに実装します。リソース管理ツールはWebベースで画像や動画のアップロードと検索閲覧、一括ダウンロードを行うことができます。タグ付けは手動で行っていますが、その作業プロセスにAIを使った自動レコメンド機能を追加します。

機械学習を用いた一般物体検知のアルゴリズム「SSD（Single Shot Multibox Detector）」を使っています。検出した物体に対しタグ付けを行うというもので、学習を行った後のモデルに画像を与えると物体の領域とクラス名が出力されます。そのうち、今回はクラス名だけをタグとして使用しています。実装にはオープンソースの「PyTorch」を使っています。

学習用のデータはすでに登録された画像データです。複数プロジェクトに使われており、1プロジェクト当たり数千枚の画像が登録されています。そのうち1プロジェクト分の画像を使って学習を行いました。ただ、対象は1キャラクターのみがふくまれる画像となります。これは、2人以上のキャラクターがふくまれた場合にどちらが誰か判別できないためです。今回はキャラクターが200人程度、画像の数はキャラクターごとに差があり、7枚から70枚です。画像に対し、OpenCVのアニメ顔認識モデルを適用し、キャラクターの顔の領域を取り出します。これにより、「画像」と「顔の領域」と「キャラクターの名前」の3つがセットで取得できます。

ローカルPCで1日程度の学習を行ったところ、テストの精度は90%台前半という結果が出ました。これについて立福氏は次のようにまとめています。

学習データが多いキャラクターは認識精度が高い（逆も然り）
顔や髪型に特徴が少ない一部のキャラクターは誤認識が多い
大きくデフォルメされた画像の認識精度は低い（大きくデフォルメされた画像を学習データに入れると精度が大幅に下がった）

そのため、大きくデフォルメされた画像については別のモデルを用意したほうがよいと言えます。また、ゲームのキャラクターに特有の表現、例えば「顔に大きな角度が付いている」「片目が隠れている」などの場合は認識精度が落ちることも指摘しています。

また、背景画像については、画像認識アルゴリズムを使っています。今回はクラウドの機械学習プラットフォーム「AWS Sagemaker」を使って、1,400枚程度の画像データで学習を行いました。分類するクラスは180程度です。実際のデータでの精度は7割ほどです。

自動タグ付け機能のデプロイ環境について

次はデプロイ環境について解説しました。もともとリソース管理ツールはAWS上に構築されているので、AWSで完結できればそれに越したことはありません。そこで、機械学習プラットフォーム「AWS Sagemaker」（以下、Sagemaker）に統一することにしました。

SagemakerはAWS上で機械学習モデルを利用するための統合環境で、さまざまな機械学習モデルの学習からエンドポイントの作成まで行うことができます。前述のように、背景画像のタグ付けに物体検出アルゴリズムをSagemaker上で使っています。キャラクターの顔認識も物体検出アルゴリズムで行います。

最初にオープンソースで組んだ実装より精度が下がったものの、学習データの画像を回転したり拡大縮小などを行いバリエーションを増やすことで解決し、下記の図のようにリソース管理ツールからAPI Gateway→Lambda→Sagemakerという構成で呼び出します。

ただし、コスト面で問題が起こったため、最初に使用したオープンソースのSSDの実装をLambda上で動かすよう変更しました。Lambdaでは最大10GBまでユーザーのdockerイメージを動かすことができます。Pythonの機械学習モジュールはデプロイ時に問題になりやすいものの、dockerイメージで丸ごと持っていけるのは非常に楽であるため、お勧めの構成だと立福氏は言います。

リソース管理ツール上で画像のアップロード中にタグの予測ボタンを押すと、自動タグ付け機能が呼び出され、ダグのレコメンドが行われます。確信度が80%以上の場合のみタグとして出します。自動タグ付け機能の処理は数秒ですが、Lambdaの仕様により初回呼び出し時は20秒程度かかるとのことです。

シナリオ執筆ツールにおける表記揺れ・誤字検出機能

画像への自動タグ付け機能の開発が終わり社内でヒアリングを行ったところ、シナリオ執筆ツールで誤字を検出してほしいという要望が出たことから、次に誤字検出機能を開発することになりました。

シナリオ執筆ツールはWebベースのシナリオ作成環境で、シナリオの執筆、監修、台本の印刷、音声の管理ができます。Web APIでシナリオを一括で取得することができ、フォーマットも完全に統一されており、AIの学習データを簡単に用意することができます。

こちらは形態素解析とルールベースでの実装です（参考論文：シナリオ執筆ツールへの表記揺れ機能）。形態素解析とは文章をトークンと呼ばれる単語単位に分割する処理のことで、この形態素解析を使って次のように表記揺れを検出します。まず入力された文章を形態素解析し、名詞を取り出します。この時に連続している名詞は結合して1つの単語として扱います。次に、単語と単語を比較して表記揺れスコアを求めます。このスコアが高いほど表記揺れの可能性が高いことになります。例えば、図のように「たこ焼」「たこ焼き」の表記揺れ、「一時間」「1時間」の表記揺れと判断できます。

形態素解析モジュールには代表的なものにmecabなどがありますが、比較した結果、juman++を採用しました。juman++はRNNを用いて単語の並びの意味的な自然さを考慮した解析を行う点が特徴で、話し言葉が多いゲームのシナリオには適していると判断したのです。

今回はスコアの高い順に30個を返す関数として実装しました。スコアの計算は先に挙げた論文を参考にしています。この時、計算に必要な要素は「編集距離」と「出現回数」です。単語Aを単語Bにするために必要な手順の数を編集距離とし、単語間の編集距離が小さいほどスコアが大きくなるという仕組みです。また、単語の出現回数の差が大きい場合にスコアが大きくなるようにしています。

例えば「たこ焼き」を「タコ焼」にするには2つの文字を置き換えることになるので編集距離は2です。出現回数も10と1なので、スコアは高くなります。

今回はスコアの高い順に30個を返す関数として実装し、AWS Lambdaへ持っていきました。ただ、この機能の開発時はまだLambda上でdockerイメージが使えなかったため、通常のLambdaパッケージを作っています。EFSファイルシステムをLambdaにマウントして、大きいファイルはそちらから読み込んで関数を実行します。

シナリオ執筆ツール上で表記揺れを調べたいシナリオを選択してボタンを押すと、表記揺れ機能のAPIが呼び出されるという仕組みです。表記揺れの可能性がある部分が赤くハイライトされて正しい候補が右側に表示されます。

社内のユーザーからも好評で、名詞に加えて動詞の表記揺れ検出機能も欲しいというリクエストにも対応しています。同時に単語を指定して表記揺れを探す機能も追加しました。

シナリオ執筆ツールにおける誤字検出機能

こちらも社内のユーザーからの要望に応え、開発した機能です。機械学習を利用した誤字検出は有料のサービスが複数存在しますが、毎月の課金がかかるのとデータの機密の問題もあり、独自実装することになりました。論文「Bidirectional LSTMを用いた誤字脱字検出システム」を参考に、一部のアルゴリズムを変更して新たな自然言語処理モデルとして実装しています。

まず自然言語処理モデル「BERT」を使って、入力された文章を「誤字がないもの」と「誤字があるもの」に分類します。次に、誤字があると判断された文章を形態素解析して単語ごとの出現順を別のBERTモデルで求めます。出現順が低い単語は誤字の可能性が高いということになります。単語ごとの出現順をランダムフォレストと呼ばれるモデルに入力して最終的な誤字の位置を求めています。

なお、BERTは2018年にGoogleが発表した自然言語処理モデルで、翻訳や文章分類などのタスクで当時の最高スコアを出したことで一躍有名になりました。今回は文章分類、単語の出現順の推論の2つのタスクに使っています。現在、BERTよりも新しいモデルが出ていますが、広く利用されて情報が多い点と、日本語の学習済みモデルが複数公開されていることが利点です。

各機械学習モデルの説明になりますが、「文章を誤字なし・ありに分類する」モデルにはBERTの文書分類タスクが使われています。学習データとして、ニュース記事とジャンルの組み合わせを用意して学習させ、学習済みのBERTへニュース記事を入力すると適切なジャンルが取得されるというものです。ここでは「誤字がない文章」と「誤字がある文章」の2種類を分類するBERTモデルを作ります。実装はBERTとTensorflow、形態素解析はSentencePieceという構成です。

学習データは「誤字なし」と「誤字あり」の2つ、元の文章と誤字をふくむ文章を1：5で用意してBERTの文章分類で学習させます。誤字のパターンはシナリオ執筆ツールを利用している社内のユーザーから文章校正のテキストを提供してもらい、そこから抽出しています。

元の文章と誤字を入れた文章を先ほど学習したモデルへ入力して推論を行います。この時出力されるのは、単語ごとの出現順のリストです。この値を次のモデルの学習データとして使います。この時誤字を入れた位置を目的変数として追加しておきます。誤字がない文章の場合は「-1」を入れます。

最後は、誤字の位置を求めるモデルです。前のモデルから出力された単語の出現順の並びから最終的な誤字の位置を決定します。前のモデルから出力された値のうち、誤字の位置が機械学習における目的変数、それ以外の単語の出現順の値が説明変数となります。この2つをセットにした学習データを使って学習を行います。使用するモデルはランダムフォレスト、scikit-learnの実装を使っています。

ただ、こちらの精度は35〜45%程度という結果です。当初は誤字のパターンを少なくしていたので精度が高かったのですが、誤字のパターンを増やしたところ精度が下がってしまいました。誤字の位置を間違って検出してしまうケースが15%程度、残りの50%は誤字があるのに誤字がないと推論してしまうようです。

図で示す例は「イベントは大盛況のちに終わった」という文章の「のち」の部分に誤字があるケースで、これは正しく予測できています。もう1つは、「素敵な歌詞になたと思う」という文章の「なた」の部分に誤字があるのですが、「素敵な」の部分に誤字があると間違えて予測した例です。

ここまでローカルで実装した関数をAWS Lambda上へ持っていきました。Dockerのイメージが大きくなると、Lambdaの更新に時間がかかるため、学習したモデルをDockerイメージにふくめずに別のファイルシステムから読み込む形にしています。

また、Lambdaで実行してみたところインフラ側の制限時間（30秒）に引っかかってしまうことがわかりました。真ん中の単語の出現順を求めるモデルが非常に重く、CPU実行では大半の時間をそこで使ってしまうのです。そこで、AWSのStepFunctionsによる非同期呼び出しの仕組みを追加しました。最初にLambdaで関数の実行を開始し、しばらく経ってから結果を問い合わせて、終わっていれば結果を受け取るという形です。これにより、Lambdaの最大タイムアウト時間の10分まで処理を行えるようになりました。

この非同期呼び出しの仕組みに合わせてシナリオ執筆ツールのUIを変更し、処理を開始すると画面をすぐに戻し、実行中の処理は別の画面で見るようにしました。表記揺れも同じ扱いです。このように、UIを工夫することでAIの処理時間を隠蔽することができます。

AIエンジニアがインフラ構築も兼ねる

作業分担は以下のとおりです。画像認識、表記揺れ機能に関しては、AIエンジニア、インフラエンジニア、ツール開発者の3人での作業分担でしたが、誤字検出ではAIエンジニアがインフラ構築も担当する形になっています。これについて立福氏は、機械学習向けのインフラ構築はゲーム運用やWebサービス運用とは勝手が違ってインフラ担当でも実績がないこともあり、AIエンジニアが試行錯誤できるようにインフラ構築まで兼任したほうが話が早い場合もあると分析しています。

画像認識

AIの学習・APIの作成（1人）

– 機械学習モデルの作成（2か月）

– デプロイ（2か月）

AWSのインフラ構築（1人）

– インフラ担当者（1週間）

リソース管理ツールへの機能追加（1人）

– ツールの開発者（1週間）

表記揺れ

機械学習の学習・APIの作成（1人）

– 機能開発（2か月）

– デプロイ（1か月）

AWSのインフラ構築（1人）

– インフラ担当者（2日）

リソース管理ツールへの機能追加（1人）

– ツール開発者（1週間）

誤字検出

機械学習の学習・APIの作成、AWSのインフラ構築（1人）

– 機械学習モデルの作成（4か月）

– インフラ構築（2週間）

– デプロイ（1.5か月）

リソース管理ツールへの機能追加（1人）

– ツール開発者（2週間）

AWS上でInfrastructure as Code（IaC；コードによるインフラ構築運用）を行う「AWS CDK」を使うことで、簡単にインフラ構築が行えたそうです。図のようにAPI Gateway＋Lambdaの既存構成にSTEP functionを追加した形になっています。

今回の試みの背景には、ゲーム開発におけるAIの導入事例も増え、情報にアクセスしやすくなったことがあります。また、リソース管理ツールやシナリオ執筆ツールのような共通基盤ツールがあると、機械学習の学習データを用意するのが比較的容易になります。このあたりが開発現場にAIを導入する際のポイントになると言えそうです。

Writer：大内孝子