モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。

TAG LIST
CGCGへの扉機械学習安藤幸央ディープラーニング月刊エンタメAIニュースGAN河合律子OpenAINVIDIA音楽吉本幸記ニューラルネットワーク三宅陽一郎強化学習GoogleQAグーグルDeepMindGPT-3Facebook自然言語処理人工知能学会大内孝子森川幸人敵対的生成ネットワークシナリオキャラクターAIスクウェア・エニックスモリカトロンAIラボインタビューマイクロソフトルールベースStable DiffusionAIと倫理アート映画デバッグNFTDALL-E2StyleGAN倫理ゲームプレイAI自動生成SIGGRAPHモリカトロンメタAIテキスト画像生成ロボット深層学習ファッションCEDEC2019プロシージャルVFXデジタルツイン遺伝的アルゴリズムテストプレイNPCDALL-ECLIP画像生成大規模言語モデルChatGPTビヘイビア・ツリーディープフェイクCEDEC2021CEDEC2020ゲームAIメタバース不完全情報ゲームVRナビゲーションAI画像生成AIボードゲーム畳み込みニューラルネットワークGDC 2021JSAI2022生成系AIAdobeGDC 2019マルチエージェントCEDEC2022著作権AIアート懐ゲーから辿るゲームAI技術史toioジェネレーティブAICNNMicrosoftNVIDIA OmniverseUnity小説アニメーション鴫原盛之HTN階層型タスクネットワークマンガ汎用人工知能JSAI2020GTC2023TensorFlowインタビューバーチャルヒューマンBERTMidjourneyイベントレポート対話型エージェントAmazonロボティクスMetaMinecraft水野勇太アバターOmniverse3DCGUbisoftGenvid TechnologiesガイスターStyleGAN2GTC2022教育ソニーJSAI2021スポーツ研究シムピープルMCS-AI動的連携モデルマーケティングGDC SummerLLMブロックチェーン作曲アストロノーカキャリアeスポーツスタンフォード大学サイバーエージェント音声認識eSportsDQNBLUE PROTOCOLシーマンStability AIメタAlphaZeroTransformerGPT-2rinnaAIりんなデジタルヒューマンカメラ環世界中島秀之PaLM哲学ベリサーブPlayable!理化学研究所SIGGRAPH ASIANetflix東京大学DARPAドローンシムシティImagenZorkバイアスモーションキャプチャーTEZUKA2020AI美空ひばり手塚治虫テキスト生成バンダイナムコ研究所スパーシャルAIElectronic Arts3DメタデータLEFT 4 DEAD通しプレイOpenAI Five本間翔太CMAudio2Faceピクサープラチナエッグイーサリアムボエダ・ゴティエビッグデータ中嶋謙互Amadeus Codeデータ分析Microsoft AzureMILE模倣学習ナラティブNVIDIA RivaアーケードゲームOmniverse ReplicatorWCCFレコメンドシステムNVIDIA DRIVE SimWORLD CLUB Champion FootballNVIDIA Isaac Simセガ柏田知大軍事田邊雅彦トレーディングカードトレカメディアアートGPTPyTorch眞鍋和子バンダイナムコスタジオaibo合成音声齊藤陽介マインクラフトお知らせMagic Leap Oneチャットボットサルでもわかる人工知能VAEDreamFusionリップシンキングUbisoft La Forge自動運転車ワークショップ知識表現ウォッチドッグス レギオンIGDA秋期GTC2022市場分析どうぶつしょうぎEpic Gamesジェイ・コウガミ音楽ストリーミングMITAIロボ「迷キュー」に挑戦AWS野々下裕子徳井直生マシンラーニング5GMuZeroRival Peakpixivクラウド対話エンジン斎藤由多加リトル・コンピュータ・ピープルCodexコンピューティショナル・フォトグラフィーゴブレット・ゴブラーズ絵画ARMicrosoft Designerイラストシミュレーション完全情報ゲーム坂本洋典釜屋憲彦ウェイポイントパス検索対談藤澤仁生物学GTC 2022画像認識GPT-3.5SiemensStyleCLIPDeNA長谷洋平masumi toyota宮路洋一OpenSeaGDC 2022Gen-1TextWorldEarth-2BingMagenta音楽生成AISFELYZA Pencil松尾豊GTC2021CycleGANテンセントデータマイニングNetHackはこだて未来大学Bardキャラクターモーションフェイクニュース現代アートエージェントRPGSIGGRAPH 2022レベルデザインAIボイスアクターNVIDIA CanvasGPUALife人工生命オルタナティヴ・マシンサウンドスケープLaMDATRPGAI DungeonプロンプトASBS栗原聡ぱいどんアドベンチャーゲーム不気味の谷ナビゲーションメッシュ松井俊浩ELYZAフルコトELYZA DIGEST建築音声合成NeRF西成活裕Apex LegendsELIZA群衆マネジメントライブポートレイトNinjaコンピュータRPGライブビジネスWonder Studioアップルタウン物語新型コロナ土木KELDIC周済涛BIMメロディ言語清田陽司インフラゲームTENTUPLAYサイバネティックスMARVEL Future FightAstro人工知能史Amazon BedrockタイムラプスEgo4DAI哲学マップイーロン・マスクバスキア星新一X.AI日経イノベーション・ラボStyleGAN-XLX Corp.敵対的強化学習StyleGAN3Twitter階層型強化学習GOSU Data LabGANimatorXホールディングスWANNGOSU Voice AssistantVoLux-GANMagi竹内将SenpAI.GGProjected GANStable Diffusion XLMobalyticsSelf-Distilled StyleGANSDXL馬淵浩希CygamesニューラルレンダリングRTFKT岡島学AWS SagemakerPLATONIKE映像セリア・ホデント形態素解析frame.ioClone XUXAWS LambdaFoodly村上隆誤字検出森山和道認知科学中川友紀子Digital MarkゲームデザインSentencePieceアールティSnapchatLUMINOUS ENGINEクリエイターコミュニティLuminous ProductionsBlenderBot 3バーチャルペットパターン・ランゲージ竹村也哉Meta AINVIDIA NeMo Serviceちょまどマーク・ザッカーバーグヴァネッサ・ローザGOAPWACULVanessa A RosaAdobe MAX 2021陶芸自動翻訳Play.ht音声AIAIライティングLiDAROmniverse AvatarAIのべりすとPolycamFPSQuillBotdeforumマルコフ決定過程NVIDIA MegatronCopysmith動画生成AINVIDIA MerlinJasperハーベストNVIDIA MetropolisForGamesパラメータ設計テニスゲームマーケットバランス調整岡野翔太協調フィルタリング郡山喜彦人狼知能テキサス大学ジェフリー・ヒントンGoogle I/O 2023AlphaDogfight TrialsAI Messenger VoicebotGoogle I/OエージェントシミュレーションOpenAI Codex武蔵野美術大学StarCraft IIHyperStyleMax CooperBingAIFuture of Life InstituteRendering with StyleIntelDisney類家利直FireflyLAIKADisneyリサーチヴィトゲンシュタインPhotoshopRotomationGauGAN論理哲学論考LightroomGauGAN2京都芸術大学Canvaドラゴンクエストライバルズ画像言語表現モデルChatGPT4不確定ゲームSIGGRAPH ASIA 2021PromptBaseBOOTHDota 2モンテカルロ木探索ディズニーリサーチpixivFANBOXMitsuba2バンダイナムコネクサス虎の穴ソーシャルゲームEmbeddingワイツマン科学研究所ユーザーレビューFantiaGTC2020CG衣装mimicとらのあなNVIDIA MAXINEVRファッションBaidu集英社淡路滋ビデオ会議ArtflowERNIE-ViLG少年ジャンプ+グリムノーツEponym古文書ComicCopilotゴティエ・ボエダ音声クローニング凸版印刷コミコパGautier Boeda階層的クラスタリングGopherAI-OCRゲームマスター画像判定Inowrld AIJuliusSIE鑑定ラベル付けMODTPRGOxia Palus大澤博隆Ghostwriterバーチャル・ヒューマン・エージェントtoio SDK for UnityArt RecognitionSFプロトタイピングSkyrimクーガー田中章愛実況パワフルサッカースカイリム石井敦銭起揚NHC 2021桃太郎電鉄RPGツクールMZ茂谷保伯池田利夫桃鉄ChatGPT_APIMZGDMC新刊案内パワサカダンジョンズ&ドラゴンズマーベル・シネマティック・ユニバースコナミデジタルエンタテインメントOracle RPG成沢理恵MITメディアラボMCU岩倉宏介深津貴之アベンジャーズPPOxVASynthマジック・リープDigital DomainMachine Learning Project CanvasLaser-NVMagendaMasquerade2.0国立情報学研究所TencentノンファンジブルトークンDDSPフェイシャルキャプチャー石川冬樹MERFサッカーモリカトロン開発者インタビュースパコンAlibaba里井大輝Kaggle宮本茂則スーパーコンピュータVQRFバスケットボール山田暉松岡 聡nvdiffrecAssassin’s Creed OriginsAI会話ジェネレーターTSUBAME 1.0NeRFMeshingSea of ThievesTSUBAME 2.0LERFGEMS COMPANYmonoAI technologyLSTMABCIマスタリングモリカトロンAIソリューション富岳TikTok初音ミクOculusコード生成AISociety 5.0リアム・ギャラガー転移学習テストAlphaCode夏の電脳甲子園グライムスBaldur's Gate 3Codeforces座談会BoomyCandy Crush Saga自己増強型AItext-to-imageジョン・レジェンドSIGGRAPH ASIA 2020COLMAPtext-to-3Dザ・ウィークエンドADOPNVIDIA GET3DドレイクデバッギングBigGANGANverse3DMaterialGANRNNグランツーリスモSPORTAI絵師ReBeLグランツーリスモ・ソフィーUGCGTソフィーPGCVolvoFIAグランツーリスモチャンピオンシップNovelAIRival PrakDGX A100NovelAI DiffusionVTuberユービーアイソフトWebcam VTuberモーションデータ星新一賞北尾まどかHALOポーズ推定将棋メタルギアソリッドVフォートナイトメッシュ生成FSMメルセデス・ベンツRobloxMagic Leapナップサック問題Live NationEpyllion汎用言語モデルWeb3.0マシュー・ボールAIOpsムーアの法則SpotifyスマートコントラクトReplica StudioamuseChitrakarQosmoAdobe MAX 2022巡回セールスマン問題Adobe MAXジョルダン曲線メディアAdobe Research政治Galacticaクラウドゲーミングがんばれ森川君2号和田洋一リアリティ番組映像解析Stadiaジョンソン裕子セキュリティMILEsNightCafe東芝デジタルソリューションズインタラクティブ・ストリーミングLuis RuizSATLYS 映像解析AIインタラクティブ・メディアポケモン3DスキャンPFN 3D Scanシーマン人工知能研究所東京工業大学Ludo博報堂Preferred NetworksラップPFN 4D ScanSIGGRAPH 2019ArtEmisZ世代DreamUpAIラッパーシステムDeviantArtWaifu DiffusionGROVERプラスリンクス ~キミと繋がる想い~元素法典FAIRSTCNovel AIチート検出Style Transfer ConversationOpen AIオンラインカジノRCPアップルRealFlowRinna Character PlatformiPhoneCALADeep FluidsSoul Machines柿沼太一MeInGameAmeliaELSIAIGraphブレイン・コンピュータ・インタフェースバーチャルキャラクターBCIGateboxアフォーダンスLearning from VideoANIMAKPaLM-SayCan予期知能逢妻ヒカリセコムGitHub Copilotユクスキュルバーチャル警備システムCode as Policiesカント損保ジャパンCaP上原利之ドラゴンクエストエージェントアーキテクチャアッパーグラウンドコリジョンチェックPAIROCTOPATH TRAVELER西木康智OCTOPATH TRAVELER 大陸の覇者山口情報芸術センター[YCAM]アルスエレクトロニカ2019品質保証YCAMStyleRigAutodeskアンラーニング・ランゲージ逆転オセロニアBentley Systemsカイル・マクドナルドワールドシミュレーターローレン・リー・マッカーシー奥村エルネスト純いただきストリートH100鎖国[Walled Garden]​​プロジェクト齋藤精一大森田不可止COBOLSIGGRAPH ASIA 2022高橋智隆DGX H100VToonifyロボユニザナックDGX SuperPODControlVAE泉幸典仁井谷正充クラウドコンピューティング変分オートエンコーダーロボコレ2019Instant NeRFフォトグラメトリartonomous回帰型ニューラルネットワークbitGANsDeepJoinぎゅわんぶらあ自己中心派Azure Machine LearningAzure OpenAI Service意思決定モデル脱出ゲームDeepLHybrid Reward Architectureコミュニティ管理DeepL WriteウロチョロスSuper PhoenixSNSProject Malmoオンラインゲーム気候変動Project PaidiaシンギュラリティProject Lookoutマックス・プランク気象研究所レイ・カーツワイルWatch Forビョルン・スティーブンスヴァーナー・ヴィンジ気象モデルRunway ResearchLEFT ALIVE気象シミュレーションMake-A-Video長谷川誠ジミ・ヘンドリックス環境問題PhenakiBaby Xカート・コバーンエコロジーDreamixロバート・ダウニー・Jr.エイミー・ワインハウスSDGsText-to-ImageモデルYouTubeダフト・パンクメモリスタ音声生成AIGlenn MarshallScenarioThe Age of A.I.Story2Hallucination音声変換LatitudeレコメンデーションJukeboxAIピカソVeap JapanAI素材.comEAPneoAISIFT福井千春DreamIconDCGAN医療mignMOBADANNCEメンタルケアstudiffuse人事ハーバード大学Edgar HandyAndreessen Horowitz研修デューク大学AIQVE ONEQA Tech Nightmynet.aiローグライクゲーム松木晋祐東京理科大学下田純也人工音声NeurIPS 2021産業技術総合研究所桑野範久リザバーコンピューティングプレイ動画ヒップホップ対話型AIモデルソニーマーケティングControlNetサイレント映画もじぱnoteNBA環境音暗号通貨note AIアシスタントFUZZLEKetchupAlterationAI News粒子群最適化法Art Selfie進化差分法オープンワールドArt Transfer群知能下川大樹AIFAPet Portraitsウィル・ライト高津芳希P2EBlob Opera大石真史クリムトBEiTStyleGAN-NADA世界モデルDETRゲームエンジンDreamerV3SporeUnreal Engineクリティックネットワークデノイズ南カリフォルニア大学Unity for Industryアクターネットワーク画像処理DMLabSentropyGLIDEControl SuiteCPUDiscordAvatarCLIPAtari 100kSynthetic DataAtari 200MCALMYann LeCunプログラミングサム・アルトマン鈴木雅大ソースコード生成コンセプトアートGMAIシチズンデベロッパーSonanticColie WertzGitHubCohereリドリー・スコットウィザードリィMCN-AI連携モデルマジック:ザ・ギャザリング絵コンテUrzas.aiストーリーボード介護大阪大学西川善司並木幸介KikiBlenderサムライスピリッツ森寅嘉Zoetic AIゼビウスSIGGRAPH 2021ペットGPT-4ストリートファイター半導体Digital Dream LabsPaLM APITopaz Video Enhance AICozmoMakerSuiteDLSSタカラトミーSkeb山野辺一記NetEaseLOVOTDreambooth-Stable-Diffusion大里飛鳥DynamixyzMOFLINゲーム背景RomiGoogle EarthU-NetミクシィGEPPETTO AI13フェイズ構造ユニロボットStable Diffusion web UIADVユニボPoint-EXLandGatoアパレルAGIAI model手塚眞DEATH STRANDINGマルチモーダルAI ModelsEric Johnson汎用強化学習AIZMO.AIデザインMOBBY’SOculus Questコジマプロダクションロンドン芸術大学モビーディック生体情報デシマエンジンGoogle BrainダイビングインディーゲームSound Controlアウトドア写真高橋ミレイSYNTH SUPERAIスキャニング照明Maxim PeterKarl Sims自動採寸Joshua RomoffArtnome3DLOOKハイパースケープICONATESizer山崎陽斗深層強化学習ワコール立木創太松原仁スニーカー浜中雅俊UNSTREETミライ小町武田英明Newelseテスラ福井健策CheckGoodsGameGAN二次流通パックマンTesla BotNEDO中古市場Tesla AI DayWikipediaDupe Killerソサエティ5.0Sphere偽ブランドSIGGRAPH 2020バズグラフXaver 1000配信ニュースタンテキ養蜂東芝Beewiseソニー・ピクチャーズ アニメーションDIB-R倉田宜典フィンテック投資Fosters+Partners韻律射影MILIZEZaha Hadid Architects広告韻律転移三菱UFJ信託銀行

【JSAI2020】AIによるRPG自動生成技術はどこまで進歩したか?

2020.6.29ゲーム

【JSAI2020】AIによるRPG自動生成技術はどこまで進歩したか?

2020年6月9日から12日にかけて第34回人工知能学会全国大会(JSAI2020)が開催されました。今回は、コロナ禍の影響により全セッションをZoomによるオンラインで実施するという異例のものとなりました。この記事では、2020年6月12日に行われたセッション「AI応用: エンタテイメント」で発表された3つの研究報告を紹介します。

クエストを自動生成して視覚要素と統合

公立はこだて未来大学の斉藤勇璃氏による「シナリオ・視覚要素・音響効果を統合的に自動生成するゲームシステムの構築」と題された発表では、ゲームにおけるシナリオと視覚要素を自動生成する試みが報告されました。

ゲーム業界のなかでもRPGは人気ジャンルのひとつであり、『RPGツクール』シリーズの存在からも分かるようにユーザ自身が制作したいというニーズもあるジャンルです。こうした背景から、商用利用できるAIを活用したRPG自動生成技術が開発できれば、市場から高く評価されることは想像に難くありません。

RPGの自動生成を試みるにあたっては、シナリオ、音響、視覚要素、そしてこれらを統合するシステムが必要になります(下の図を参照)。まずシナリオの自動生成を試みるにあたっては、既存のRPGのシナリオを分析することから始めました。分析対象としては、その知名度からドラゴンクエストシリーズとファイナルファンタジーシリーズの初期作が選ばれました。

過去作品のシナリオ分析には、ストーリーの構造を研究する「物語論」を活用しました。分析した結果、RPGは特定の目標を達成する「クエスト」が複数つながることでシナリオが形成されていると分かりました。そして、クエストには発端となる「発生」、発端を受けて行動する「経過」、目標を達成した結果生じる「結末」という3構造から成り立っていることも分かりました。こうした構造分析から、3構造を保ちながらさまざまなイベントを組み合わせてクエストを自動生成し、生成したクエストを複数つなげればシナリオになる、という解決策が見出せます。

クエストを自動生成するには、3構造それぞれの内容を特定する必要があります。過去作品の分析により、発生には「依頼」「移動手段の確保」、経過には「ボスモンスターを倒す」、結末には「(強力な武器等の)アイテム入手」といった類型があることがわかっていました。こうした類型にもとづき、クエスト内容の原型にあたる簡単な内容を記したテキストを350個ほど人力で作成した上で、このテキスト群に対してクエスト生成アルゴリズムを駆動して抽出・接続することにしました。

この結果、1,800通りのクエストの自動生成に成功しました。生成されたクエストには、ゲーム全体を統合するモジュールに渡すクエスト発生条件等のシステム情報も付与しました。そして、確率モデルの一種であるマルコフ連鎖を活用してクエストをつなげることによって、シナリオが形成されたのでした。

RPGにおけるシナリオは、視覚要素が加わることで体験可能となります。こうした視覚要素はシナリオに対応したものでなければなりません。それゆえ、キャラクターとマップは基本デザインを作成して、シナリオに合った(質感を表現するグラフィック要素である)マテリアルをその基本デザインに設定するようにしました。また、ダンジョンもローグライクゲームのように自動生成するようにしました。

今後の課題として、自動生成されたRPGをテストプレイヤーにプレイしてもらってから、アンケート形式でフィードバックを得ることが挙げられました。

【論文】シナリオ・視覚要素・音響効果を統合的に自動生成するゲームシステムの構築

シナリオの感情状態に合ったBGMを選曲

公立はこだて未来大学の山内拓真氏による「ゲームシナリオと感情状態に合わせてBGMを選曲するシステム」と題された発表では、ゲームシナリオに合ったBGMを選択するシステムの開発について報告されました。この報告は、前述のRPGの自動生成におけるBGM生成モジュール開発に該当するものです。

RPGにおけるBGMは、それが流れているゲーム内シーンにプレイヤーが没入することをうながす効果があります。こうした効果は、シーンのプレイ中にプレイヤーが感じる感情とBGMを聴くことで生じる感情が一致する時に実現すると考えられます。それゆえ、シナリオに合ったBGMを選曲するシステムを開発するにあたっては、シナリオに設定された感情に関する情報を入力として受け取って、受け取った感情情報にふさわしいBGMを出力するようにすれば良いという解決方針が立てられます。この方針に従い、以下のようなタスクを実行しました。

タスク1:既存のRPGで使われているBGMに感情特徴量を付与する。

タスク2:選曲対象となるフリーの楽曲の音響特徴量を分析する。

タスク3:タスク1で作成した感情特徴量が付与されたBGMを入力、タスク2で作成した音響特徴量が付与されたフリー楽曲を出力として、感情特徴量にもとづいて楽曲を選曲できるシステムを訓練する。

タスク4:タスク3で訓練したシステムをゲームに実装したうえで、ゲーム内シーンからシステム情報として受け取った感情特徴量にもとづいて、シーンを盛り上げる楽曲を選曲して流す。

なお、RPGの伝統として戦闘シーンと移動シーンにおけるBGMはそれぞれ一定なことをふまえ、ゲームストーリーの展開が生じるイベントシーンのBGMの選曲のみを行うものとしました。

タスク1では、ドラゴンクエストシリーズとファイナルファンタジーシリーズの初期作品で使われているBGM90曲に対して、人力で感情特徴量を付与しました。感情特徴量を付与する際には、Hevnerが提唱した8つの感情カテゴリーに数値を割り当てるようにしました。

タスク2では、選曲対象となる150のフリー楽曲に対して、PythonライブラリにあるLibrosaを使って「BPM」「スペクトルセントロイド」「クロマベクトル」という3つの音響特徴量を抽出しました。

タスク1とタスク2で作成したデータを使って訓練したBGM選曲システムをゲームに実装すれば、例えば「主要登場人物との別れのシーンに物悲しい楽曲を流す」というような結果が期待できます。

以上のようにして開発したシステムに関して、実際に人間の被験者がゲームをプレイして評価しました。具体的には、選曲されたBGMに対して被験者に感情特徴量を付与してもらいました。その結果、シーンから受け取る感情特徴量と被験者がBGMに付与したそれが類似している場合にはシーンに合致したBGMが流れ、反対にあまり類似していない場合にはシーンの雰囲気にそぐわないBGMが流れました。今回開発したシステムにはまだ改良の余地があると言えます。

以上の発表後に行われた質疑応答では、学習データとして使う既存RPGのBGMに関する感情特徴量は人間が付与するので、評価者によって情報に偏りが生じてしまうのではないか、という指摘がありました。この指摘に対して、発表した山内氏は指摘された問題は認識しており、感情特徴量付与について改善する必要があると答えていました。

【論文】ゲームシナリオと感情状態に合わせてBGMを選曲するシステム

ラベル付けの難しい音楽学習データの不足を半教師あり学習で補う

東京大学の熊田周氏による「VAEを用いた半教師あり学習による自動コード認識」と題された発表では、コード識別AI開発における半教師あり学習の有効性が報告されました。

近年の音楽情報分析では、機械学習を活用したMIR(Music Information Retieval:音楽情報検索)の研究がさかんに行われています。こうした研究の成果として、音源を入力として与えると楽譜を出力するモデル、あるいは音源で使われている(オーケストラやロックバンドといった)演奏形式を識別するモデルといったものが開発されています。今回発表された研究では、コード(いわゆる「和音」のこと)を識別するモデルの開発を試みました。

コード識別AIを開発するにあたっては、まず学習データとして与える楽曲群に対してConstant-Q変換(CQT)を行ってスペクトログラムに変換して、そのスペクトログラムを画像識別モデルであるCNNに入力として渡します(下のスライド画像「3.提案手法」の上部参照)。なお、楽曲には時間幅があるので、1.5秒間隔にセグメント化されたスペクトログラムの断片を連続的に渡すようにします。こうして学習データが与えられたモデルを訓練すれば任意の楽曲のコードを識別できるようになる、というわけなのです。

しかし、学習データとして与える楽曲を収集する際に問題が生じます。コード情報が付与された楽曲が非常に少ないのです。学習データを増やすことによって高精度を実現するAI開発にとって、学習データの不足は致命的です。コード情報付きの楽曲が少ないのは、楽曲にコードを付与するためには専門的な訓練をうけた人材が必要だからです。こうした事情は、画像識別AI開発の訓練に使う学習データでは生じません。というのも、画像に何が写っているかを識別するのは特別な訓練をうけた人材でなくても可能なので、簡単に画像識別に関する情報が付与できるのです。

コード情報付き楽曲データの不足を補う方法として、今回の研究で採用されたのが半教師あり学習です。半教師あり学習とは、正解となる情報を記したラベルを付与した学習データに加えて、ラベルが付与されていないデータも活用して学習する技法です。この技法においては、ラベルなしデータにラベルを付与する処理を実行することによって、ラベル付き学習データの量を増やしながら学習が進みます(スライド「3.提案手法」の下部参照)。コード情報付き楽曲データが不足している今回の研究のようなケースに半教師あり学習を使えば、高精度なAIモデルの実現が期待できます。

以上のような半教師あり学習の有効性を確認するにあたり、以下のような条件でふたつの実験を行いました。

条件1):コード情報付き学習データとして「Isophonicsデータセット」を用意する。このデータセットにはラベルが付与されたビートルズやクィーンの楽曲が合計して207曲ある。

条件2):AIが学習する識別タスクは、13種類あるコードのみを識別するタスクと長調と単調の違いも考慮した25種類のコードを識別するタスクの2種類とする。

実験1):学習データとしてIsophonicデータセットの90%にあたる186曲を使って訓練したAIと、50%の104曲で訓練したAIをそれぞれ開発して、学習データの違いによる精度の差異を調査する。

実験2):13種類の各コードに対してスペクトログラムから抽出した10セグメントの学習データで訓練したAIと、さらに84曲分のラベルなしデータを加えて半教師あり学習を実行したAIを開発して、それぞれの精度を比較する。

実験の結果、次のようなことが判明しました。

・実験1の結果、コードのみを識別するタスクでは有意な精度差は認めれなかった。調性を加味した識別タスクでは有意な精度差が認められた。コードのみを識別するタスクで精度差が認められなかったのは、タスクが簡単だからと考えられる。

・実験2の結果、半教師あり学習で訓練したAIのほうが高精度であった。この結果により、調性を考慮しないコード識別タスクに関しては、半教師あり学習が精度向上に寄与することが判明した。

こうしてコード識別AI開発における半教師あり学習の有効性は実証されました。今後の課題としては、以下のような2項目が挙げられます。

・4音から構成された和音であるセブンスコード(通常の和音は3音で構成)の識別のようなより難しいタスクにおける半教師あり学習の有効性の検証。

・ラベルなしの楽曲を集めただけではコードの出現頻度にばらつきが生じてしまい、その結果コードごとの学習データ量が異なってしまうおそれがある。この問題に対する対策が必要。

なお、発表タイトルにもあるデータ生成技法のひとつであるVAE(Variational AutoEncoder)を用いた学習については、うまく進めることができず実験は未達成に終わったと報告されました。

【論文】VAEを用いた半教師あり学習による自動コード認識

以上の3つの研究発表は、いずれもさらなる発展が期待できるものと言えます。RPGの自動生成を試みた2つの研究に関しては、生成に際して使う素材には人間が制作したものを用意していました。こうした素材をAIによる生成物に置き換えることができたら、シナリオと視聴覚要素がさらに柔軟かつ緊密に統合できるようになるかも知れません。また、コード識別AI開発研究に関しては、課題として示されたように不足している学習データを生成する技法を活用した場合には、効率的に精度を向上させることができるかも知れません。これらの研究発表のような試みが蓄積されることによって、エンタメ領域におけるAIの実装がさらに進んでいくことになるでしょう。

Writer:吉本幸記

RELATED ARTICLE関連記事

MetaとDeepMindが相次いで発表。外交ゲーム『ディプロマシー』ゲームプレイAIの最前線とは?

2022.12.26ゲーム

MetaとDeepMindが相次いで発表。外交ゲーム『ディプロマシー』ゲームプレ...

【GDC 2021】自分の判断で威力偵察や稜線射撃ができるゲームAI

2021.8.18ゲーム

【GDC 2021】自分の判断で威力偵察や稜線射撃ができるゲームAI

【JSAI2022】AIの連携からAIの育成まで、ゲームAIが欠かせない未来へ向けて

2022.7.20ゲーム

【JSAI2022】AIの連携からAIの育成まで、ゲームAIが欠かせない未来へ向...

RANKING注目の記事はこちら