モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。

TAG LIST
CG機械学習ディープラーニングCGへの扉安藤幸央GAN月刊エンタメAIニュースニューラルネットワーク河合律子NVIDIA強化学習三宅陽一郎OpenAI音楽FacebookQAスクウェア・エニックスモリカトロンAIラボインタビュー敵対的生成ネットワーク森川幸人ルールベースDeepMindキャラクターAIシナリオNFTGPT-3デバッグCEDEC2019StyleGANプロシージャル自動生成人工知能学会映画遺伝的アルゴリズムメタAI自然言語処理深層学習マイクロソフトビヘイビア・ツリー吉本幸記GoogleCEDEC2021CEDEC2020ゲームAISIGGRAPH不完全情報ゲームVRナビゲーションAI畳み込みニューラルネットワークAIと倫理アートグーグルディープフェイクGDC 2021大内孝子VFXメタバースGDC 2019マルチエージェントゲームプレイAIボードゲームNPCDALL-ECLIPロボットCNNデジタルツインモリカトロンUnityファッションHTN階層型タスクネットワークJSAI2020TensorFlowMicrosoftイベントレポートテストプレイAIアート水野勇太小説アニメーションガイスターStyleGAN2懐ゲーから辿るゲームAI技術史toioJSAI2021スポーツ研究シムピープル汎用人工知能GDC Summerバーチャルヒューマンブロックチェーン倫理AdobeアストロノーカNVIDIA Omniverseeスポーツ対話型エージェントAmazoneSportsBLUE PROTOCOLシーマンUbisoftAlphaZeroTransformerGPT-2カメラ環世界中島秀之鴫原盛之ソニーDARPAドローンシムシティAI美空ひばり手塚治虫Electronic ArtsメタデータLEFT 4 DEAD通しプレイOpenAI Five本間翔太CMピクサーBERTプラチナエッグイーサリアム作曲ビッグデータ中嶋謙互Amadeus CodeMicrosoft AzureキャリアナラティブOmniverse ReplicatorレコメンドシステムNVIDIA DRIVE SimNVIDIA Isaac Simサイバーエージェント音声認識ロボティクスPyTorchDQN眞鍋和子バンダイナムコスタジオMinecraft齊藤陽介マインクラフトお知らせチャットボットアバターサルでもわかる人工知能VAEOmniverseUbisoft La Forge自動運転車ワークショップGenvid Technologiesメタ知識表現ウォッチドッグス レギオンIGDAどうぶつしょうぎEpic Gamesジェイ・コウガミ音楽ストリーミングマシンラーニング画像生成テキスト画像生成クラウド対話エンジン斎藤由多加リトル・コンピュータ・ピープルコンピューティショナル・フォトグラフィーゴブレット・ゴブラーズ絵画AIりんなシミュレーション完全情報ゲーム坂本洋典釜屋憲彦ウェイポイントパス検索藤澤仁生物学GTC 2022画像認識GTC2022StyleCLIPDeNA長谷洋平masumi toyota宮路洋一OpenSeaGDC 2022教育TextWorldSIGGRAPH ASIADALL-E2GTC2021CycleGANNetHackフェイクニュースエージェントAIボイスアクターNVIDIA CanvasGPUALifeZork人工生命オルタナティヴ・マシンサウンドスケープMCS-AI動的連携モデルASBSマンガモーションキャプチャーぱいどんTEZUKA2020ナビゲーションメッシュ松井俊浩バンダイナムコ研究所スパーシャルAIELYZAELYZA DIGEST3D音声合成マーケティングApex LegendsELIZANinjaコンピュータRPGアップルタウン物語KELDICメロディ言語ゲームTENTUPLAYMARVEL Future FightAstroタイムラプスEgo4Dインタビューバスキア日経イノベーション・ラボ敵対的強化学習階層型強化学習GOSU Data LabWANNGOSU Voice Assistant竹内将SenpAI.GGMobalytics馬淵浩希Cygames岡島学AWS Sagemaker映像セリア・ホデント形態素解析UXAWS Lambda誤字検出認知科学ゲームデザインSentencePieceLUMINOUS ENGINELuminous Productionsパターン・ランゲージ竹村也哉ちょまどボエダ・ゴティエGOAPAdobe MAX 2021模倣学習Omniverse AvatarFPSNVIDIA Rivaマルコフ決定過程NVIDIA MegatronNVIDIA Merlinスタンフォード大学NVIDIA Metropolisパラメータ設計テニスバランス調整協調フィルタリング人狼知能テキサス大学軍事AlphaDogfight TrialsAI Messenger VoicebotエージェントシミュレーションOpenAI CodexStarCraft IIHyperStyleFuture of Life InstituteRendering with StyleIntelDisneyLAIKADisneyリサーチRotomationGauGANGauGAN2ドラゴンクエストライバルズ画像言語表現モデル不確定ゲームSIGGRAPH ASIA 2021Dota 2モンテカルロ木探索ディズニーリサーチMitsuba2ソーシャルゲームEmbeddingワイツマン科学研究所GTC2020CG衣装NVIDIA MAXINEVRファッション淡路滋ビデオ会議ArtflowグリムノーツEponymゴティエ・ボエダ音声クローニングGautier Boeda階層的クラスタリングGopheraibo合成音声JuliusSIE鑑定TPRGOxia Palusバーチャル・ヒューマン・エージェントtoio SDK for UnityArt Recognitionクーガー田中章愛Meta石井敦銭起揚NHC 2021茂谷保伯池田利夫GDMC新刊案内マーベル・シネマティック・ユニバース成沢理恵MITメディアラボMCU著作権アベンジャーズマジック・リープDigital DomainMagic Leap OneMagendaMasquerade2.0ノンファンジブルトークンDDSPフェイシャルキャプチャーサッカーモリカトロン開発者インタビュー里井大輝Kaggle宮本茂則バスケットボール山田暉Assassin’s Creed OriginsAI会話ジェネレーターSea of ThievesGEMS COMPANYmonoAI technologyLSTMモリカトロンAIソリューション初音ミクOculusコード生成AI転移学習テストAlphaCodeBaldur's Gate 3CodeforcesCandy Crush Saga自己増強型AISIGGRAPH ASIA 2020COLMAPADOPデバッギングBigGANGANverse3DMaterialGANリップシンキングRNNグランツーリスモSPORTReBeLグランツーリスモ・ソフィーGTソフィーVolvoFIAグランツーリスモチャンピオンシップRival PrakDGX A100VTuberユービーアイソフトWebcam VTuber星新一賞北尾まどかHALO市場分析将棋メタルギアソリッドVフォートナイトFSMRobloxナップサック問題Live Nation汎用言語モデルWeb3.0AIOpsSpotifyMITスマートコントラクトReplica StudioAWSamuseChitrakarQosmo巡回セールスマン問題徳井直生ジョルダン曲線メディア5GMuZero政治クラウドゲーミングRival Peakがんばれ森川君2号和田洋一リアリティ番組Stadiaジョンソン裕子MILEsNightCafeインタラクティブ・ストリーミングLuis Ruizインタラクティブ・メディアポケモンCodexシーマン人工知能研究所東京工業大学Ludo博報堂ラップSIGGRAPH 2019ArtEmisZ世代AIラッパーシステムARrinnaGROVERプラスリンクス ~キミと繋がる想い~FAIRSTCチート検出Style Transfer ConversationオンラインカジノRCPアップルRealFlowRinna Character PlatformiPhoneデジタルヒューマンDeep FluidsSoul MachinesMeInGameAmeliaAIGraphブレイン・コンピュータ・インタフェースバーチャルキャラクターBCIGateboxLearning from VideoANIMAK予期知能逢妻ヒカリセコムユクスキュルバーチャル警備システムカント損保ジャパン哲学対談上原利之ドラゴンクエストエージェントアーキテクチャアッパーグラウンドPAIROCTOPATH TRAVELER西木康智OCTOPATH TRAVELER 大陸の覇者Siemensアルスエレクトロニカ2019品質保証StyleRigAutodesk逆転オセロニアBentley Systemsワールドシミュレーター奥村エルネスト純いただきストリートH100齋藤精一大森田不可止COBOL高橋智隆DGX H100ロボユニザナックDGX SuperPOD泉幸典仁井谷正充クラウドコンピューティングロボコレ2019Instant NeRFartonomousbitGANsぎゅわんぶらあ自己中心派Azure Machine Learning意思決定モデル脱出ゲームHybrid Reward Architectureコミュニティ管理ウロチョロスSuper PhoenixSNS理化学研究所Project Malmoオンラインゲーム気候変動Project PaidiaEarth-2Project Lookoutマックス・プランク気象研究所Watch Forビョルン・スティーブンスBing気象モデルLEFT ALIVE気象シミュレーション長谷川誠ジミ・ヘンドリックス環境問題Baby Xカート・コバーンエコロジーロバート・ダウニー・Jr.エイミー・ワインハウスSDGsMagentaYouTubeダフト・パンクメモリスタSFGlenn MarshallELYZA PencilThe Age of A.I.Story2Hallucination音声変換レコメンデーションJukebox松尾豊Veap JapanEAPテンセントSIFT福井千春DCGAN医療MOBADANNCEメンタルケア人事ハーバード大学Edgar Handy研修デューク大学Netflixデータマイニングmynet.aiローグライクゲーム東京大学東京理科大学人工音声NeurIPS 2021産業技術総合研究所はこだて未来大学リザバーコンピューティングプレイ動画ヒップホップキャラクターモーションソニーマーケティングサイレント映画もじぱNBA環境音暗号通貨現代アートFUZZLEAlteration粒子群最適化法RPG進化差分法オープンワールド群知能下川大樹AIFAウィル・ライト高津芳希P2E大石真史SIGGRAPH 2022BEiTStyleGAN-NADAレベルデザインDETRゲームエンジンSporeUnreal Engineデノイズ南カリフォルニア大学Unity for Industry画像処理SentropyCPUDiscordCALMプログラミングソースコード生成GMAIシチズンデベロッパーTRPGGitHubウィザードリィMCN-AI連携モデルAI Dungeon西川善司並木幸介サムライスピリッツ森寅嘉ゼビウスSIGGRAPH 2021ストリートファイター半導体Topaz Video Enhance AI栗原聡DLSS山野辺一記NetEase大里飛鳥DynamixyzU-Net13フェイズ構造アドベンチャーゲームADVXLandAGI手塚眞DEATH STRANDING不気味の谷Eric JohnsonOculus Questコジマプロダクション生体情報デシマエンジンインディーゲーム写真高橋ミレイ照明Maxim PeterJoshua Romoffハイパースケープ山崎陽斗深層強化学習立木創太ミライ小町テスラGameGANパックマンTesla BotTesla AI Dayソサエティ5.0SIGGRAPH 2020バズグラフニュースタンテキ東芝DIB-R倉田宜典韻律射影広告韻律転移

NetHackチャレンジを制したのはハイブリッドモデル。浮き彫りになったニューラルネットワークモデルの課題

2022.1.28ゲーム

NetHackチャレンジを制したのはハイブリッドモデル。浮き彫りになったニューラルネットワークモデルの課題

昨年6月、旧Facebook(現在はMeta)はニューラルネットワークに関する世界的カンファレンスNeurlPS 2021で行われるコンペティションのひとつとして、AIにローグライクゲーム『NetHack』をプレイさせてスコアを競う大会「NetHack Challenge At NeurIPS 2021」(以下、「NHC 2021」と略記)の開催を発表しました。本稿では昨年12月に行われた同大会の結果報告を通して、ゲームプレイAIが今後取り組むべき課題を明らかにします。

世界最高難度なNetHack

プレイの度にダンジョンがさまざまに自動生成されるため、同じ状況下でのプレイが原理的に再現されないことを特徴とするローグライクゲームに属するNetHackは、豊富な敵キャラクターやアイテムもあることにより世界最高難度のゲームのひとつと考えられています。

NHC 2021では、ルールベースのゲームプレイAIでNetHackをプレイする部門、強化学習をはじめとするニューラルネットワークを開発技法に採用したゲームプレイAIで参加する部門、さらにゲーム開発業者ではなく大学などの学界の研究チームが参加する部門の3部門が用意されました。そして、これら3部門の全出場者のなかから最優秀ゲームプレイAIを決定します。

スコアを競うにあたっては、NetHackを複数回プレイしてゲームの目的であるダンジョンの最下層から最重要アイテム「イェンダーの魔除け」を持ち帰った回数で順位を決めます。出場した全AIが魔除けを持ち帰られなかった場合は、プレイごとにモンスターを倒すなどして得られるスコアの中央値を競います。

なお、出場AIの開発環境および競技環境は、旧Facebookが2020年に発表したNetHack Learning Environment(NLE)を利用します。同社は、同環境発表時に強化学習を用いたNetHackプレイAIも発表しました。しかし、このAIは同ゲームの熟練人間プレイヤーと比較して圧倒的に低スコアしか記録できませんでした。こうした結果をふまえて、NetHackを攻略するAIに関する知見を研究コミュニティで共有する意味も込めて、NHC 2021は開催されたのでした。

参考記事:ゲームプレイAIに対する新たな挑戦「NetHackチャレンジ」とは何か?

「稼ぎプレイ」に徹したAIが続出

NHC 2021の主催者チームは2021年12月、同コンペティションの結果をまとめたレポートを公開しました。そのレポートによると、イェンダーの魔除けの持ち帰ったAIはなかったものも、前述の3部門を合わせた総合ランキングのうちトップ3はルールベースAIが占めるというやや意外な結果となりました(下のグラフ参照。赤の棒がルールベースAI、青がニューラルネットワーク)。

ランキング1位になったAIは、大会で唯一のルールベースとニューラルネットワークを併用するハイブリッドモデルでした。同AIは、モンスターが接近する状況に応じてルールベースとニューラルネットワークを切り替えるアルゴリズムを実装していました。

好成績を収めたルールベースAIの各開発チームには、NetHackのゲームプレイに精通した開発者がいました。そうしたチームには、機械学習の開発経験が豊富なメンバーもいました。実際、上位2チームは当初はニューラルネットワークを開発技法として採用していたものも、開発途中でルールベースのほうがハイスコアを狙えると判断して開発技法を変えた、とのことでした。

大会の全体的傾向として、NetHck本来の目的であるダンジョン最下層にあるアイテムを取りに行かずに、モンスターが弱いために死ぬリスクが相対的に少ないダンジョン上層で弱いモンスターを倒し続ける「稼ぎプレイ」に徹するゲームプレイAIが多数あったことが報告されています。こうした消極的な戦略の流行は、ゲームをクリアできない場合は複数回プレイの中央値を競う大会のルールに低リスク状態で適応した結果とも見なせます。

明確な報酬がない状況に弱いAI

稼ぎプレイがトレンドとなってしまった結果をうけて、NHC 2021レポートは今後の大会運営に関する改善点として目標設定の修正を挙げています。第1回目の今大会で複数回プレイにおけるハイスコアではなく中央値が比較指標として選ばれたのは、ローグライクゲーム特有の偶然性に評価が影響を受けないようにするためでした。ハイスコアを比較指標に選ぶと、偶然簡単な構造のダンジョンの生成が続いた結果、突発的にハイスコアが記録される可能性が排除できないのです。

レポートは、ルールベースAIがニューラルネットワークAIをスコアで凌駕した理由についても考察しています。NetHackを攻略するには、「ユニコーンの角を使って解毒する」のような明示的に定義しやすい攻略のヒントを知っているか否かが非常に重要になります。ルールベースAIは、こうした攻略のヒントをニューラルネットワークよりアルゴリズムに組み込みやすいのです。戦略のヒントを実装することの重要性は、ランキング上位の開発チームには人間の熟練プレイヤーがいたことからもうかがえます。こうしたチームは、おそらく自分たちが知っている戦略のヒントをAIに実装してハイスコアを記録したのでしょう。

また大会レポートは、ニューラルネットワークAIがNetHackのプレイに苦戦する原因として、明確な報酬を設定するのが難しいことを挙げています。同ゲームには魔除けを持ち帰るというおおまかな戦略目標があるものも、その目標から個々のダンジョンにおける立ち居振る舞いを導出することは極めて困難です。こうした戦術的目標が定かでない「まばらな報酬(sparse reward)」状態では、強化学習をふくめたニューラルネットワークAIが効率的に学習できないのは以前から知られていました。

まばらな報酬状態におけるニューラルネットワークAIの学習を改善した事例として、ローグライクゲームと同様にダンジョンを探索するテキストゲーム『Zork』プレイAIに関するMicrosoftの研究があります。この研究では、逆動力学デコーディングと人間プレイヤーが残したプレイログを用いた学習によってZorkのプレイにおけるスコアを上昇させました(以下の参考記事も参照)。

NHC 2021レポートも、ニューラルネットワークAIのスコアを改善する案として人間プレイヤーのプレイログから学習することを示唆しています。人間が残したプレイログを学習すれば、ルールベースAIのように明示的なアルゴリズムとして組み込まなくても、ニューラルネットワークAIが戦略のヒントを習得できるかも知れません。

前述のようにいまだNetHackを攻略したAIが現れていない現状では、ルールベースAIとニューラルネットワークAIの両方に同ゲームを攻略する可能性が残されています。もっとも最優秀AIがハイブリッドモデルだったことから、2回目のNetHack Challengeが開催された場合、ハイブリッドモデルが主流になると予想されます。ぜひとも2回目の大会を開催することで、ゲームプレイAIの新たな可能性と限界を示して欲しいところです。

参考記事:無数の可能性から最適な行動を選ぶ。『Zork』プレイAIに見る言語的世界との新たな相互作用

Writer:吉本幸記

RELATED ARTICLE関連記事

【GDC 2022】キャラクターAIが感じるままにお絵かきできたら

2022.5.09ゲーム

【GDC 2022】キャラクターAIが感じるままにお絵かきできたら

AI時代の死生観とアイデンティティはどこへ向かうのか?:藤澤仁氏×森川幸人氏対談(後編)

2019.10.11ゲーム

AI時代の死生観とアイデンティティはどこへ向かうのか?:藤澤仁氏×森川幸人氏対談...

【CEDEC2019】人工知能にテストプレイを丸投げできるか?

2019.9.24ゲーム

【CEDEC2019】人工知能にテストプレイを丸投げできるか?

RANKING注目の記事はこちら