モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。

TAG LIST
ディープラーニング機械学習CGCGへの扉安藤幸央GANニューラルネットワーク月刊エンタメAIニュース強化学習三宅陽一郎音楽OpenAIモリカトロンAIラボインタビュー敵対的生成ネットワークQAスクウェア・エニックス河合律子シナリオNVIDIAFacebookキャラクターAIルールベースデバッグCEDEC2019プロシージャルDeepMind人工知能学会ビヘイビア・ツリーGoogleCEDEC2021CEDEC2020ゲームAI映画SIGGRAPH遺伝的アルゴリズム不完全情報ゲームメタAIナビゲーションAI森川幸人畳み込みニューラルネットワーク自然言語処理深層学習マイクロソフトAIと倫理グーグル自動生成GDC 2021GPT-3GDC 2019マルチエージェントVRボードゲームロボットStyleGANCNNVFXモリカトロンゲームプレイAIファッションアートHTN階層型タスクネットワークJSAI2020大内孝子TensorFlowMicrosoftイベントレポートテストプレイ水野勇太アニメーションガイスターNPCCLIPNFTtoio吉本幸記JSAI2021スポーツディープフェイクシムピープル汎用人工知能GDC Summereスポーツ対話型エージェントeSportsBLUE PROTOCOLシーマンAIアート小説DALL-EStyleGAN2AlphaZeroカメラ環世界中島秀之懐ゲーから辿るゲームAI技術史研究DARPAドローンシムシティAI美空ひばり手塚治虫Electronic Artsメタデータブロックチェーン通しプレイOpenAI Five本間翔太CM倫理ピクサーAdobeイーサリアム作曲中嶋謙互Amadeus CodeMicrosoft AzureアストロノーカキャリアナラティブAmazon音声認識ロボティクスPyTorchDQN眞鍋和子バンダイナムコスタジオUnity齊藤陽介マインクラフトお知らせサルでもわかる人工知能VAEUbisoftUbisoft La ForgeワークショップGenvid Technologies知識表現ウォッチドッグス レギオンIGDAどうぶつしょうぎジェイ・コウガミ音楽ストリーミングマシンラーニングクラウド斎藤由多加リトル・コンピュータ・ピープルコンピューティショナル・フォトグラフィーGPT-2完全情報ゲーム坂本洋典釜屋憲彦ウェイポイントパス検索藤澤仁生物学画像認識DeNA長谷洋平鴫原盛之masumi toyota宮路洋一TextWorldSIGGRAPH ASIAソニーGTC2021CycleGANフェイクニュースGPUALifeZork人工生命オルタナティヴ・マシンサウンドスケープMCS-AI動的連携モデルASBSマンガぱいどんTEZUKA2020ナビゲーションメッシュ松井俊浩スパーシャルAIマーケティングApex LegendsELIZANinjaコンピュータRPGアップルタウン物語KELDICメロディ言語ゲームTENTUPLAYLEFT 4 DEADMARVEL Future FightAstroタイムラプスEgo4Dバスキアバーチャルヒューマン日経イノベーション・ラボ敵対的強化学習階層型強化学習GOSU Data LabWANNGOSU Voice Assistant竹内将SenpAI.GGMobalytics馬淵浩希Cygames岡島学AWS Sagemaker映像セリア・ホデント形態素解析UXAWS Lambda誤字検出認知科学BERTゲームデザインSentencePieceLUMINOUS ENGINEプラチナエッグLuminous Productionsパターン・ランゲージ竹村也哉ちょまどボエダ・ゴティエビッグデータGOAPAdobe MAX 2021デジタルツインメタバース模倣学習NVIDIA OmniverseOmniverse AvatarFPSNVIDIA Rivaマルコフ決定過程NVIDIA MegatronNVIDIA Merlinスタンフォード大学NVIDIA Metropolisパラメータ設計テニスOmniverse Replicatorバランス調整レコメンドシステムNVIDIA DRIVE Sim協調フィルタリングNVIDIA Isaac Sim人狼知能テキサス大学軍事サイバーエージェントAlphaDogfight TrialsAI Messenger VoicebotエージェントシミュレーションOpenAI CodexStarCraft IIFuture of Life InstituteIntelLAIKARotomationドラゴンクエストライバルズ不確定ゲームDota 2モンテカルロ木探索ソーシャルゲームEmbeddingGTC2020NVIDIA MAXINE淡路滋ビデオ会議グリムノーツゴティエ・ボエダGautier Boeda階層的クラスタリングaiboJuliusSIETPRGバーチャル・ヒューマン・エージェントtoio SDK for Unityクーガー田中章愛石井敦銭起揚茂谷保伯MinecraftGDMC成沢理恵MITメディアラボ著作権マジック・リープMagic Leap OneMagendaノンファンジブルトークンDDSPサッカー里井大輝KaggleバスケットボールAssassin’s Creed OriginsSea of ThievesGEMS COMPANYmonoAI technologyアバター初音ミクOculus転移学習テストBaldur's Gate 3Candy Crush SagaSIGGRAPH ASIA 2020デバッギングBigGANMaterialGANリップシンキングRNNReBeL自動運転車VolvoRival Prakユービーアイソフト北尾まどかHALO将棋メタルギアソリッドVFSMナップサック問題汎用言語モデルSpotifyMITReplica StudioamuseChitrakar巡回セールスマン問題ジョルダン曲線5GMuZeroクラウドゲーミングRival Peak和田洋一リアリティ番組Stadiaジョンソン裕子MILEs対話エンジンインタラクティブ・ストリーミングインタラクティブ・メディアシーマン人工知能研究所Ludoゴブレット・ゴブラーズTransformerSIGGRAPH 2019ArtEmis絵画ARGROVERFAIRAIりんなチート検出オンラインカジノアップルRealFlowiPhoneシミュレーションDeep FluidsMeInGameAIGraphブレイン・コンピュータ・インタフェースBCILearning from Video予期知能ユクスキュルカント哲学ドラゴンクエストエージェントアーキテクチャPAIROCTOPATH TRAVELER西木康智OCTOPATH TRAVELER 大陸の覇者アルスエレクトロニカ2019StyleCLIPStyleRig逆転オセロニア奥村エルネスト純いただきストリート齋藤精一大森田不可止高橋智隆ロボユニザナック泉幸典仁井谷正充ロボコレ2019ぎゅわんぶらあ自己中心派Azure Machine Learning意思決定モデル脱出ゲームHybrid Reward ArchitectureウロチョロスSuper Phoenix理化学研究所Project Malmo教育Project PaidiaProject LookoutWatch ForBingLEFT ALIVE長谷川誠ジミ・ヘンドリックスBaby Xカート・コバーンロバート・ダウニー・Jr.エイミー・ワインハウスMagentaYouTubeダフト・パンクSFGlenn MarshallThe Age of A.I.Story2HallucinationレコメンデーションJukeboxテンセントSIFTDCGANMOBADANNCE人事ハーバード大学研修デューク大学mynet.aiローグライクゲームNetHack人工音声NeurIPS 2021はこだて未来大学プレイ動画ヒップホップサイレント映画NBA環境音現代アートエージェント粒子群最適化法進化差分法群知能下川大樹ウィル・ライト高津芳希大石真史BEiTレベルデザインDETRSporeAIボイスアクターデノイズ南カリフォルニア大学画像処理NVIDIA CanvasSentropyCPUDiscordCALMプログラミングソースコード生成GMAIシチズンデベロッパーTRPGGitHubウィザードリィMCN-AI連携モデルAI Dungeon西川善司並木幸介サムライスピリッツ森寅嘉ゼビウスSIGGRAPH 2021ストリートファイター半導体Topaz Video Enhance AI栗原聡DLSS山野辺一記NetEase大里飛鳥DynamixyzモーションキャプチャーU-Net13フェイズ構造アドベンチャーゲームADVXLandAGI手塚眞DEATH STRANDING不気味の谷Eric JohnsonOculus Questコジマプロダクション生体情報デシマエンジンインディーゲーム写真高橋ミレイ照明Maxim PeterJoshua Romoffハイパースケープ山崎陽斗深層強化学習立木創太バンダイナムコ研究所ミライ小町テスラGameGANELYZAパックマンTesla BotTesla AI Dayソサエティ5.0ELYZA DIGESTSIGGRAPH 2020バズグラフニュースタンテキ東芝DIB-R倉田宜典3D音声合成韻律射影広告韻律転移

【CEDEC2021】ゲーム産業における対話キャラクターAIの発展(前編)

2021.10.18ゲーム

【CEDEC2021】ゲーム産業における対話キャラクターAIの発展(前編)

CEDEC2021で行われたセッション「ゲーム産業における対話キャラクター人工知能技術の発展」にて、スクウェア・エニックスの三宅陽一郎氏が講演しました。ゲーム分野以外にも対話エージェントに注目が集まっている今、対話キャラクターAI技術の体系化には大きな意味があります。本レポートは前後編に分かれています。まず前編となる本稿ではゲームAIにおける対話エージェントの位置づけ、およびゲーム産業外で研究されている対話エージェントとの違いについてまとめます。

ゲームはプレイヤーとの”対話”をどのように実現してきたか

三宅氏はゲームのおもしろさと人工知能の相関を図1のように示します。CGやアニメという表現の役割、インタラクション、そして第3の軸として人工知能がもたらす知的な喜びは、ゲームに深みを与えるものとして存在します。

図1:人工知能がゲームのおもしろさに深みを与える

まず、人工知能がゲームの中でどう使われているのか、現在のゲームAIの全体像から俯瞰します。ゲームの中のAIとして「メタAI」「キャラクターAI」「スパーシャルAI」があり、メタAIはゲーム全体を俯瞰的にコントロールするAI、キャラクターAIはキャラクタの頭脳、スパーシャルAIは空間的認識を行うAIのことを指します。また、ゲームの外側、つまり開発における人工知能技術の活用(自動バランスAIやQAのAIなど)もあります。

図2:ゲームの中のAI、ゲームの外のAI

今回解説する対象はゲームの中で使われるAIです。ゲームと言ってもさまざまなジャンルがありますが、ここでは大きく「物語的ゲーム」と「アクションゲーム」に分けて考えます。AIに求められる機能は両者それぞれ異なります。物語的ゲームでは物語を進行するAIと物語の中で役を演じるAIが、アクションゲームではゲームの空間でうまく運動するAIと環境や状況をリアルタイムで認識するAIがプレイヤーとの対話を担う形になります。

物語的ゲームにおける人工知能のモデルで長く採用されてきたスタイルは、個々のキャラクターAIがあり、必要な場面で演技をさせるというものです。一方でアクションゲームでは、歩ける場所を判断するなどの空間的認識とともにキャラクターAIを併用させます。ただ、近年ではこの2つが融合した物語的アクションゲームが増えてきたことで、「メタAI」と「キャラクターAI」「スパーシャルAI」の3つが連携する形でゲーム内のAIが構築されるようになりました。これを三宅氏は「MCS-AI動的連携モデル」と呼びます。

図3:MCS-AI動的連携モデル

歴史的に俯瞰して見ると、昔はレベルスクリプトと言われる完全に動作が規定されたプリプログラムによってゲームを進行させていました。しかし、3Dゲームの台頭とともに1994年頃にはナビゲーションAIやスパーシャルAIが実装されるようになり、ゲーム全体をコントロールするようになります。1999年頃にはキャラクターAIが自律化し始めますが、キャラクターAIが勝手に動き回るようになるとゲームとしての統制が取れなくなるため、上から制御するメタAIが実装されるようになります。そして、その3つが連携するモデルが一般的になったのが現在です。

図4:ゲームの進化と人工知能モデルの変化

このようにゲームAIは、ゲーム世界とプレイヤーの間をつなぐことでゲームを進行させる手助けをします。そして、コマンドや選択肢を選ぶなどのプレイヤーの行動を解釈し、それに応答することで人間と人工知能のインタラクションを生じさせます。

図5:ゲーム内の模式図

人間と人工知能が会話をする対話モデルについては、雑談が最も難易度が高いと言われています。次にある程度テーマを決めた自由会話、ミニゲーム、キーワードだけの会話、一問一答、一方的な会話の順に難易度が下がり、それぞれコネクショニズムとシンボリズムのアプローチがあります。

図6:人間と人工知能の対話の難易度
図7:対話人工知能の技術

また、ゲーム産業ではまだそこまで本格的ではありませんが、オントロジーの利用も始まっています。オントロジーとは概念を体系化することで、それを使うことである程度の会話が簡単に組めるようになります。

例えばロールプレイングゲームの会話を考えてみます。通常、魔法のデータは、「名前」「ダメージ」「種類」という形のリストになっていますが、これを人工知能の知識表現の中にオントロジーとして組みます。「魔法」の中に「回復・補助魔法」「攻撃魔法」「時間魔法」という分類があり、さらに「回復・補助魔法」の中に「蘇生魔法」「回復魔法」という分類が存在します。AIはこのグラフを見て、今の自分のMPは「7」しかないから使える魔法はこれだと判断することができます。

図8:オントロジーの例

あるいは、フレームベースの会話の作り方は次のような形となります。プロファイルデータに対して、自分が装備しているものや「最後に訪れた街」などのデータを次々とインプットしていきます。それによって「お客さんどこからきたの?」「ケルムの街から」という会話を簡単に生成することができます。ゲーム産業ではこれまでも、こうしたテクニックが部分的に使われてきましたが、最近ではディープラーニングも活用されるようになってきました。

図9:フレームベースの作り方(プロファイルデータに対してインプットしていく)

対話エージェントの本質とは

そもそも人間と人工知能の間には多層的な関係があり、ゲームの中の人工知能(キャラクター)とプレイヤーも複数のレイヤーにわたって関係を結ぶことになります。例えば草原やダンジョンの舞台など、ある環境の中で一緒にいるキャラクターのちょっとした仕草、あるいは身体と身体がぶつかるなどのインタラクションがその関係性に影響を与えます。

図10:人間と人工知能は複数の関係で結ばれている

一般的に、学術分野およびビジネスでの応用における「対話エージェント」はテキスト(言語)をベースにしたものがほとんどですが、ゲームの場合、身体を持って身振りとともに会話を行うエージェントのことを指し、さらには自分自身で考えて行動する自律型エージェントもふくみます。つまり、ゲーム産業における対話エージェントの場合、「対話」の意味をもっと深く取る必要があります。単に会話だけのことではなく、言葉なしの対話、身体による対話について取り上げるべきです。その点がゲーム産業における対話エージェントの最大の特徴だと三宅氏は指摘します。

図11:ゲーム産業における対話エージェントの分類

対話エージェントはユーザーと何らかのインタラクションをしながら応答しますが、それには下記の2つの能力が求められます。

  1. ユーザーの行動を解釈する
  2. その状況に応じて応答する

対話エージェントのはじまりと言われるのは1966年の『ELIZA(イライザ)』です。これはカウセリングのエージェントで、簡単な構文解析機能を持ち、抽出した語句から質問文を形成します。構文解析などの自然言語処理は50年代からありますが、ELIZAは人間との会話をする対話型を実現した初めての例です。ELIZAはさまざまな所に移植されました。テキストベースで進行するコンピュータRPG(CRPG)もその中のひとつです。

図12:ELIZAからEcala、Dungeonへ

三宅氏は対話エージェントのプログラムとテキストベースのRPGは起源を同一にしているという見解を示しつつ、「ユーザーが何と対話をするか」を重要なポイントとして挙げています。ELIZAの場合は、ELIZAというエージェントとの対話です。ゲームの場合は、ゲームそのものが語り手になることで、いわゆるインタラクティブストーリーとなり、そこに語りの主体が生まれます。つまりゲームの場合はゲームそのものと対話するということになりますが、これはゲームの進化とともに変わっていくことになります。

図13:ゲームの場合、ユーザーはゲームそのものと対話する

語りの主体とキャラクターの分離

前述の70年代のコンピュータロールプレイング(CRPG)の流れがあり、80年代に入るとキャラクター対話ゲーム『エミー2』(1985年、ASCII)、『リトル・コンピュータ・ピープル』(1985年、Activision)のようなキャラクターの生活を観察するゲーム、あるいは犬を育成する『パピーラブ』(1986年、Addison Wesly Publishing)などが登場します。

デジタルゲームは、対話エージェントから発展している側面もあります。三宅氏が例示したのは『Zork』という、テキストベースでプレイヤーと対話することで、あらかじめ用意されたスクリプトと場合分けによって進行するゲームです。これもまた、ゲームとプレイヤーとの対話とみなすことができます。

図14:『Zork』

ゲームとプレイヤーとのテキストだけの会話からキャラクターが身体を持ち、対話エージェントになる、つまりキャラクターを成長させることでゲームに深みを出していくことは今から見ると当然のことですが、テキストで返すだけの存在から身体を持つことで物理的インタラクションが生まれることで、会話、身体、物理的インタラクションの3つの軸が揃います。その3軸により、ユーザーが経験するキャラクターを通したゲーム世界はより深いものとなります。

関連記事:無数の可能性から最適な行動を選ぶ。『Zork』プレイAIに見る言語的世界との新たな相互作用​​

図15:デジタルゲームにおける対話エージェントの発展

通常のキャラクターと対話エージェントの違いは、前者は物理的インタラクションの比重が非常に高いことです。一方で後者である対話エージェントは変化に富む会話によってアクションとは異なる次元の楽しみを与えてくれます。例えば戦闘していて掛け声が出る、あるいは「ヤバそうだから逃げよう!」というような会話が出てくることで、より臨場感のある体験を実現します。こうした対話エージェントの応用先として、RPGの仲間や、自分の代わりになるキャラクター、あるいはモブなど、色々な用途があります。

図16:通常のキャラクターと対話エージェント

そして、語り手としての主体であるゲームシステムに対し、キャラクターが出てくることで語り手とキャラクターの分離が起こります。かつてはストーリーを直接ゲームシステムが語っていましたが、キャラクターが登場して仕草や行動により間接的に物語を語るシステムがゲームの中で発生します。つまり、直接は語らずに展開によって物語を見せていくナラティブが発生するということです。

図17:デジタルゲームにおけるナラティブの発生

事例として『アップルタウン物語』(1987年、スクウェア)を示します。キャラクター(女の子)の生活を観察するゲームで、プレイヤーは荷物を届けたり、お願いごとをしたり、間接的に関わることができますが、基本的にはこの女の子の生活を見ているだけです。これは、ゲームシステム自体は物語を語るわけではなく、キャラクターが生活しているところから何かを読み取るという形のゲームです。

図18:『アップルタウン物語』(1987年、スクウェア)

1989年発売の『シムシティ』は、街を作っていくゲームです。グリッド上のマップに発電所やマンションなど、好きな建物を置くことができます。すると、ゲームシステム側は「工場を置いたから公害が発生する」「マンションを建てたら人口密度が上がる」というように、どんどん街の状況を変化させていきます。街全体がひとつのシステムになっているのが特徴です。プレイヤーのアクションによって街が変化し、プレイヤーがその変化を見てまたアクションを施すことの繰り返しでゲームが進行していきます。

仕組みとしては、実際にプレイヤーに見えている層の下に何層かレイヤーがあり、そこでアクションに対する計算がなされています。例えば、2層目では人口密度の計算をして、第3層では地形の影響を、第4層では人口増加率の警察署とか消防署への影響を計算して、それをプレイヤーに見える階層に返すという形です。言い換えれば、街のシステムという語りの主体があり、それに対して操作ユニットが前面に出ることでナラティブを発生していると言えます。

関連記事:三宅陽一郎が語る、ウィル・ライトとシムシティの思想:懐ゲーから辿るゲームAI技術史vol.1​​

図19:『シムシティ』の多層構造

『ワンダープロジェクトJ 機械の少年ピーノ』(1994年、エニックス)および『ワンダープロジェクトJ2 コルロの森のジョゼット』(1996年、エニックス)では、対話エージェントの経験が非常に大きな意味を持ちます。プレイヤーが作るキャラクターの経験の上にゲームシステムが混在するという形で、ゲームが進んでいきます。『The Sims』が2000年にUtilityベースの内面モデルを発表しますが、それに先駆けて、かなり早い時期に複雑な内面モデルを提示したと言えます。

対話エージェントの歴史としてまとめると、『ELIZA』からテキストアドベンチャーゲームが発生し、いくつかの分岐がなされます。1つは箱庭シム系、『リトル・コンピュータ・ピープル』『アップルタウン物語』など。もう1つの流れに『エミー2』『パピーラブ』『Creatures』など、対話キャラクター育成があります。ゲーム内の会話については、特にこれが代表的というものではなく、さまざまなゲームにその実装例を見ることができます。

図20:対話エージェントの歴史

ゲーム産業外における対話エージェント研究

ゲーム産業外において、対話エージェントは近年盛り上がっている分野です。例えば「KELDIC」は稲葉通将氏(電気通信大学 人工知能先端研究センター)が開発したTwitter上の会話エージェントで、多くのフォロワーのデータを学習して、人間と会話することができます。学習機能もあり、ある文脈においてこのセリフがどうだったかというアンケートを取ることで、AIが評価づけしたものとの差異から学習していく仕組みになっています。

図21:KELDICの学習機能

現状では、ディープラーニングを用いたエージェントの研究はゲーム産業よりもゲーム産業外で活発に行われています。特に2019年はゲームを題材に多数のエージェントが研究されました。たとえば、Microsoft Researchはこれまでのテキストアドベンチャーゲームを収集して、それを解くAI「TextWorld」を開発しました。テキストベースのアドベンチャーゲームを自動生成するAIを開発し、その中でイベントなども作っていく研究も進んでいます。こちらは、キャラクターというよりは語りの主体を研究していると言えます。

図22:Microsoft Research「TextWorld」

『Minecraft』上にAI研究のためのプラットフォーム「Malmo」がありますが、Facebookはそこで会話をしながらMinecraftのクエストを解く「CraftAssist」という研究を行っています。また、カーネギーメロン大学はMalmoを拡張した「MineRL」を使って、エージェントがダイヤモンドをどれだけ早く取得できるかをAIに解かせる研究しています。

図23:Facebook「CraftAssist」
図24:カーネギーメロン大学「MineRL」

Facebook AIの「LIGHT」はテーブルトークRPGを用いた対話学習の研究です。LIGHTはテキストアドベンチャーのフレームワークで、その中でクラウドワーカーを使って会話データを集めていきます。そこでは、さまざまな設定を集めてロールを割り当てていきます。たとえば10分間会話をさせて会話データを集めます。その集まった会話データをコーパスとして、さまざまな会話の研究を行います。こちらも、キャラクターとの会話の研究です。

前項で見てきたように、どちらかというとゲーム産業はゲームシステムとキャラクターをインタラクションさせるエージェントを作ってきました。一方、こうした学術研究ではキャラクターそのものにフォーカスしてより賢くしようとする傾向があります。そのことを踏まえて、次のゲーム産業におけるエージェント研究として重要になるのは、仲間キャラクターや敵キャラクターをふくめた関係性を模索することだと三宅氏は捉えています。

後編に続く

Writer:大内孝子

RELATED ARTICLE関連記事

【CEDEC2021】ゲームキャラクターの声を音声合成に置き換えるのは可能か

2021.10.15ゲーム

【CEDEC2021】ゲームキャラクターの声を音声合成に置き換えるのは可能か

実施はAI、評価は人間。AIと人間の分業が進む海外ゲームQA事情

2020.11.27ゲーム

実施はAI、評価は人間。AIと人間の分業が進む海外ゲームQA事情

DeepMind開発汎用ゲーム学習環境「XLand」はAGI実現につながるか?

2021.8.27ゲーム

DeepMind開発汎用ゲーム学習環境「XLand」はAGI実現につながるか?

RANKING注目の記事はこちら