モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。

TAG LIST
機械学習ディープラーニングCGCGへの扉安藤幸央GANニューラルネットワーク月刊エンタメAIニュース強化学習モリカトロンAIラボインタビュー音楽三宅陽一郎敵対的生成ネットワークQAOpenAICEDEC2019シナリオNVIDIAFacebookデバッグスクウェア・エニックスDeepMind人工知能学会CEDEC2020ゲームAI映画遺伝的アルゴリズム不完全情報ゲーム深層学習ルールベースAIと倫理ビヘイビア・ツリーGoogleSIGGRAPHGDC 2019VRキャラクターAIボードゲーム畳み込みニューラルネットワークロボットマイクロソフトグーグルプロシージャルVFXメタAIファッション河合律子StyleGAN自動生成JSAI2020CNNイベントレポートモリカトロンマルチエージェントゲームプレイAIナビゲーションAI森川幸人水野勇太ガイスターCLIP自然言語処理アートtoioHTN階層型タスクネットワークスポーツTensorFlowGDC SummerMicrosofteSportsBLUE PROTOCOL小説DALL-EAlphaZeroカメラ環世界中島秀之懐ゲーから辿るゲームAI技術史JSAI2021研究ディープフェイクDARPAドローンAI美空ひばり手塚治虫汎用人工知能GPT-3メタデータ通しプレイOpenAI Five本間翔太CM倫理ピクサーAdobe作曲中嶋謙互Amadeus CodeMicrosoft Azureキャリアテストプレイeスポーツ音声認識PyTorchDQN眞鍋和子バンダイナムコスタジオシーマンUnity齊藤陽介マインクラフトお知らせAIアートサルでもわかる人工知能VAEアニメーションワークショップGenvid Technologies知識表現IGDANPCどうぶつしょうぎジェイ・コウガミ音楽ストリーミングStyleGAN2マシンラーニングクラウドコンピューティショナル・フォトグラフィーGPT-2完全情報ゲーム坂本洋典釜屋憲彦藤澤仁生物学画像認識NFT長谷洋平鴫原盛之masumi toyota宮路洋一SIGGRAPH ASIA吉本幸記ソニーフェイクニュースシムピープルGPUALife人工生命オルタナティヴ・マシンサウンドスケープASBSマンガぱいどんTEZUKA2020松井俊浩Electronic ArtsマーケティングApex LegendsNinjaゲームTENTUPLAYMARVEL Future Fightタイムラプスバスキアブロックチェーン階層型強化学習WANN竹内将馬淵浩希岡島学映像セリア・ホデントUX認知科学ゲームデザインLUMINOUS ENGINELuminous Productionsパターン・ランゲージちょまどビッグデータアストロノーカ模倣学習ナラティブFPSマルコフ決定過程スタンフォード大学パラメータ設計テニスバランス調整レコメンドシステム対話型エージェント協調フィルタリング人狼知能Amazon軍事AlphaDogfight TrialsエージェントシミュレーションStarCraft IIFuture of Life InstituteIntelロボティクスLAIKARotomationドラゴンクエストライバルズ不確定ゲームDota 2モンテカルロ木探索ソーシャルゲームEmbeddingGTC2020NVIDIA MAXINE淡路滋ビデオ会議グリムノーツゴティエ・ボエダGautier Boeda階層的クラスタリングaiboJuliusSIETPRGバーチャル・ヒューマン・エージェントtoio SDK for Unityクーガー田中章愛石井敦銭起揚茂谷保伯MinecraftGDMC成沢理恵MITメディアラボ著作権マジック・リープMagic Leap OneMagendaノンファンジブルトークンDDSPサッカー里井大輝KaggleバスケットボールAssassin’s Creed OriginsSea of ThievesGEMS COMPANYmonoAI technologyアバター初音ミクOculus転移学習テストBaldur's Gate 3Candy Crush SagaSIGGRAPH ASIA 2020デバッギングBigGANMaterialGANリップシンキングRNNUbisoftReBeLUbisoft La Forge自動運転車VolvoRival Prakウォッチドッグス レギオンユービーアイソフト北尾まどかHALO将棋メタルギアソリッドVFSMナップサック問題汎用言語モデルSpotifyMITReplica StudioamuseChitrakar巡回セールスマン問題ジョルダン曲線5GMuZeroクラウドゲーミングRival Peak和田洋一リアリティ番組Stadiaジョンソン裕子MILEs対話エンジンインタラクティブ・ストリーミング斎藤由多加インタラクティブ・メディアリトル・コンピュータ・ピープルシーマン人工知能研究所Ludoゴブレット・ゴブラーズTransformerSIGGRAPH 2019ArtEmis絵画ARGROVERFAIRAIりんなチート検出オンラインカジノアップルRealFlowiPhoneシミュレーションDeep FluidsMeInGameAIGraphブレイン・コンピュータ・インタフェースBCILearning from Video予期知能ウェイポイントユクスキュルパス検索カント哲学ドラゴンクエストエージェントアーキテクチャPAIROCTOPATH TRAVELER西木康智OCTOPATH TRAVELER 大陸の覇者アルスエレクトロニカ2019StyleCLIPDeNAStyleRig逆転オセロニア奥村エルネスト純いただきストリート齋藤精一大森田不可止高橋智隆ロボユニザナック泉幸典仁井谷正充ロボコレ2019ぎゅわんぶらあ自己中心派Azure Machine Learning意思決定モデル脱出ゲームHybrid Reward ArchitectureウロチョロスSuper Phoenix理化学研究所Project Malmo教育TextWorldProject PaidiaProject LookoutWatch ForBingLEFT ALIVE長谷川誠ジミ・ヘンドリックスBaby Xカート・コバーンロバート・ダウニー・Jr.エイミー・ワインハウスMagentaYouTubeダフト・パンクSFGlenn MarshallThe Age of A.I.Story2HallucinationレコメンデーションJukeboxGTC2021CycleGANテンセントSIFTDCGANMOBADANNCE人事ハーバード大学研修デューク大学mynet.aiローグライクゲームNetHack人工音声NeurIPS 2021はこだて未来大学プレイ動画ヒップホップサイレント映画NBA環境音現代アートエージェント粒子群最適化法進化差分法群知能下川大樹ウィル・ライト高津芳希シムシティ大石真史BEiTレベルデザインDETRSporeAIボイスアクターデノイズ南カリフォルニア大学画像処理NVIDIA CanvasSentropyCPUDiscordZorkCALMGMAITRPGウィザードリィAI Dungeon西川善司サムライスピリッツゼビウスストリートファイター栗原聡山野辺一記大里飛鳥13フェイズ構造手塚眞不気味の谷Oculus Quest生体情報写真照明山崎陽斗立木創太スパーシャルAIGameGANパックマンソサエティ5.0SIGGRAPH 2020DIB-R3D広告

【JSAI2021】AIエージェントのインタラクション設計の諸相:AIは、他のAIや人間と協調できるのか?

2021.7.13先端技術

【JSAI2021】AIエージェントのインタラクション設計の諸相:AIは、他のAIや人間と協調できるのか?

2021年6月8日から11日にオンラインで開催された第35回人工知能学会全国大会では、AIエージェントの基礎的なインタラクション設計をテーマにしたセッションが行われました。そのセッションではAIエージェントの学習技法や、他のAIエージェントあるいは人間との協調行動に関する発表がありました。この記事では、そうした発表を紹介していきます。

進化計算手法でパラメータを最適化する

慶應義塾大学理工学部の下川大樹氏は、「動的で複雑な環境におけるエージェントの行動生成」という論題で、AIエージェントのパラメータ調整を進化計算手法で行った実験に関して報告しました。

【論文】動的で複雑な環境におけるエージェントの行動生成

特定の環境と相互作用するAIエージェント研究で長らく問題となっているのが、さまざまな状況に臨機応変に対応する高度な汎用的適応力の実現です。現在のAIエージェントの適応力は、人間が有する柔軟なそれに遠く及びません。AIエージェントの適応力をより汎用的にするには、即応的な計画的行動(プランニング)と熟考的なそれの両立、機能の拡張性、そして創発行動による行動生成が求められます。

AIエージェントのアーキテクチャはさまざまなものが研究されてきましたが、下川氏の研究チームは汎用的な適応力の実現が期待できるとして「エージェント活性伝播ネットワーク」というアーキテクチャの改善に取り組みました。このアーキテクチャは環境からの刺激が一定量蓄積されるとニューロン間を伝播するというシンプルな仕組みながら、前述の汎用的適応力の3要件の実現が期待できるという利点があります。

しかし、エージェント活性伝播ネットワークには(閾値と伝播値に関する)パラメータの調整方法が確立されていないという問題点があり、それゆえ従来は開発者が経験を頼りに手動で調整していました。そこで今回の研究では、パラメータを進化計算手法で自動調整することにしました。調査する手法には遺伝的アルゴリズム、粒子群最適化法、進化差分法を採用し、学習対象は閾値のみ、伝播値のみ、閾値と伝播値の両方の3種類としました。こうした計算手法と学習対象の組み合わせから導出できる全9パターンの学習を実験しました。

実験環境は、Tile Worldと呼ばれる簡単なゲームを用意しました。このゲームはグリッド状のステージのなかから、敵を避けながらタイルとホールを集めてスコアを競うというものです。このゲームでハイスコアを狙うには、敵を即座に避ける即応的行動とタイルとホールを効率的に集める熟考的行動の両方が必要となります。

Tile Worldを使った実験の結果、差分進化法を用いて閾値のみを学習した場合がもっとも高いスコアを獲得しました。また、ハイスコアを獲得した学習手法ほどAIエージェントの停止行動が多いことも確認できました。停止が多いのは、状況に応じて即応的な行動より熟考的なそれを優先していたからと考えられます。

Tile Worldのステージを拡大した実験も行いました。その結果、小さいステージでの実験と同様の結果が得られました。以上より差分進化法による閾値のみの学習はもっとも有効かつ汎用性がある、という結論が得られました。

ちなみに、今回の研究は特定の環境下における効率的なタスク遂行をテーマとしていますが、類似の研究テーマとして多様なAIエージェントの行動を効率的に(つまり、少ない計算資源によって)設計するものもあります。そうした類似研究として、バンダイナムコスタジオのリードAIプログラマである長谷洋平氏によるオンラインゲーム『BLUE PROTOCOL』の意思決定システムに関する発表やAIフィロソフィーに関する発表があります。同氏の研究では、「Preference-based HTN Planning」というプランニングアルゴリズムが採用されています。

AIエージェントの協働作業を最適化する

名古屋工業大学の松井俊浩氏は「距離情報に基づく観測と位置推定のための複数移動センサによる観測タスクへの非集型制約最適化の適用の一検討」と題して、複数のAIエージェントの協調行動を最適化する研究について発表しました。

【論文】距離情報に基づく観測と位置推定のための複数移動センサによる観測タスクへの非集型制約最適化の適用の一検討

今日、監視業務や危険地域の観測業務においてセンサを実装した複数のAIエージェントの協働が求められています。具体例として、特定の場所を複数の移動型カメラ付き監視ロボットで監視する、放射能を浴びる危険性のある地域における複数のロボットによる測量などが挙げられます。こうした業務では、AIエージェントどうしの位置情報の共有と活動地域全体の地理情報の収集が求められます。しかし、位置情報共有の精度を高く設定し過ぎると、活動地域全体の地理情報を収集するのに時間がかかってしまう、というようにすべてのタスクを高水準に遂行するのは困難を極めます。

複数AIエージェントによる協調的なタスク遂行は、分散制約最適化問題としてアルゴリズム的に定式化されています。この最適化問題に対して、松井氏は複数のAIエージェントが情報共有してうえで、もっとも問題解決に貢献したAIエージェントの解を最適解として採用して、改善の余地がなくなるまで最適解算出プロセスを繰り返す交渉プロトコルを実装して実験を試みました。

実験では、グリッドで構成された仮想世界を複数のAIエージェントが探索してマップを生成することが試みられました。具体的には、複数のAIエージェントが仮想世界の任意の初期位置から周囲を測量すると同時に、他のAIエージェントと位置情報を共有するというタスクを遂行します。こうした実験を位置情報の許容誤差を変えて複数回行いました。この実験における評価ポイントは、複数のAIエージェントが測量する地図の類似性、共有される位置情報の精度、および許容誤差のタスクへの影響です。

地図の類似性に関しては、許容誤差が小さい場合、他のAIエージェントに近づく行動が多くなるため、類似性が一定の値で安定するまでに(つまりは収束するまでに)時間がかかりました。対して、許容誤差が大きい場合は早く収束しました。

AIエージェント間の位置情報共有精度に関しては、許容誤差を小さく設定した場合、当然の帰結として共有される位置情報の精度は向上します。その一方で、誤差の拡大を避けるために観測範囲を広げない傾向も確認されました。許容誤差と観測範囲は、トレードオフの関係にあると言えます。

今後の課題として、松井氏はAIエージェントの位置情報共有精度と測量範囲の拡大を両立させたアルゴリズムの考案を挙げていました。

人間とAIエージェントの協働作業を数値化する

岡山県立大学の高津芳希氏は、「RoCoCoを用いた人間と機械の身体的協力行動の数理分析」と題して、協働タスク遂行シミュレーターを用いた人間とAIエージェントの協働行動の数理的分析について発表しました。

【論文】RoCoCoを用いた人間と機械の身体的協力行動の数理分析

今日のロボットに対するニーズは、ライン工場で見られるような人間から隔離された産業用ロボットから店舗や医療現場で人間といっしょに働く協働ロボットにシフトしつつあります(コロナ禍によって、こうしたシフトが加速しています)。しかしながら、協働ロボットに関する知見が不足しているため、高津氏らの研究チームは人間とロボットの協働に関する「協力の理論」を構築するプロジェクトを立ち上げました。このプロジェクトに取り組むにあたっては、協働作業をシミュレーションできるソフトウェア「RoCoCo(「Role Coordinative Cooperation」の略称)」を活用しました。

上記プロジェクトでは、人間とロボットが協力して机を運搬するタスクの効率性を測定する実験が行われました。この実験では21~25歳の5人の男性に参加してもらい、課題タスクを人間のみ、人間とロボット、ロボットのみの3パターンで実行して、タスク完了までの所要時間、タスク遂行時に使われた力などを測定しました。

実験した結果、タスク遂行効率性はロボットのみで遂行する場合がもっとも効率的で、次いで人間とロボットがよく、人間のみで遂行する場合がもっとも効率が悪いことが判明しました(以下のグラフ参照。グラフの線が平板であるほど効率がよいことを意味する)。

以上の実験で重要なのは、人間とロボットの協働作業を数量的に考察できた点にあります。協働作業の効率性を数値的に理解できれば、その効率性を改善する方法を考えられるようになります。

なお、高津氏はRoCoCoを用いた協働作業の数理的分析をメンタルヘルス、教育、福祉などの分野で応用したいと述べました。

人間とAIの間で社会的比較は生じるのか

筑波大学の大石真史氏は「エージェントの同化と対比による社会的比較の効果の検証」と題して、人間とAIの間の社会的比較の成立可否とその影響に関する研究を発表しました。

【論文】エージェントの同化と対比による社会的比較の効果の検証

社会的比較とは、社会心理学における自己評価に影響を及ぼす他者との関係を論じた理論です。自己評価は、評価者が置かれている他者との関係によって高まったり低くなったりします。具体的には、自己と他者の関係をスキルの優劣という評価軸と、自己と他者が似ているかどうかという同化-対比という評価軸でとらえた場合、自己と似ていてスキル的に優れた他者と関係している場合、自己評価は高くなります。この現象は「エースのいるスポーツチームのメンバーは自分を誇らしく思う」のような具体例を挙げれば理解できるでしょう。こうした2つの評価軸でとらえた場合、自己評価への影響は以下の図のように4通り考えられます。

大石氏らの研究チームは、社会的比較が人間とAIの間でも成立するかを検証する実験を行いました。この実験に際しては、スキルの比較をタイピングで測定し、人間とAIの間の同化-対比関係は被験者にAIとチャットしてもらうことで構築するようにしました。そして、被験者にはAIとのタイピング競争をしてもらった後にアンケートを実施して、自己評価を測定するようにしました。なお、AIのタイピングスキルを競争前に測定した被験者のタイピングスキルにもとづいて上下させることで、社会的比較が成立する状況を作りました。

実験の結果、被験者とAIは実験計画通りに特定の同化-対比関係を構築したことが確認できました。自己評価の変化については、人間とAIの間でも社会的比較が成立すると仮定した場合、同化-上方比較の場合では自己評価が上がる上にタイピング結果も良くなり、同化-下方比較では自己評価が対比-下方比較より相対的に低くなる、と予想されます。しかし、実験からはこの予想は立証されませんでした。それゆえ、今回の実験では人間とAIの間の社会的比較は認められなかった、と結論できます。

一方で以上の実験では、同化-下方比較を除いた場合においてタイプミス率が増加した、という予想外の結果が得られました。この結果から、AIとの競争はそもそも人間の集中力を妨げる可能性があること、そして競争環境において人間は自分と似ていて自分より低スキルのAIと競うと集中できるかも知れないことが期せずしてわかりました。この知見は、例えばeスポーツのトレーニングシステムを開発する場合、プレイヤーが共感できてプレイヤーよりスキルを低く設定したAIキャラクターを練習相手にすれば、集中が続くようになるかも知れないことを示唆しています。

日本におけるAIの社会実装を推進するためには、人間とAI、あるいはAIどうしが協働するシーンを増やす必要があるでしょう。こうした協働シーンを実現するにあたって、この記事で紹介した研究は何かしらのヒントになるかも知れません。

Writer:吉本幸記、Image by TULIA COLOMBIA TORRES HURTADO from Pixabay

RELATED ARTICLE関連記事

「機械学習は人生訓」経歴紆余曲折の3人が語るAIとキャリア

2020.9.25先端技術

「機械学習は人生訓」経歴紆余曲折の3人が語るAIとキャリア

【CEDEC2019】AIりんなのボイストレーニングが示す、情動的で人間的な機械学習とは?

2019.9.05先端技術

【CEDEC2019】AIりんなのボイストレーニングが示す、情動的で人間的な機械...

サッカーからドローンレースまで。各社が開発するフィジカルスポーツプレイAIを紹介

2020.10.30先端技術

サッカーからドローンレースまで。各社が開発するフィジカルスポーツプレイAIを紹介

RANKING注目の記事はこちら