モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。

TAG LIST
ディープラーニング機械学習CGCGへの扉安藤幸央GANニューラルネットワーク月刊エンタメAIニュース強化学習三宅陽一郎音楽OpenAIモリカトロンAIラボインタビュー敵対的生成ネットワークQAスクウェア・エニックス河合律子シナリオNVIDIAFacebookキャラクターAIルールベースデバッグCEDEC2019プロシージャルDeepMind人工知能学会ビヘイビア・ツリーGoogleCEDEC2021CEDEC2020ゲームAI映画SIGGRAPH遺伝的アルゴリズム不完全情報ゲームメタAIナビゲーションAI森川幸人畳み込みニューラルネットワーク自然言語処理深層学習マイクロソフトAIと倫理グーグル自動生成GDC 2021GPT-3GDC 2019マルチエージェントVRボードゲームロボットStyleGANCNNVFXモリカトロンゲームプレイAIファッションアートHTN階層型タスクネットワークJSAI2020大内孝子TensorFlowMicrosoftイベントレポートテストプレイ水野勇太アニメーションガイスターNPCCLIPNFTtoio吉本幸記JSAI2021スポーツディープフェイクシムピープル汎用人工知能GDC Summereスポーツ対話型エージェントeSportsBLUE PROTOCOLシーマンAIアート小説DALL-EStyleGAN2AlphaZeroカメラ環世界中島秀之懐ゲーから辿るゲームAI技術史研究DARPAドローンシムシティAI美空ひばり手塚治虫Electronic Artsメタデータブロックチェーン通しプレイOpenAI Five本間翔太CM倫理ピクサーAdobeイーサリアム作曲中嶋謙互Amadeus CodeMicrosoft AzureアストロノーカキャリアナラティブAmazon音声認識ロボティクスPyTorchDQN眞鍋和子バンダイナムコスタジオUnity齊藤陽介マインクラフトお知らせサルでもわかる人工知能VAEUbisoftUbisoft La ForgeワークショップGenvid Technologies知識表現ウォッチドッグス レギオンIGDAどうぶつしょうぎジェイ・コウガミ音楽ストリーミングマシンラーニングクラウド斎藤由多加リトル・コンピュータ・ピープルコンピューティショナル・フォトグラフィーGPT-2完全情報ゲーム坂本洋典釜屋憲彦ウェイポイントパス検索藤澤仁生物学画像認識DeNA長谷洋平鴫原盛之masumi toyota宮路洋一TextWorldSIGGRAPH ASIAソニーGTC2021CycleGANフェイクニュースGPUALifeZork人工生命オルタナティヴ・マシンサウンドスケープMCS-AI動的連携モデルASBSマンガぱいどんTEZUKA2020ナビゲーションメッシュ松井俊浩スパーシャルAIマーケティングApex LegendsELIZANinjaコンピュータRPGアップルタウン物語KELDICメロディ言語ゲームTENTUPLAYLEFT 4 DEADMARVEL Future FightAstroタイムラプスEgo4Dバスキアバーチャルヒューマン日経イノベーション・ラボ敵対的強化学習階層型強化学習GOSU Data LabWANNGOSU Voice Assistant竹内将SenpAI.GGMobalytics馬淵浩希Cygames岡島学AWS Sagemaker映像セリア・ホデント形態素解析UXAWS Lambda誤字検出認知科学BERTゲームデザインSentencePieceLUMINOUS ENGINEプラチナエッグLuminous Productionsパターン・ランゲージ竹村也哉ちょまどボエダ・ゴティエビッグデータGOAPAdobe MAX 2021デジタルツインメタバース模倣学習NVIDIA OmniverseOmniverse AvatarFPSNVIDIA Rivaマルコフ決定過程NVIDIA MegatronNVIDIA Merlinスタンフォード大学NVIDIA Metropolisパラメータ設計テニスOmniverse Replicatorバランス調整レコメンドシステムNVIDIA DRIVE Sim協調フィルタリングNVIDIA Isaac Sim人狼知能テキサス大学軍事サイバーエージェントAlphaDogfight TrialsAI Messenger VoicebotエージェントシミュレーションOpenAI CodexStarCraft IIFuture of Life InstituteIntelLAIKARotomationドラゴンクエストライバルズ不確定ゲームDota 2モンテカルロ木探索ソーシャルゲームEmbeddingGTC2020NVIDIA MAXINE淡路滋ビデオ会議グリムノーツゴティエ・ボエダGautier Boeda階層的クラスタリングaiboJuliusSIETPRGバーチャル・ヒューマン・エージェントtoio SDK for Unityクーガー田中章愛石井敦銭起揚茂谷保伯MinecraftGDMC成沢理恵MITメディアラボ著作権マジック・リープMagic Leap OneMagendaノンファンジブルトークンDDSPサッカー里井大輝KaggleバスケットボールAssassin’s Creed OriginsSea of ThievesGEMS COMPANYmonoAI technologyアバター初音ミクOculus転移学習テストBaldur's Gate 3Candy Crush SagaSIGGRAPH ASIA 2020デバッギングBigGANMaterialGANリップシンキングRNNReBeL自動運転車VolvoRival Prakユービーアイソフト北尾まどかHALO将棋メタルギアソリッドVFSMナップサック問題汎用言語モデルSpotifyMITReplica StudioamuseChitrakar巡回セールスマン問題ジョルダン曲線5GMuZeroクラウドゲーミングRival Peak和田洋一リアリティ番組Stadiaジョンソン裕子MILEs対話エンジンインタラクティブ・ストリーミングインタラクティブ・メディアシーマン人工知能研究所Ludoゴブレット・ゴブラーズTransformerSIGGRAPH 2019ArtEmis絵画ARGROVERFAIRAIりんなチート検出オンラインカジノアップルRealFlowiPhoneシミュレーションDeep FluidsMeInGameAIGraphブレイン・コンピュータ・インタフェースBCILearning from Video予期知能ユクスキュルカント哲学ドラゴンクエストエージェントアーキテクチャPAIROCTOPATH TRAVELER西木康智OCTOPATH TRAVELER 大陸の覇者アルスエレクトロニカ2019StyleCLIPStyleRig逆転オセロニア奥村エルネスト純いただきストリート齋藤精一大森田不可止高橋智隆ロボユニザナック泉幸典仁井谷正充ロボコレ2019ぎゅわんぶらあ自己中心派Azure Machine Learning意思決定モデル脱出ゲームHybrid Reward ArchitectureウロチョロスSuper Phoenix理化学研究所Project Malmo教育Project PaidiaProject LookoutWatch ForBingLEFT ALIVE長谷川誠ジミ・ヘンドリックスBaby Xカート・コバーンロバート・ダウニー・Jr.エイミー・ワインハウスMagentaYouTubeダフト・パンクSFGlenn MarshallThe Age of A.I.Story2HallucinationレコメンデーションJukeboxテンセントSIFTDCGANMOBADANNCE人事ハーバード大学研修デューク大学mynet.aiローグライクゲームNetHack人工音声NeurIPS 2021はこだて未来大学プレイ動画ヒップホップサイレント映画NBA環境音現代アートエージェント粒子群最適化法進化差分法群知能下川大樹ウィル・ライト高津芳希大石真史BEiTレベルデザインDETRSporeAIボイスアクターデノイズ南カリフォルニア大学画像処理NVIDIA CanvasSentropyCPUDiscordCALMプログラミングソースコード生成GMAIシチズンデベロッパーTRPGGitHubウィザードリィMCN-AI連携モデルAI Dungeon西川善司並木幸介サムライスピリッツ森寅嘉ゼビウスSIGGRAPH 2021ストリートファイター半導体Topaz Video Enhance AI栗原聡DLSS山野辺一記NetEase大里飛鳥DynamixyzモーションキャプチャーU-Net13フェイズ構造アドベンチャーゲームADVXLandAGI手塚眞DEATH STRANDING不気味の谷Eric JohnsonOculus Questコジマプロダクション生体情報デシマエンジンインディーゲーム写真高橋ミレイ照明Maxim PeterJoshua Romoffハイパースケープ山崎陽斗深層強化学習立木創太バンダイナムコ研究所ミライ小町テスラGameGANELYZAパックマンTesla BotTesla AI Dayソサエティ5.0ELYZA DIGESTSIGGRAPH 2020バズグラフニュースタンテキ東芝DIB-R倉田宜典3D音声合成韻律射影広告韻律転移

デジタルツインの浸透がAI開発を加速させる:月刊エンタメAIニュース vol.23

2021.11.24先端技術

デジタルツインの浸透がAI開発を加速させる:月刊エンタメAIニュース vol.23

エンタメにおいても人工知能は日進月歩で発展しており、新しい研究成果や試みが次々と発表されています。こちらの連載では、過去1か月間、主に海外で公開された注目すべきゲームAIやエンタメAIに関連したニュース、論文などを紹介していきます。

デジタルツインというAIのゆりかご

この1か月は、11月9日に開催されたNVIDIAのテクノロジーカンファレンス「NVIDIA GTC」が話題の中心でした。なかでも、仮想空間におけるリアルタイムシミュレーションプラットフォーム「NVIDIA Omniverse」に追加された新機能の数々は、デジタルツインやメタバースといったキーワードが社会構造の根幹へ向かって浸透し始めたいま、まさに時代の変遷を象徴する技術といえます。

「Omniverse Avatar」は、音声認識や自然言語処理、コンピュータビジョン、レコメンデーションエンジンといった同社の既存技術を駆使したAIアシスタントの生成を可能にします。音声認識には複数言語に対応したソフトウェア開発キット「NVIDIA Riva」、自然言語処理には大規模言語モデル「NVIDIA Megatron」、レコメンデーションエンジンにはディープラーニングのフレームワーク「NVIDIA Merlin」、そしてコンピュータビジョンにはビデオ分析に用いられるフレームワークの「NVIDIA Metropolis」が活用されています。

「Omniverse Replicator」は、物理的にシミュレーションされた合成データを生成するためのエンジンです。ディープニューラルネットワークの学習用データを作る際に強力なツールとなります。今回の発表では、このエンジンを基に開発された2つのアプリケーション「NVIDIA DRIVE Sim」と「NVIDIA Isaac Sim」も披露されました。前者は自律走行車のデジタルツインを、後者はマニピュレータロボットのデジタルツインをホストするための仮想空間を構築します。これにより、現実空間では膨大な時間と莫大な資金を要してきた試験走行や動作確認といった開発プロセスが大幅に加速することが期待されます。

自動車メーカーのBMWはすでに「NVIDIA Omniverse」によって構築されたデジタルツイン工場を導入しており、仮想空間におけるシミュレーションによって生産ラインを最適化しています。また、通信機器メーカーのエリクソンは都市全体のデジタルツインを使ったシミュレーションによって、5G基地局や通信アンテナの設置場所を最適化しています。仮想空間におけるシミュレーションだからこそ、電波の伝搬や反射、強度をレイトレーシング技術によって可視化できるという利点があります。

このほか、サプライチェーンにおける物流の最適化を支援するために同社が公開したソフトウェア「NVIDIA ReOpt」のデモンストレーションでも、ワークフローのシミュレーションに「NVIDIA Isaac Sim」が使われています。デジタルツインやメタバースという概念は、いまやAI技術の発展と応用に欠かせない存在になりつつあります。

AIが皿洗いをこなすために必要な条件

長きにわたって人類は食事の支度や食器の片付け、整理整頓を手伝ってくれるロボットの実現を夢見てきました。こうした家庭用ロボットの実用化には、ロボットが物理的に世界と接するための身体の壁と、ロボットを取り巻く世界を認識するための知能の壁が立ちはだかります。そして、これら2つを前提条件としてさらに越えなければならない壁が、安全かつ効率的にタスクをこなすための手順をいかに学習させるかという課題です。

たとえば、人間は使い終わった食器を洗う際、使用済みの食器のみを流し台に運んで蛇口から水あるいはお湯を出し、スポンジと洗剤を手に取って汚れを浮かせて洗い流すという行程を、複雑な思考なしで感覚的に実行できます。それはすべてのオブジェクトが有する用途や手順といったコンテキストを理解し、それらを瞬時に組み合わせる能力があるからです。

出典:テキサス大学オースティン校

テキサス大学オースティン校とフェイスブックAIリサーチの研究チームは、AIが人間と同じ視点から物理世界のオブジェクトを認識し、あらゆるタスクを効率的に実行するための強化学習フレームワークを発表しました。前回の記事で紹介した「一人称視点の情報から世界を認識させることを目的としたフェイスブックのAIモデル」を応用した内容で、人間の日常タスクを記録した一人称視点の映像からオブジェクト間の関係性を学習し、それらを基に強化学習における各報酬の値を決定するという仕組みです。

使用済みの食器を洗うというタスクを例に挙げると、流し台の蛇口から水あるいはお湯を出すというアクションは、流し台の中に使用済みの食器が置かれている状態で実行した場合に限り、報酬が高くなるように設定されます。一方で流し台が空、もしくは野菜や本といった洗うべき食器以外の物が置かれている場合は報酬が低くなるという具合です。こうしたフレームワークを用いることによって、完全にランダムな行動を繰り返させるよりも迅速で正確な学習が可能になるというわけです。

働き方改革で増す音声対話AIの需要

10月26日には、サイバーエージェントのAI技術研究組織「AI Lab」が、AIによる人間らしく自然で高度な音声対話の実現を目的とした音声対話AIの研究専門組織「完全自動対話研究センター」を新設しました。音声対話AI領域の研究者30名の新規採用にくわえて、産学連携の強化を進めることで、5年後をめどにAIを相手にした完全自動会話の成立を目指すということです。

同社は過去にも、AI自動音声対話システム「AI Messenger Voicebot」や「コロナワクチンAI電話エージェント」の開発を手掛けており、音声対話AIを活用したサービスの提供に注力してきました。

スマートスピーカーの普及によってAIとの音声コミュニケーションが一般的な行為となった昨今、コールセンターのような音声コミュニケーションによる業務の効率化を目的としたAIによる自動化のニーズはますます高まっています。また、企業や自治体で進む働き方改革の観点からも、音声対話AIの需要はさらに増していくことが予想されます。

万人へ開放された最強の言語AIモデル

人工知能の研究を目的とした非営利団体OpenAIは11月18日、大規模自然言語処理モデル「GPT-3」のAPI利用に人数制限を設けてきたウェイトリストの撤廃を発表しました。これにより今後は誰もがすぐさまAPIを利用できることになります。

GPT-3は「Generative Pretrained Transformer」という名が示すとおり、教師なしTransformerであり、1750億個という膨大なパラメータを持つ言語モデルです。2020年6月からAPIとして外部への提供が始まりましたが、実際に利用できる人数は限られていました。比較的少ない学習で人間と同等の品質で文章を生成できる精度が特徴で、それゆえにフェイクニュースやフィッシング詐欺に悪用される可能性も懸念されてきました。

今年8月には、このGPT-3に数十億のソースコードを学習させることで自然言語からプログラミング言語への変換を可能にしたAIモデル「OpenAI Codex」のAPIも限定的に公開され始めました。

今回の利用制限の撤廃に際しては、ヘイトスピーチやアダルトコンテンツにおけるAPIの使用を禁止するためにガイドラインが更新されています。また、セーフガードとしてAPIにはあらかじめコンテンツフィルターが設けられているということです。誰もがGPT-3へアクセスできるようになったことで、文章の翻訳や要約、創作を支援する多様なアプリケーションの探求がさらに加速することは間違いないでしょう。

Writer: Ritsuko Kawai / 河合律子、Photo by Zack Walker on Unsplash 

RELATED ARTICLE関連記事

人面魚からAIに進化したシーマン、ロボット搭載の対話エンジンに。その仕組みとは?

2019.8.09先端技術

人面魚からAIに進化したシーマン、ロボット搭載の対話エンジンに。その仕組みとは?

AIに想像力を与えるために必要なこと:月刊エンタメAIニュース vol.19

2021.7.26先端技術

AIに想像力を与えるために必要なこと:月刊エンタメAIニュース vol.19

「機械学習は人生訓」経歴紆余曲折の3人が語るAIとキャリア

2020.9.25先端技術

「機械学習は人生訓」経歴紆余曲折の3人が語るAIとキャリア

RANKING注目の記事はこちら