モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。

TAG LIST
CG機械学習ディープラーニングCGへの扉安藤幸央GAN月刊エンタメAIニュース河合律子ニューラルネットワークOpenAINVIDIA強化学習三宅陽一郎音楽FacebookQAスクウェア・エニックス森川幸人モリカトロンAIラボインタビュー敵対的生成ネットワークDeepMindルールベースキャラクターAIシナリオGPT-3自然言語処理NFTGoogleグーグル自動生成映画デバッグCEDEC2019吉本幸記StyleGANプロシージャル人工知能学会遺伝的アルゴリズムメタAI深層学習マイクロソフトアートビヘイビア・ツリーCEDEC2021大内孝子CEDEC2020ゲームAISIGGRAPH不完全情報ゲームゲームプレイAIVRナビゲーションAI畳み込みニューラルネットワークDALL-ECLIPロボットAIと倫理ディープフェイクGDC 2021VFXメタバースGDC 2019マルチエージェントボードゲームNPCCNNデジタルツインモリカトロンUnityAIアートファッションHTN階層型タスクネットワークDALL-E2JSAI2020TensorFlowMicrosoftイベントレポートテストプレイ水野勇太小説アニメーションガイスターStyleGAN2懐ゲーから辿るゲームAI技術史toioソニーJSAI2021スポーツ研究シムピープル汎用人工知能GDC Summerバーチャルヒューマンブロックチェーン倫理BERTAdobeアストロノーカNVIDIA Omniverseeスポーツ対話型エージェントAmazoneSportsBLUE PROTOCOLシーマンUbisoft画像生成テキスト画像生成AlphaZeroTransformerGPT-2カメラ環世界中島秀之鴫原盛之DARPAドローンシムシティAI美空ひばり手塚治虫Electronic ArtsメタデータLEFT 4 DEADインタビュー通しプレイOpenAI Five本間翔太CMピクサープラチナエッグイーサリアム作曲ビッグデータ中嶋謙互Amadeus CodeMicrosoft AzureキャリアナラティブOmniverse ReplicatorレコメンドシステムNVIDIA DRIVE SimNVIDIA Isaac Simサイバーエージェント音声認識ロボティクスPyTorchDQN眞鍋和子バンダイナムコスタジオaibo合成音声Minecraft齊藤陽介マインクラフトお知らせチャットボットアバターサルでもわかる人工知能VAEOmniverseUbisoft La Forge自動運転車ワークショップGenvid Technologiesメタ知識表現ウォッチドッグス レギオンIGDAどうぶつしょうぎEpic Gamesジェイ・コウガミ音楽ストリーミング徳井直生マシンラーニングクラウド対話エンジン斎藤由多加リトル・コンピュータ・ピープルコンピューティショナル・フォトグラフィーゴブレット・ゴブラーズ絵画AIりんなシミュレーション完全情報ゲーム坂本洋典釜屋憲彦ウェイポイントパス検索対談藤澤仁生物学GTC 2022画像認識GTC2022StyleCLIPDeNA長谷洋平masumi toyota宮路洋一OpenSeaGDC 2022教育TextWorldSIGGRAPH ASIAGTC2021CycleGANNetHackフェイクニュースエージェントAIボイスアクターNVIDIA CanvasImagenGPUALifeZork人工生命オルタナティヴ・マシンサウンドスケープMCS-AI動的連携モデルASBSマンガモーションキャプチャーぱいどんTEZUKA2020ナビゲーションメッシュ松井俊浩バンダイナムコ研究所スパーシャルAIELYZAELYZA DIGEST3D音声合成マーケティングApex LegendsELIZANinjaコンピュータRPGアップルタウン物語KELDICメロディ言語ゲームTENTUPLAYMARVEL Future FightAstroタイムラプスEgo4Dバスキア日経イノベーション・ラボ敵対的強化学習階層型強化学習GOSU Data LabWANNGOSU Voice Assistant竹内将SenpAI.GGMobalytics馬淵浩希Cygames岡島学AWS Sagemaker映像セリア・ホデント形態素解析UXAWS Lambda誤字検出認知科学ゲームデザインSentencePieceLUMINOUS ENGINELuminous Productionsパターン・ランゲージ竹村也哉ちょまどボエダ・ゴティエGOAPAdobe MAX 2021模倣学習Omniverse AvatarFPSNVIDIA Rivaマルコフ決定過程NVIDIA MegatronNVIDIA Merlinスタンフォード大学NVIDIA Metropolisパラメータ設計テニスバランス調整協調フィルタリング人狼知能テキサス大学軍事AlphaDogfight TrialsAI Messenger VoicebotエージェントシミュレーションOpenAI CodexStarCraft IIHyperStyleFuture of Life InstituteRendering with StyleIntelDisneyLAIKADisneyリサーチRotomationGauGANGauGAN2ドラゴンクエストライバルズ画像言語表現モデル不確定ゲームSIGGRAPH ASIA 2021Dota 2モンテカルロ木探索ディズニーリサーチMitsuba2ソーシャルゲームEmbeddingワイツマン科学研究所GTC2020CG衣装NVIDIA MAXINEVRファッション淡路滋ビデオ会議ArtflowグリムノーツEponymゴティエ・ボエダ音声クローニングGautier Boeda階層的クラスタリングGopherJuliusSIE鑑定TPRGOxia Palusバーチャル・ヒューマン・エージェントtoio SDK for UnityArt Recognitionクーガー田中章愛Meta石井敦銭起揚NHC 2021茂谷保伯池田利夫GDMC新刊案内マーベル・シネマティック・ユニバース成沢理恵MITメディアラボMCU著作権アベンジャーズマジック・リープDigital DomainMagic Leap OneMagendaMasquerade2.0ノンファンジブルトークンDDSPフェイシャルキャプチャーサッカーモリカトロン開発者インタビュー里井大輝Kaggle宮本茂則バスケットボール山田暉Assassin’s Creed OriginsAI会話ジェネレーターSea of ThievesGEMS COMPANYmonoAI technologyLSTMモリカトロンAIソリューション初音ミクOculusコード生成AI転移学習テストAlphaCodeBaldur's Gate 3CodeforcesCandy Crush Saga自己増強型AISIGGRAPH ASIA 2020COLMAPADOPデバッギングBigGANGANverse3DMaterialGANリップシンキングRNNグランツーリスモSPORTReBeLグランツーリスモ・ソフィーGTソフィーVolvoFIAグランツーリスモチャンピオンシップRival PrakDGX A100VTuberユービーアイソフトWebcam VTuber星新一賞北尾まどかHALO市場分析将棋メタルギアソリッドVフォートナイトFSMRobloxナップサック問題Live Nation汎用言語モデルWeb3.0AIOpsSpotifyMITスマートコントラクトReplica StudioAWSamuseChitrakarQosmo巡回セールスマン問題ジョルダン曲線メディア5GMuZero政治クラウドゲーミングRival Peakがんばれ森川君2号和田洋一リアリティ番組Stadiaジョンソン裕子MILEsNightCafeインタラクティブ・ストリーミングLuis Ruizインタラクティブ・メディアポケモンCodexシーマン人工知能研究所東京工業大学Ludo博報堂ラップSIGGRAPH 2019ArtEmisZ世代AIラッパーシステムARrinnaGROVERプラスリンクス ~キミと繋がる想い~FAIRSTCチート検出Style Transfer ConversationオンラインカジノRCPアップルRealFlowRinna Character PlatformiPhoneデジタルヒューマンDeep FluidsSoul MachinesMeInGameAmeliaAIGraphブレイン・コンピュータ・インタフェースバーチャルキャラクターBCIGateboxLearning from VideoANIMAK予期知能逢妻ヒカリセコムユクスキュルバーチャル警備システムカント損保ジャパン哲学上原利之ドラゴンクエストエージェントアーキテクチャアッパーグラウンドPAIROCTOPATH TRAVELER西木康智OCTOPATH TRAVELER 大陸の覇者Siemensアルスエレクトロニカ2019品質保証StyleRigAutodesk逆転オセロニアBentley Systemsワールドシミュレーター奥村エルネスト純いただきストリートH100齋藤精一大森田不可止COBOL高橋智隆DGX H100ロボユニザナックDGX SuperPOD泉幸典仁井谷正充クラウドコンピューティングロボコレ2019Instant NeRFartonomousbitGANsぎゅわんぶらあ自己中心派Azure Machine Learning意思決定モデル脱出ゲームHybrid Reward Architectureコミュニティ管理ウロチョロスSuper PhoenixSNS理化学研究所Project Malmoオンラインゲーム気候変動Project PaidiaEarth-2Project Lookoutマックス・プランク気象研究所Watch Forビョルン・スティーブンスBing気象モデルLEFT ALIVE気象シミュレーション長谷川誠ジミ・ヘンドリックス環境問題Baby Xカート・コバーンエコロジーロバート・ダウニー・Jr.エイミー・ワインハウスSDGsMagentaYouTubeダフト・パンクメモリスタSFGlenn MarshallELYZA PencilThe Age of A.I.Story2Hallucination音声変換レコメンデーションJukebox松尾豊Veap JapanEAPテンセントSIFT福井千春DCGAN医療MOBADANNCEメンタルケア人事ハーバード大学Edgar Handy研修デューク大学Netflixデータマイニングmynet.aiローグライクゲーム東京大学東京理科大学人工音声NeurIPS 2021産業技術総合研究所はこだて未来大学リザバーコンピューティングプレイ動画ヒップホップキャラクターモーションソニーマーケティングサイレント映画もじぱNBA環境音暗号通貨現代アートFUZZLEAlteration粒子群最適化法RPG進化差分法オープンワールド群知能下川大樹AIFAウィル・ライト高津芳希P2E大石真史SIGGRAPH 2022BEiTStyleGAN-NADAレベルデザインDETRゲームエンジンSporeUnreal Engineデノイズ南カリフォルニア大学Unity for Industry画像処理SentropyGLIDECPUDiscordAvatarCLIPSynthetic DataCALMバイアスプログラミングサム・アルトマンソースコード生成LaMDAGMAIシチズンデベロッパーSonanticTRPGGitHubCohereウィザードリィMCN-AI連携モデルマジック:ザ・ギャザリングAI DungeonUrzas.ai介護西川善司並木幸介Kikiサムライスピリッツ森寅嘉Zoetic AIゼビウスSIGGRAPH 2021ペットストリートファイター半導体Digital Dream LabsTopaz Video Enhance AICozmo栗原聡DLSSタカラトミー山野辺一記NetEaseLOVOT大里飛鳥DynamixyzMOFLINRomiU-Netミクシィ13フェイズ構造アドベンチャーゲームユニロボットADVユニボXLandGatoAGIテキスト生成手塚眞DEATH STRANDINGマルチモーダル不気味の谷Eric Johnson汎用強化学習AIOculus Questコジマプロダクション生体情報デシマエンジンインディーゲーム写真高橋ミレイ照明Maxim PeterJoshua Romoffハイパースケープ山崎陽斗深層強化学習立木創太ミライ小町テスラGameGANパックマンTesla BotTesla AI Dayソサエティ5.0SIGGRAPH 2020バズグラフニュースタンテキ東芝DIB-R倉田宜典韻律射影広告韻律転移

AIに想像力を与えるために必要なこと:月刊エンタメAIニュース vol.19

2021.7.26先端技術

AIに想像力を与えるために必要なこと:月刊エンタメAIニュース vol.19

エンタメにおいても人工知能は日進月歩で進歩しており、新しい研究成果や試みが次々と発表されています。こちらの連載では、過去1か月間、主に海外で公開された注目すべきゲームAIやエンタメAIに関連したニュース、論文などを紹介していきます。

ゲームキャラクターの声優をAIに担当させる技術

3Dグラフィックでデザインされたゲームキャラクターに生命を吹き込む声の演出は、ゲーム体験を豊かにするナラティブを追求する上で欠かせない要素といっても過言ではありません。しかし、台詞の収録やリップシンクは膨大な時間と労力を要する作業です。開発人員が限られた小規模のスタジオや、個人でゲームを制作するインディー開発者にとっては、金銭的なコストも大きな障壁となります。

近年、この問題と向き合うために注目されているのが、AIボイスという分野です。オーストラリアのAI開発会社Replica Studiosは、Unreal Engine専用ツール「MetaHuman Creator」との併用を想定した「AIボイスアクター」を発表しました。その名が示すとおり、ゲーム開発者が3Dグラフィックのキャラクターをデザインする際、声の演出を人間ではなくAIに担当させるためのツールです。現在は早期アクセスの段階で、順番待ちリストへの登録のみを受け付けています。

AIボイスといっても人間の音声を人工的に作り出す従来のテキスト音声合成ではありません。人間が読み上げた台詞の音声データを分析して、イントネーションや発声速度、発音の強弱といった特徴をAIが模倣するような技術です。

現在のベータ版では、あらかじめ収録されたライブラリから、カウボーイやイタリアンマフィアといったテーマごとに発音の特徴が異なるボイスサンプルを選択し、スライドバーで好みのキャラクターボイスへと調整できるようにデザインされています。今後はモーションキャプチャで自分の表情を捉えながら台詞を読み上げることで、AIが表情の変化や唇の動きを自動的にシンクロしながら選択したキャラクターボイスで喋ってくれる機能を追加する予定だということです。

公式サイトにて公開されているサンプル映像では、アニメーションの粗が目立って少々ぎこちない演技に見えてしまいますが、文章を読み上げるだけのText-To-Speech (TTS)と違って、製作者が台詞に込めた感情表現を上手く演出できています。

7月19日からオンラインで開催された「Game Developers Conference 2021」(GDC 2021)では、Replica StudiosのCEO、Shreyas Nivas氏がナラティブにおける声の演出の重要性や、AIボイスの正式リリースに向けた今後の展望について熱弁しました。

公式サイト:AI voice actors for Metahuman Creator

AIにイマジネーションという能力を与える技術

人工ニューラルネットワークを用いたディープラーニングの登場によって、AIは特定のタスクにおいて人間を圧倒的に凌駕しましたが、視覚情報の認識能力においては人間をふくむ霊長類には遠くおよびません。

たとえば、わたしたち人間は視覚で物体を認識する際、対象の形状や位置、色、材質といった固有の特性を分割して認識できます。こうした視覚情報を瞬時に一般化することで、それぞれの特性を組み合わせて新しい物体を想像することもできます。これが人間が当たり前のように行うイマジネーションという優れた能力です。

南カリフォルニア大学の研究チームは、International Conference on Learning Representations(ICLR 2021:学習表現についての国際会議)にて、グループ教師あり学習(以下、GSL=Group-Supervised Learning)という新たなフレームワークを使って人間の想像力をAIで再現する手法を発表しました。

このGSLを使えば、学習対象を交換可能な「Disentangled Representation(もつれのない特徴表現という意味)」に分解し、それを再構築することで新しいサンプルを合成できるようになります。たとえば、赤いボートと青いクルマの画像を学習させることで、赤いクルマの画像が生成できるようになるという具合です。こうした学習手法は、今後人間のように世界を認識できるAI技術を開発する上で、重要な役割を担うことは間違いないでしょう。

論文:Zero-shot Synthesis with Group-Supervised Learning

落書きを一瞬で絵画のようなグラフィックに変換するAI

いまはAIの力を借りて誰もがゴッホやゴーギャンのようなポスト印象派の画家になれる時代です。半導体メーカー大手のNVIDIAは6月23日、ペイントツールで抽象的な線を描いたり塗りつぶしたりするだけで、写実的な地形や風景のグラフィックをリアルタイムで生成できるアプリケーション「NVIDIA Canvas」を発表しました。

「NVIDIA Canvas」には、敵対的生成ネットワーク(GAN=Generative Adversarial Networks)というAIアルゴリズムが使われています。GANは生成ネットワークと識別ネットワークから構成されており、2つのネットワークは常に相反する目的を持って学習するように設計されています。

「NVIDIA Canvas」では、ユーザーが描いた線や塗りつぶした領域を生成ネットワークが地形イメージへと変換し、一方で識別ネットワークが現実的なイメージなのかどうかを判定します。たとえば池や湖が生成された場合、水面が光を反射しているかどうかを確認し、条件を満たしていなければ改善するように命令を送るといった具合です。

もともとは同社の研究チームが2019年に披露したペイントアプリ「GauGAN」(ゴーギャンの名前とGANをかけた造語)のデモとして生まれた技術で、当時は世界中のクリエイターによって50万枚を超える作品が、サービス提供からわずか1か月で生み出されたことで大いに脚光を浴びました。「NVIDIA Canvas」は開発者支援プラットフォーム「NVIDIA Studio」の一部として提供されており、現在はベータ版が無料でダウンロードできます。

公式ブログ:As Fast as One Can Gogh: Turn Sketches Into Stunning Landscapes with NVIDIA Canvas

AIモデレーターの導入を見据えたDiscordの企業買収

オンラインの嫌がらせを検知するためのAIツール開発を手がけるSentropyは14日、無料通話アプリを提供するDiscordへの事業売却を、公式声明文にて発表しました。

Sentropyは、Twitterユーザーにとって有害な情報をAIで検知する「Protect」というツールを2020年から提供してきたスタートアップ企業です。今回の買収を機に、これまでのサービスを一部停止し、急速にユーザーベースを拡大していくDiscordがより安心して利用できるツールへと進化する手助けをしていくということです。

Discordは、SkypeやTeamSpeakに並ぶVoIPソフトウェアとして、2015年からサービスが始まりました。当初は主にTwitchをはじめとしたゲームコミュニティで愛用され、Discordの機能をゲーム内に組み込めるAPIが導入されるなど、ゲーマーのためのボイスチャットツールとして普及した背景があります。その後、2020年にブランドイメージを変更し、現在では業界を問わず万人のためのコミュニケーションツールを目指して発展を続けています。

Discordを利用するユーザーはすでに2億5,000万人以上と報告されており、Discord内で企業やユーザーが展開しているコミュニティは1,900万件に上ると言われています。それらすべてのモデレーションを人間だけで担うには限界があります。Sentropyの経験と実績を吸収することで、あらゆるコミュニティに向けたコミュニケーションツールとして、Discordがより堅固な地位を築いていくことが期待されます。

公式声明:Sentropy x Discord: A Safer Tomorrow

Writer:Ritsuko Kawai / 河合律子、Image by NVIDIA

RELATED ARTICLE関連記事

動画から世界を理解して思い出を管理してくれるAI:月刊エンタメAIニュース vol.15

2021.3.26先端技術

動画から世界を理解して思い出を管理してくれるAI:月刊エンタメAIニュース vo...

インタラクティブなリアリティ番組『Rival Peak』が切り拓く視聴者とAIの新しい関係

2021.1.29先端技術

インタラクティブなリアリティ番組『Rival Peak』が切り拓く視聴者とAIの...

プロパガンダにLGBTQ救済も。政治的文脈でも利用される顔生成AI技術の現状

2022.3.18先端技術

プロパガンダにLGBTQ救済も。政治的文脈でも利用される顔生成AI技術の現状

RANKING注目の記事はこちら