モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。
- TAG LIST
- CGCGへの扉安藤幸央機械学習ディープラーニング月刊エンタメAIニュース河合律子GANOpenAI吉本幸記音楽NVIDIA生成系AI強化学習ニューラルネットワーク三宅陽一郎GoogleStable DiffusionグーグルQAシナリオDeepMind人工知能学会GPT-3森川幸人自然言語処理ChatGPTFacebook大内孝子マイクロソフト大規模言語モデル映画キャラクターAI敵対的生成ネットワークルールベースAIと倫理アートゲームプレイAIスクウェア・エニックスモリカトロンAIラボインタビュー倫理SIGGRAPH著作権モリカトロンデバッグ画像生成NFTDALL-E2StyleGANプロシージャルLLM遺伝的アルゴリズムNPC自動生成テストプレイメタAI画像生成AIテキスト画像生成ロボット深層学習ファッションCEDEC2019ディープフェイクVFXAdobeMidjourneyデジタルツインボードゲームDALL-ECLIPビヘイビア・ツリーマンガCEDEC2021CEDEC2020ゲームAIメタバース不完全情報ゲームVRナビゲーションAI畳み込みニューラルネットワークGDC 2021JSAI2022作曲NVIDIA OmniverseGDC 2019マルチエージェントCEDEC2022MinecraftAIアート小説アニメーションStability AIメタ懐ゲーから辿るゲームAI技術史toioジェネレーティブAI音楽生成AIスポーツ栗原聡手塚治虫CNNバーチャルヒューマンBERTMicrosoftUnityMetaOmniverse3DCGJSAI2023鴫原盛之HTN階層型タスクネットワークソニーGPT-4汎用人工知能JSAI2020GTC2023NeRFTensorFlowインタビューイベントレポート対話型エージェントAmazonロボティクスDQN水野勇太アバターUbisoftGenvid TechnologiesガイスターStyleGAN2デジタルヒューマンGTC2022教育JSAI2021はこだて未来大学研究エージェントシムピープルMCS-AI動的連携モデルプロンプトモーションキャプチャーTEZUKA2020CEDEC2023マルチモーダルElectronic Arts3DマーケティングメタデータGDC SummerブロックチェーンCMMicrosoft Azureアストロノーカキャリア模倣学習eスポーツスタンフォード大学アーケードゲームテニスサイバーエージェントトレーディングカード音声認識メディアアート類家利直eSportsBLUE PROTOCOLシーマンaibo合成音声チャットボットブラック・ジャックAWS徳井直生斎藤由多加AlphaZeroTransformerARGPT-2rinnaAIりんなカメラELSI環世界中島秀之PaLM哲学ベリサーブPlayable!GPT-3.5理化学研究所Gen-1SIGGRAPH ASIASFNetflixデータマイニング東京大学Bard現代アートDARPAドローンシムシティImagenZorkバイアスASBSぱいどんアドベンチャーゲームAI美空ひばりテキスト生成手塚眞バンダイナムコ研究所スパーシャルAINEDOFSM-DNNLEFT 4 DEADイーロン・マスク通しプレイOpenAI FiveStable Diffusion XL本間翔太馬淵浩希Cygames森山和道Audio2Faceピクサープラチナエッグイーサリアムボエダ・ゴティエビッグデータ中嶋謙互Amadeus Codeデータ分析MILEナラティブNVIDIA RivaOmniverse ReplicatorWCCFレコメンドシステムNVIDIA DRIVE SimWORLD CLUB Champion FootballNVIDIA Isaac Simセガ柏田知大軍事田邊雅彦トレカMax CooperGPTFireflyPyTorchChatGPT4眞鍋和子バンダイナムコスタジオ大澤博隆SFプロトタイピング齊藤陽介マインクラフトお知らせMagic Leap OneTencentモリカトロン開発者インタビュー宮本茂則バスケットボールサルでもわかる人工知能text-to-3DVAEDreamFusionTEZUKA2023リップシンキングRNNUbisoft La Forge自動運転車ワークショップ知識表現ウォッチドッグス レギオンVTuberIGDA立教大学秋期GTC2022市場分析どうぶつしょうぎEpic GamesRobloxジェイ・コウガミ音楽ストリーミングMITAIロボ「迷キュー」に挑戦野々下裕子Adobe MAXマシンラーニング村井源5GMuZeroRival Peakpixivオムロン サイニックエックスクラウド電気通信大学対話エンジン稲葉通将3Dスキャン橋本敦史リトル・コンピュータ・ピープルCodexシーマン人工知能研究所コンピューティショナル・フォトグラフィーPreferred Networksゴブレット・ゴブラーズ絵画Microsoft DesignerイラストシミュレーションSoul Machines柿沼太一完全情報ゲーム坂本洋典釜屋憲彦ウェイポイントLLaMAパス検索対談藤澤仁生物学GTC 2022画像認識ハリウッドSiemensストライキStyleCLIPDeNA長谷洋平クラウドコンピューティングmasumi toyotaIBM宮路洋一OpenSeaGDC 2022SNSTextWorldEarth-2BingMagentaYouTube音声生成AIELYZA PencilScenarioSIGGRAPH2023テキスト画像生成AI松尾豊AIピカソGTC2021AI素材.comCycleGANテンセントAIQVE ONENetHackキャラクターモーションControlNetNBAフェイクニュースユニバーサルミュージックRPG法律SIGGRAPH 2022世界モデルレベルデザインゲームエンジンDreamerV3AIボイスアクター南カリフォルニア大学NVIDIA CanvasGPUALife人工生命オルタナティヴ・マシンサウンドスケープLaMDATRPGマジック:ザ・ギャザリングAI DungeonRed Ramマーダーミステリーゲーム背景不気味の谷ナビゲーションメッシュインディーゲーム高橋ミレイ深層強化学習松原仁松井俊浩武田英明ELYZAフルコトELYZA DIGEST建築音声合成広告西成活裕ハイブリッドアーキテクチャApex LegendsELIZA群衆マネジメントライブポートレイトNinjaコンピュータRPGライブビジネスWonder StudioAdobe Max 2023アップルタウン物語新型コロナ土木MindAgentKELDIC周済涛BIMBing Chatメロディ言語清田陽司インフラBing Image CreatorゲームTENTUPLAYサイバネティックスDALL-E 3MARVEL Future FightAstro人工知能史Amazon BedrockAssistant with BardタイムラプスEgo4DAI哲学マップThe Arcadeバスキア星新一X.AISearch Generative Experience日経イノベーション・ラボStyleGAN-XLX Corp.Dynalang敵対的強化学習StyleGAN3TwitterVLE-CE階層型強化学習GOSU Data LabGANimatorXホールディングス論文WANNGOSU Voice AssistantVoLux-GANMagiAI Act竹内将SenpAI.GGProjected GANEUMobalyticsSelf-Distilled StyleGANSDXLArs ElectronicaニューラルレンダリングRTFKTAI規制岡島学AWS SagemakerPLATONIKE欧州委員会映像セリア・ホデント形態素解析frame.ioClone X欧州議会UXAWS LambdaFoodly村上隆欧州理事会誤字検出MusicLM認知科学中川友紀子Digital MarkAudioLMゲームデザインSentencePieceアールティSnapchatMusicCapsLUMINOUS ENGINEクリエイターコミュニティAudioCraftLuminous ProductionsBlenderBot 3バーチャルペット効果音パターン・ランゲージ竹村也哉Meta AINVIDIA NeMo ServiceMubertちょまどマーク・ザッカーバーグヴァネッサ・ローザMubert RenderGOAPWACULVanessa A RosaGen-2Adobe MAX 2021陶芸Runway AI Film Festival自動翻訳Play.htPreViz音声AINVIDIA ACEAIライティングLiDARCharacter-LLMOmniverse AvatarAIのべりすとPolycam復旦大学FPSQuillBotdeforumChat-Haruhi-Suzumiyaマルコフ決定過程NVIDIA MegatronCopysmith動画生成AI涼宮ハルヒNVIDIA MerlinJasperハーベストEmu VideoNVIDIA MetropolisForGamesNianticパラメータ設計ゲームマーケットペリドットバランス調整岡野翔太Dream Track協調フィルタリング郡山喜彦Music AI Tools人狼知能テキサス大学ジェフリー・ヒントンLyriaGoogle I/O 2023Yahoo!知恵袋AlphaDogfight TrialsAI Messenger VoicebotGoogle I/OインタラクティブプロンプトAIエージェントシミュレーションOpenAI Codex武蔵野美術大学慶應義塾大学StarCraft IIHyperStyleBingAI石渡正人Future of Life InstituteRendering with Style手塚プロダクションIntelDisney林海象LAIKADisneyリサーチヴィトゲンシュタインPhotoshop古川善規RotomationGauGAN論理哲学論考Lightroom大規模再構成モデルGauGAN2京都芸術大学CanvaLRMドラゴンクエストライバルズ画像言語表現モデルObjaverse不確定ゲームSIGGRAPH ASIA 2021PromptBaseBOOTHMVImgNetDota 2モンテカルロ木探索ディズニーリサーチpixivFANBOXOne-2-3-45Mitsuba2バンダイナムコネクサス虎の穴3DガウシアンスプラッティングソーシャルゲームEmbeddingワイツマン科学研究所ユーザーレビューFantiaワンショット3D生成技術GTC2020CG衣装mimicとらのあな高橋力斗NVIDIA MAXINEVRファッションBaidu集英社淡路滋ビデオ会議ArtflowERNIE-ViLG少年ジャンプ+グリムノーツEponym古文書ComicCopilotゴティエ・ボエダ音声クローニング凸版印刷コミコパGautier Boeda階層的クラスタリングGopherAI-OCRゲームマスター画像判定Inowrld AIJuliusSIE鑑定ラベル付けMODTPRGOxia PalusGhostwriterバーチャル・ヒューマン・エージェントtoio SDK for UnityArt RecognitionSkyrimクーガー田中章愛実況パワフルサッカースカイリム石井敦銭起揚NHC 2021桃太郎電鉄RPGツクールMZ茂谷保伯池田利夫桃鉄ChatGPT_APIMZGDMC新刊案内パワサカダンジョンズ&ドラゴンズマーベル・シネマティック・ユニバースコナミデジタルエンタテインメントOracle RPG成沢理恵MITメディアラボMCU岩倉宏介深津貴之アベンジャーズPPOxVASynthマジック・リープDigital DomainMachine Learning Project CanvasLaser-NVMagendaMasquerade2.0国立情報学研究所ノンファンジブルトークンDDSPフェイシャルキャプチャー石川冬樹MERFサッカースパコンAlibaba里井大輝KaggleスーパーコンピュータVQRF山田暉松岡 聡nvdiffrecAssassin’s Creed OriginsAI会話ジェネレーターTSUBAME 1.0NeRFMeshingSea of ThievesTSUBAME 2.0LERFGEMS COMPANYmonoAI technologyLSTMABCIマスタリングモリカトロンAIソリューション富岳TikTok初音ミクOculusコード生成AISociety 5.0リアム・ギャラガー転移学習テストAlphaCode夏の電脳甲子園グライムスBaldur's Gate 3Codeforces座談会BoomyCandy Crush Saga自己増強型AItext-to-imageジョン・レジェンドSIGGRAPH ASIA 2020COLMAPザ・ウィークエンドADOPNVIDIA GET3DドレイクデバッギングBigGANGANverse3DMaterialGANグランツーリスモSPORTAI絵師エッジワークスReBeLグランツーリスモ・ソフィーUGC日本音楽作家団体協議会GTソフィーPGCFCAVolvoFIAグランツーリスモチャンピオンシップVoiceboxNovelAIさくらインターネットRival PrakDGX A100NovelAI DiffusionぷよぷよユービーアイソフトWebcam VTuberモーションデータ星新一賞大阪公立大学北尾まどかHALOポーズ推定TCG将棋メタルギアソリッドVフォートナイトメッシュ生成KLabFSMメルセデス・ベンツQRコードMagic Leap囲碁ナップサック問題Live NationEpyllionデンソー汎用言語モデルWeb3.0マシュー・ボールデンソーウェーブAIOpsムーアの法則原昌宏Spotifyスマートコントラクト日本機械学会Replica Studioロボティクス・メカトロニクス講演会amuseChitrakarQosmoAdobe MAX 2022トヨタ自動車巡回セールスマン問題かんばん方式ジョルダン曲線メディアAdobe Research政治Galacticaプロット生成クラウドゲーミングがんばれ森川君2号和田洋一リアリティ番組映像解析FastGANStadiaジョンソン裕子セキュリティ4コママンガMILEsNightCafe東芝デジタルソリューションズインタラクティブ・ストリーミングLuis RuizSATLYS 映像解析AIインタラクティブ・メディアポケモンPFN 3D ScanElevenLabs東京工業大学HeyGenLudo博報堂After EffectsラップPFN 4D Scan絵本SIGGRAPH 2019ArtEmisZ世代DreamUp出版AIラッパーシステムDeviantArtAmmaar ReshiWaifu DiffusionStoriesGROVERプラスリンクス ~キミと繋がる想い~元素法典StoryBirdFAIRSTCNovel AIVersedチート検出Style Transfer ConversationOpen AIProlificDreamerオンラインカジノRCPUnity SentisアップルRealFlowRinna Character PlatformUnity MuseiPhoneCALACaleb WardDeep Fluids宮田龍MeInGameAmelia清河幸子AIGraphブレイン・コンピュータ・インタフェースバーチャルキャラクター西中美和BCIGateboxアフォーダンス安野貴博Learning from VideoANIMAKPaLM-SayCan斧田小夜予期知能逢妻ヒカリ宮本道人セコムGitHub CopilotLLaMA 2ユクスキュルバーチャル警備システムCode as Policiesカント損保ジャパンCaPHugging FaceCM3leon上原利之Stable DoodleドラゴンクエストエージェントアーキテクチャアッパーグラウンドコリジョンチェックT2I-AdapterPAIROCTOPATH TRAVELERxAI西木康智OCTOPATH TRAVELER 大陸の覇者山口情報芸術センター[YCAM]アルスエレクトロニカ2019品質保証YCAM日本マネジメント総合研究所StyleRigAutodeskアンラーニング・ランゲージVoyager逆転オセロニアBentley Systemsカイル・マクドナルドLily Hughes-Robinsonワールドシミュレーターローレン・リー・マッカーシーColossal Cave Adventure奥村エルネスト純いただきストリートH100鎖国[Walled Garden]プロジェクトAdventureGPT齋藤精一大森田不可止COBOLSIGGRAPH ASIA 2022リリー・ヒューズ=ロビンソン高橋智隆DGX H100VToonifyBabyAGIロボユニザナックDGX SuperPODControlVAEGPT-3.5 Turbo泉幸典仁井谷正充変分オートエンコーダーカーリングロボコレ2019Instant NeRFフォトグラメトリウィンブルドンartonomous回帰型ニューラルネットワークbitGANsDeepJoin戦術分析ぎゅわんぶらあ自己中心派Azure Machine LearningAzure OpenAI Serviceパフォーマンス測定意思決定モデル脱出ゲームDeepLIoTHybrid Reward Architectureコミュニティ管理DeepL WriteProFitXウロチョロスSuper PhoenixWatsonxProject MalmoオンラインゲームAthletica気候変動コーチングProject Paidiaシンギュラリティ北見工業大学Project Lookoutマックス・プランク気象研究所レイ・カーツワイル北見カーリングホールWatch Forビョルン・スティーブンスヴァーナー・ヴィンジ画像解析気象モデルRunway ResearchじりつくんLEFT ALIVE気象シミュレーションMake-A-VideoNTT Sportict長谷川誠ジミ・ヘンドリックス環境問題PhenakiAIカメラBaby Xカート・コバーンエコロジーDreamixSTADIUM TUBEロバート・ダウニー・Jr.エイミー・ワインハウスSDGsText-to-ImageモデルPixelllot S3ソフトバンクダフト・パンクメモリスタAIスマートコーチGlenn MarshallThe Age of A.I.Story2Hallucination音声変換LatitudeレコメンデーションJukeboxDreamboothVeap Japanヤン・ルカンEAPneoAIPerfusionSIFT福井千春DreamIconニューラル物理学DCGAN医療mign毛髪MOBADANNCEメンタルケアstudiffuse荒牧英治人事ハーバード大学Edgar HandyAndreessen Horowitz中ザワヒデキ研修デューク大学大屋雄裕QA Tech Night中川裕志mynet.aiローグライクゲーム松木晋祐Adreeseen Horowitz東京理科大学下田純也NVIDIA Avatar Cloud Engine人工音声NeurIPS 2021産業技術総合研究所桑野範久Replica StudiosリザバーコンピューティングSmart NPCsプレイ動画ヒップホップ対話型AIモデルRoblox Studio詩ソニーマーケティングPromethean AIサイレント映画もじぱnote音源分離環境音暗号通貨note AIアシスタントMusiioFUZZLEKetchupEndelAlterationAI News粒子群最適化法Art Selfie進化差分法オープンワールドArt TransferSonar群知能下川大樹AIFAPet PortraitsSonar+Dウィル・ライト高津芳希P2EBlob OperaWeb3大石真史クリムトDolby AtmosBEiTStyleGAN-NADASonar Music FestivalDETRライゾマティクスSporeUnreal Engineクリティックネットワーク真鍋大度デノイズUnity for Industryアクターネットワーク花井裕也画像処理DMLabRitchie HawtinSentropyGLIDEControl SuiteErica SynthCPUDiscordAvatarCLIPAtari 100kUfuk Barış MutluSynthetic DataAtari 200MJapanese InstructBLIP AlphaCALMYann LeCun日本新聞協会プログラミングサム・アルトマン鈴木雅大AIいらすとやソースコード生成コンセプトアートAI PicassoGMAIシチズンデベロッパーSonanticColie WertzEmposyGitHubCohereリドリー・スコットAIタレントウィザードリィMCN-AI連携モデル絵コンテAIタレントエージェンシーUrzas.aiストーリーボードmodi.ai介護大阪大学BitSummit西川善司並木幸介KikiBlenderBitSummit Let’s Go!!サムライスピリッツ森寅嘉Zoetic AIゼビウスSIGGRAPH 2021ペットストリートファイター半導体Digital Dream LabsPaLM APIデジタルレプリカTopaz Video Enhance AICozmoMakerSuiteGOT7DLSSタカラトミーSkebsynthesia山野辺一記NetEaseLOVOTDreambooth-Stable-DiffusionHumanRF大里飛鳥DynamixyzMOFLINActors-HQRomiGoogle EarthSAG-AFTRAU-NetミクシィGEPPETTO AIWGA13フェイズ構造ユニロボットStable Diffusion web UIチャーリー・ブルッカーADVユニボPoint-EXLandGatoアパレル岡野原大輔AGIAI model自己教師あり学習DEATH STRANDINGAI ModelsIn-Context Learning(ICL)Eric Johnson汎用強化学習AIZMO.AILoRAデザインMOBBY’SファインチューニングOculus Questコジマプロダクションロンドン芸術大学モビーディックグランツーリスモ生体情報デシマエンジンGoogle Brainダイビング量子コンピュータSound Controlアウトドアqubit写真SYNTH SUPERAIスキャニングIBM Quantum System 2照明Maxim PeterKarl Sims自動採寸北野宏明Joshua RomoffArtnome3DLOOKダリオ・ヒルハイパースケープICONATESizerジェン・スン・フアン山崎陽斗ワコールHuggingFace立木創太スニーカーStable Audio浜中雅俊UNSTREET宗教ミライ小町Newelse仏教テスラ福井健策CheckGoodsコカ・コーラGameGAN二次流通食品パックマンTesla Bot中古市場Coca‑Cola Y3000 Zero SugarTesla AI DayWikipediaDupe KillerCopilot Copyright Commitmentソサエティ5.0Sphere偽ブランドテラバースSIGGRAPH 2020バズグラフXaver 1000配信京都大学ニュースタンテキ養蜂立福寛東芝Beewiseソニー・ピクチャーズ アニメーション音声解析DIB-R倉田宜典フィンテック感情分析投資Fosters+Partners周 済涛韻律射影MILIZEZaha Hadid Architectsステートマシン韻律転移三菱UFJ信託銀行ディープニューラルネットワーク
デジタルツインの浸透がAI開発を加速させる:月刊エンタメAIニュース vol.23
エンタメにおいても人工知能は日進月歩で発展しており、新しい研究成果や試みが次々と発表されています。こちらの連載では、過去1か月間、主に海外で公開された注目すべきゲームAIやエンタメAIに関連したニュース、論文などを紹介していきます。
デジタルツインというAIのゆりかご
この1か月は、11月9日に開催されたNVIDIAのテクノロジーカンファレンス「NVIDIA GTC」が話題の中心でした。なかでも、仮想空間におけるリアルタイムシミュレーションプラットフォーム「NVIDIA Omniverse」に追加された新機能の数々は、デジタルツインやメタバースといったキーワードが社会構造の根幹へ向かって浸透し始めたいま、まさに時代の変遷を象徴する技術といえます。
「Omniverse Avatar」は、音声認識や自然言語処理、コンピュータビジョン、レコメンデーションエンジンといった同社の既存技術を駆使したAIアシスタントの生成を可能にします。音声認識には複数言語に対応したソフトウェア開発キット「NVIDIA Riva」、自然言語処理には大規模言語モデル「NVIDIA Megatron」、レコメンデーションエンジンにはディープラーニングのフレームワーク「NVIDIA Merlin」、そしてコンピュータビジョンにはビデオ分析に用いられるフレームワークの「NVIDIA Metropolis」が活用されています。
「Omniverse Replicator」は、物理的にシミュレーションされた合成データを生成するためのエンジンです。ディープニューラルネットワークの学習用データを作る際に強力なツールとなります。今回の発表では、このエンジンを基に開発された2つのアプリケーション「NVIDIA DRIVE Sim」と「NVIDIA Isaac Sim」も披露されました。前者は自律走行車のデジタルツインを、後者はマニピュレータロボットのデジタルツインをホストするための仮想空間を構築します。これにより、現実空間では膨大な時間と莫大な資金を要してきた試験走行や動作確認といった開発プロセスが大幅に加速することが期待されます。
自動車メーカーのBMWはすでに「NVIDIA Omniverse」によって構築されたデジタルツイン工場を導入しており、仮想空間におけるシミュレーションによって生産ラインを最適化しています。また、通信機器メーカーのエリクソンは都市全体のデジタルツインを使ったシミュレーションによって、5G基地局や通信アンテナの設置場所を最適化しています。仮想空間におけるシミュレーションだからこそ、電波の伝搬や反射、強度をレイトレーシング技術によって可視化できるという利点があります。
このほか、サプライチェーンにおける物流の最適化を支援するために同社が公開したソフトウェア「NVIDIA ReOpt」のデモンストレーションでも、ワークフローのシミュレーションに「NVIDIA Isaac Sim」が使われています。デジタルツインやメタバースという概念は、いまやAI技術の発展と応用に欠かせない存在になりつつあります。
AIが皿洗いをこなすために必要な条件
長きにわたって人類は食事の支度や食器の片付け、整理整頓を手伝ってくれるロボットの実現を夢見てきました。こうした家庭用ロボットの実用化には、ロボットが物理的に世界と接するための身体の壁と、ロボットを取り巻く世界を認識するための知能の壁が立ちはだかります。そして、これら2つを前提条件としてさらに越えなければならない壁が、安全かつ効率的にタスクをこなすための手順をいかに学習させるかという課題です。
たとえば、人間は使い終わった食器を洗う際、使用済みの食器のみを流し台に運んで蛇口から水あるいはお湯を出し、スポンジと洗剤を手に取って汚れを浮かせて洗い流すという行程を、複雑な思考なしで感覚的に実行できます。それはすべてのオブジェクトが有する用途や手順といったコンテキストを理解し、それらを瞬時に組み合わせる能力があるからです。

テキサス大学オースティン校とフェイスブックAIリサーチの研究チームは、AIが人間と同じ視点から物理世界のオブジェクトを認識し、あらゆるタスクを効率的に実行するための強化学習フレームワークを発表しました。前回の記事で紹介した「一人称視点の情報から世界を認識させることを目的としたフェイスブックのAIモデル」を応用した内容で、人間の日常タスクを記録した一人称視点の映像からオブジェクト間の関係性を学習し、それらを基に強化学習における各報酬の値を決定するという仕組みです。
使用済みの食器を洗うというタスクを例に挙げると、流し台の蛇口から水あるいはお湯を出すというアクションは、流し台の中に使用済みの食器が置かれている状態で実行した場合に限り、報酬が高くなるように設定されます。一方で流し台が空、もしくは野菜や本といった洗うべき食器以外の物が置かれている場合は報酬が低くなるという具合です。こうしたフレームワークを用いることによって、完全にランダムな行動を繰り返させるよりも迅速で正確な学習が可能になるというわけです。
働き方改革で増す音声対話AIの需要
10月26日には、サイバーエージェントのAI技術研究組織「AI Lab」が、AIによる人間らしく自然で高度な音声対話の実現を目的とした音声対話AIの研究専門組織「完全自動対話研究センター」を新設しました。音声対話AI領域の研究者30名の新規採用にくわえて、産学連携の強化を進めることで、5年後をめどにAIを相手にした完全自動会話の成立を目指すということです。
同社は過去にも、AI自動音声対話システム「AI Messenger Voicebot」や「コロナワクチンAI電話エージェント」の開発を手掛けており、音声対話AIを活用したサービスの提供に注力してきました。
スマートスピーカーの普及によってAIとの音声コミュニケーションが一般的な行為となった昨今、コールセンターのような音声コミュニケーションによる業務の効率化を目的としたAIによる自動化のニーズはますます高まっています。また、企業や自治体で進む働き方改革の観点からも、音声対話AIの需要はさらに増していくことが予想されます。
万人へ開放された最強の言語AIモデル
人工知能の研究を目的とした非営利団体OpenAIは11月18日、大規模自然言語処理モデル「GPT-3」のAPI利用に人数制限を設けてきたウェイトリストの撤廃を発表しました。これにより今後は誰もがすぐさまAPIを利用できることになります。
GPT-3は「Generative Pretrained Transformer」という名が示すとおり、教師なしTransformerであり、1750億個という膨大なパラメータを持つ言語モデルです。2020年6月からAPIとして外部への提供が始まりましたが、実際に利用できる人数は限られていました。比較的少ない学習で人間と同等の品質で文章を生成できる精度が特徴で、それゆえにフェイクニュースやフィッシング詐欺に悪用される可能性も懸念されてきました。
今年8月には、このGPT-3に数十億のソースコードを学習させることで自然言語からプログラミング言語への変換を可能にしたAIモデル「OpenAI Codex」のAPIも限定的に公開され始めました。
今回の利用制限の撤廃に際しては、ヘイトスピーチやアダルトコンテンツにおけるAPIの使用を禁止するためにガイドラインが更新されています。また、セーフガードとしてAPIにはあらかじめコンテンツフィルターが設けられているということです。誰もがGPT-3へアクセスできるようになったことで、文章の翻訳や要約、創作を支援する多様なアプリケーションの探求がさらに加速することは間違いないでしょう。
Writer: Ritsuko Kawai / 河合律子、Photo by Zack Walker on Unsplash