モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。
- TAG LIST
- CGCGへの扉安藤幸央機械学習ディープラーニング月刊エンタメAIニュース河合律子GANOpenAI吉本幸記音楽NVIDIA生成系AI強化学習ニューラルネットワーク三宅陽一郎GoogleStable DiffusionグーグルQAシナリオDeepMind人工知能学会GPT-3森川幸人自然言語処理ChatGPTFacebook大内孝子マイクロソフト大規模言語モデル映画キャラクターAI敵対的生成ネットワークルールベースAIと倫理アートゲームプレイAIスクウェア・エニックスモリカトロンAIラボインタビュー倫理SIGGRAPH著作権モリカトロンデバッグ画像生成NFTDALL-E2StyleGANプロシージャルLLM遺伝的アルゴリズムNPC自動生成テストプレイメタAI画像生成AIテキスト画像生成ロボット深層学習ファッションCEDEC2019ディープフェイクVFXAdobeMidjourneyデジタルツインボードゲームDALL-ECLIPビヘイビア・ツリーマンガCEDEC2021CEDEC2020ゲームAIメタバース不完全情報ゲームVRナビゲーションAI畳み込みニューラルネットワークGDC 2021JSAI2022作曲NVIDIA OmniverseGDC 2019マルチエージェントCEDEC2022MinecraftAIアート小説アニメーションStability AIメタ懐ゲーから辿るゲームAI技術史toioジェネレーティブAI音楽生成AIスポーツ栗原聡手塚治虫CNNバーチャルヒューマンBERTMicrosoftUnityMetaOmniverse3DCGJSAI2023鴫原盛之HTN階層型タスクネットワークソニーGPT-4汎用人工知能JSAI2020GTC2023NeRFTensorFlowインタビューイベントレポート対話型エージェントAmazonロボティクスDQN水野勇太アバターUbisoftGenvid TechnologiesガイスターStyleGAN2デジタルヒューマンGTC2022教育JSAI2021はこだて未来大学研究エージェントシムピープルMCS-AI動的連携モデルプロンプトモーションキャプチャーTEZUKA2020CEDEC2023マルチモーダルElectronic Arts3DマーケティングメタデータGDC SummerブロックチェーンCMMicrosoft Azureアストロノーカキャリア模倣学習eスポーツスタンフォード大学アーケードゲームテニスサイバーエージェントトレーディングカード音声認識メディアアート類家利直eSportsBLUE PROTOCOLシーマンaibo合成音声チャットボットブラック・ジャックAWS徳井直生斎藤由多加AlphaZeroTransformerARGPT-2rinnaAIりんなカメラELSI環世界中島秀之PaLM哲学ベリサーブPlayable!GPT-3.5理化学研究所Gen-1SIGGRAPH ASIASFNetflixデータマイニング東京大学Bard現代アートDARPAドローンシムシティImagenZorkバイアスASBSぱいどんアドベンチャーゲームAI美空ひばりテキスト生成手塚眞バンダイナムコ研究所スパーシャルAINEDOFSM-DNNLEFT 4 DEADイーロン・マスク通しプレイOpenAI FiveStable Diffusion XL本間翔太馬淵浩希Cygames森山和道Audio2Faceピクサープラチナエッグイーサリアムボエダ・ゴティエビッグデータ中嶋謙互Amadeus Codeデータ分析MILEナラティブNVIDIA RivaOmniverse ReplicatorWCCFレコメンドシステムNVIDIA DRIVE SimWORLD CLUB Champion FootballNVIDIA Isaac Simセガ柏田知大軍事田邊雅彦トレカMax CooperGPTFireflyPyTorchChatGPT4眞鍋和子バンダイナムコスタジオ大澤博隆SFプロトタイピング齊藤陽介マインクラフトお知らせMagic Leap OneTencentモリカトロン開発者インタビュー宮本茂則バスケットボールサルでもわかる人工知能text-to-3DVAEDreamFusionTEZUKA2023リップシンキングRNNUbisoft La Forge自動運転車ワークショップ知識表現ウォッチドッグス レギオンVTuberIGDA立教大学秋期GTC2022市場分析どうぶつしょうぎEpic GamesRobloxジェイ・コウガミ音楽ストリーミングMITAIロボ「迷キュー」に挑戦野々下裕子Adobe MAXマシンラーニング村井源5GMuZeroRival Peakpixivオムロン サイニックエックスクラウド電気通信大学対話エンジン稲葉通将3Dスキャン橋本敦史リトル・コンピュータ・ピープルCodexシーマン人工知能研究所コンピューティショナル・フォトグラフィーPreferred Networksゴブレット・ゴブラーズ絵画Microsoft DesignerイラストシミュレーションSoul Machines柿沼太一完全情報ゲーム坂本洋典釜屋憲彦ウェイポイントLLaMAパス検索対談藤澤仁生物学GTC 2022画像認識ハリウッドSiemensストライキStyleCLIPDeNA長谷洋平クラウドコンピューティングmasumi toyotaIBM宮路洋一OpenSeaGDC 2022SNSTextWorldEarth-2BingMagentaYouTube音声生成AIELYZA PencilScenarioSIGGRAPH2023テキスト画像生成AI松尾豊AIピカソGTC2021AI素材.comCycleGANテンセントAIQVE ONENetHackキャラクターモーションControlNetNBAフェイクニュースユニバーサルミュージックRPG法律SIGGRAPH 2022世界モデルレベルデザインゲームエンジンDreamerV3AIボイスアクター南カリフォルニア大学NVIDIA CanvasGPUALife人工生命オルタナティヴ・マシンサウンドスケープLaMDATRPGマジック:ザ・ギャザリングAI DungeonRed Ramマーダーミステリーゲーム背景不気味の谷ナビゲーションメッシュインディーゲーム高橋ミレイ深層強化学習松原仁松井俊浩武田英明ELYZAフルコトELYZA DIGEST建築音声合成広告西成活裕ハイブリッドアーキテクチャApex LegendsELIZA群衆マネジメントライブポートレイトNinjaコンピュータRPGライブビジネスWonder StudioAdobe Max 2023アップルタウン物語新型コロナ土木MindAgentKELDIC周済涛BIMBing Chatメロディ言語清田陽司インフラBing Image CreatorゲームTENTUPLAYサイバネティックスDALL-E 3MARVEL Future FightAstro人工知能史Amazon BedrockAssistant with BardタイムラプスEgo4DAI哲学マップThe Arcadeバスキア星新一X.AISearch Generative Experience日経イノベーション・ラボStyleGAN-XLX Corp.Dynalang敵対的強化学習StyleGAN3TwitterVLE-CE階層型強化学習GOSU Data LabGANimatorXホールディングス論文WANNGOSU Voice AssistantVoLux-GANMagiAI Act竹内将SenpAI.GGProjected GANEUMobalyticsSelf-Distilled StyleGANSDXLArs ElectronicaニューラルレンダリングRTFKTAI規制岡島学AWS SagemakerPLATONIKE欧州委員会映像セリア・ホデント形態素解析frame.ioClone X欧州議会UXAWS LambdaFoodly村上隆欧州理事会誤字検出MusicLM認知科学中川友紀子Digital MarkAudioLMゲームデザインSentencePieceアールティSnapchatMusicCapsLUMINOUS ENGINEクリエイターコミュニティAudioCraftLuminous ProductionsBlenderBot 3バーチャルペット効果音パターン・ランゲージ竹村也哉Meta AINVIDIA NeMo ServiceMubertちょまどマーク・ザッカーバーグヴァネッサ・ローザMubert RenderGOAPWACULVanessa A RosaGen-2Adobe MAX 2021陶芸Runway AI Film Festival自動翻訳Play.htPreViz音声AINVIDIA ACEAIライティングLiDARCharacter-LLMOmniverse AvatarAIのべりすとPolycam復旦大学FPSQuillBotdeforumChat-Haruhi-Suzumiyaマルコフ決定過程NVIDIA MegatronCopysmith動画生成AI涼宮ハルヒNVIDIA MerlinJasperハーベストEmu VideoNVIDIA MetropolisForGamesNianticパラメータ設計ゲームマーケットペリドットバランス調整岡野翔太Dream Track協調フィルタリング郡山喜彦Music AI Tools人狼知能テキサス大学ジェフリー・ヒントンLyriaGoogle I/O 2023Yahoo!知恵袋AlphaDogfight TrialsAI Messenger VoicebotGoogle I/OインタラクティブプロンプトAIエージェントシミュレーションOpenAI Codex武蔵野美術大学慶應義塾大学StarCraft IIHyperStyleBingAI石渡正人Future of Life InstituteRendering with Style手塚プロダクションIntelDisney林海象LAIKADisneyリサーチヴィトゲンシュタインPhotoshop古川善規RotomationGauGAN論理哲学論考Lightroom大規模再構成モデルGauGAN2京都芸術大学CanvaLRMドラゴンクエストライバルズ画像言語表現モデルObjaverse不確定ゲームSIGGRAPH ASIA 2021PromptBaseBOOTHMVImgNetDota 2モンテカルロ木探索ディズニーリサーチpixivFANBOXOne-2-3-45Mitsuba2バンダイナムコネクサス虎の穴3DガウシアンスプラッティングソーシャルゲームEmbeddingワイツマン科学研究所ユーザーレビューFantiaワンショット3D生成技術GTC2020CG衣装mimicとらのあな高橋力斗NVIDIA MAXINEVRファッションBaidu集英社淡路滋ビデオ会議ArtflowERNIE-ViLG少年ジャンプ+グリムノーツEponym古文書ComicCopilotゴティエ・ボエダ音声クローニング凸版印刷コミコパGautier Boeda階層的クラスタリングGopherAI-OCRゲームマスター画像判定Inowrld AIJuliusSIE鑑定ラベル付けMODTPRGOxia PalusGhostwriterバーチャル・ヒューマン・エージェントtoio SDK for UnityArt RecognitionSkyrimクーガー田中章愛実況パワフルサッカースカイリム石井敦銭起揚NHC 2021桃太郎電鉄RPGツクールMZ茂谷保伯池田利夫桃鉄ChatGPT_APIMZGDMC新刊案内パワサカダンジョンズ&ドラゴンズマーベル・シネマティック・ユニバースコナミデジタルエンタテインメントOracle RPG成沢理恵MITメディアラボMCU岩倉宏介深津貴之アベンジャーズPPOxVASynthマジック・リープDigital DomainMachine Learning Project CanvasLaser-NVMagendaMasquerade2.0国立情報学研究所ノンファンジブルトークンDDSPフェイシャルキャプチャー石川冬樹MERFサッカースパコンAlibaba里井大輝KaggleスーパーコンピュータVQRF山田暉松岡 聡nvdiffrecAssassin’s Creed OriginsAI会話ジェネレーターTSUBAME 1.0NeRFMeshingSea of ThievesTSUBAME 2.0LERFGEMS COMPANYmonoAI technologyLSTMABCIマスタリングモリカトロンAIソリューション富岳TikTok初音ミクOculusコード生成AISociety 5.0リアム・ギャラガー転移学習テストAlphaCode夏の電脳甲子園グライムスBaldur's Gate 3Codeforces座談会BoomyCandy Crush Saga自己増強型AItext-to-imageジョン・レジェンドSIGGRAPH ASIA 2020COLMAPザ・ウィークエンドADOPNVIDIA GET3DドレイクデバッギングBigGANGANverse3DMaterialGANグランツーリスモSPORTAI絵師エッジワークスReBeLグランツーリスモ・ソフィーUGC日本音楽作家団体協議会GTソフィーPGCFCAVolvoFIAグランツーリスモチャンピオンシップVoiceboxNovelAIさくらインターネットRival PrakDGX A100NovelAI DiffusionぷよぷよユービーアイソフトWebcam VTuberモーションデータ星新一賞大阪公立大学北尾まどかHALOポーズ推定TCG将棋メタルギアソリッドVフォートナイトメッシュ生成KLabFSMメルセデス・ベンツQRコードMagic Leap囲碁ナップサック問題Live NationEpyllionデンソー汎用言語モデルWeb3.0マシュー・ボールデンソーウェーブAIOpsムーアの法則原昌宏Spotifyスマートコントラクト日本機械学会Replica Studioロボティクス・メカトロニクス講演会amuseChitrakarQosmoAdobe MAX 2022トヨタ自動車巡回セールスマン問題かんばん方式ジョルダン曲線メディアAdobe Research政治Galacticaプロット生成クラウドゲーミングがんばれ森川君2号和田洋一リアリティ番組映像解析FastGANStadiaジョンソン裕子セキュリティ4コママンガMILEsNightCafe東芝デジタルソリューションズインタラクティブ・ストリーミングLuis RuizSATLYS 映像解析AIインタラクティブ・メディアポケモンPFN 3D ScanElevenLabs東京工業大学HeyGenLudo博報堂After EffectsラップPFN 4D Scan絵本SIGGRAPH 2019ArtEmisZ世代DreamUp出版AIラッパーシステムDeviantArtAmmaar ReshiWaifu DiffusionStoriesGROVERプラスリンクス ~キミと繋がる想い~元素法典StoryBirdFAIRSTCNovel AIVersedチート検出Style Transfer ConversationOpen AIProlificDreamerオンラインカジノRCPUnity SentisアップルRealFlowRinna Character PlatformUnity MuseiPhoneCALACaleb WardDeep Fluids宮田龍MeInGameAmelia清河幸子AIGraphブレイン・コンピュータ・インタフェースバーチャルキャラクター西中美和BCIGateboxアフォーダンス安野貴博Learning from VideoANIMAKPaLM-SayCan斧田小夜予期知能逢妻ヒカリ宮本道人セコムGitHub CopilotLLaMA 2ユクスキュルバーチャル警備システムCode as Policiesカント損保ジャパンCaPHugging FaceCM3leon上原利之Stable DoodleドラゴンクエストエージェントアーキテクチャアッパーグラウンドコリジョンチェックT2I-AdapterPAIROCTOPATH TRAVELERxAI西木康智OCTOPATH TRAVELER 大陸の覇者山口情報芸術センター[YCAM]アルスエレクトロニカ2019品質保証YCAM日本マネジメント総合研究所StyleRigAutodeskアンラーニング・ランゲージVoyager逆転オセロニアBentley Systemsカイル・マクドナルドLily Hughes-Robinsonワールドシミュレーターローレン・リー・マッカーシーColossal Cave Adventure奥村エルネスト純いただきストリートH100鎖国[Walled Garden]プロジェクトAdventureGPT齋藤精一大森田不可止COBOLSIGGRAPH ASIA 2022リリー・ヒューズ=ロビンソン高橋智隆DGX H100VToonifyBabyAGIロボユニザナックDGX SuperPODControlVAEGPT-3.5 Turbo泉幸典仁井谷正充変分オートエンコーダーカーリングロボコレ2019Instant NeRFフォトグラメトリウィンブルドンartonomous回帰型ニューラルネットワークbitGANsDeepJoin戦術分析ぎゅわんぶらあ自己中心派Azure Machine LearningAzure OpenAI Serviceパフォーマンス測定意思決定モデル脱出ゲームDeepLIoTHybrid Reward Architectureコミュニティ管理DeepL WriteProFitXウロチョロスSuper PhoenixWatsonxProject MalmoオンラインゲームAthletica気候変動コーチングProject Paidiaシンギュラリティ北見工業大学Project Lookoutマックス・プランク気象研究所レイ・カーツワイル北見カーリングホールWatch Forビョルン・スティーブンスヴァーナー・ヴィンジ画像解析気象モデルRunway ResearchじりつくんLEFT ALIVE気象シミュレーションMake-A-VideoNTT Sportict長谷川誠ジミ・ヘンドリックス環境問題PhenakiAIカメラBaby Xカート・コバーンエコロジーDreamixSTADIUM TUBEロバート・ダウニー・Jr.エイミー・ワインハウスSDGsText-to-ImageモデルPixelllot S3ソフトバンクダフト・パンクメモリスタAIスマートコーチGlenn MarshallThe Age of A.I.Story2Hallucination音声変換LatitudeレコメンデーションJukeboxDreamboothVeap Japanヤン・ルカンEAPneoAIPerfusionSIFT福井千春DreamIconニューラル物理学DCGAN医療mign毛髪MOBADANNCEメンタルケアstudiffuse荒牧英治人事ハーバード大学Edgar HandyAndreessen Horowitz中ザワヒデキ研修デューク大学大屋雄裕QA Tech Night中川裕志mynet.aiローグライクゲーム松木晋祐Adreeseen Horowitz東京理科大学下田純也NVIDIA Avatar Cloud Engine人工音声NeurIPS 2021産業技術総合研究所桑野範久Replica StudiosリザバーコンピューティングSmart NPCsプレイ動画ヒップホップ対話型AIモデルRoblox Studio詩ソニーマーケティングPromethean AIサイレント映画もじぱnote音源分離環境音暗号通貨note AIアシスタントMusiioFUZZLEKetchupEndelAlterationAI News粒子群最適化法Art Selfie進化差分法オープンワールドArt TransferSonar群知能下川大樹AIFAPet PortraitsSonar+Dウィル・ライト高津芳希P2EBlob OperaWeb3大石真史クリムトDolby AtmosBEiTStyleGAN-NADASonar Music FestivalDETRライゾマティクスSporeUnreal Engineクリティックネットワーク真鍋大度デノイズUnity for Industryアクターネットワーク花井裕也画像処理DMLabRitchie HawtinSentropyGLIDEControl SuiteErica SynthCPUDiscordAvatarCLIPAtari 100kUfuk Barış MutluSynthetic DataAtari 200MJapanese InstructBLIP AlphaCALMYann LeCun日本新聞協会プログラミングサム・アルトマン鈴木雅大AIいらすとやソースコード生成コンセプトアートAI PicassoGMAIシチズンデベロッパーSonanticColie WertzEmposyGitHubCohereリドリー・スコットAIタレントウィザードリィMCN-AI連携モデル絵コンテAIタレントエージェンシーUrzas.aiストーリーボードmodi.ai介護大阪大学BitSummit西川善司並木幸介KikiBlenderBitSummit Let’s Go!!サムライスピリッツ森寅嘉Zoetic AIゼビウスSIGGRAPH 2021ペットストリートファイター半導体Digital Dream LabsPaLM APIデジタルレプリカTopaz Video Enhance AICozmoMakerSuiteGOT7DLSSタカラトミーSkebsynthesia山野辺一記NetEaseLOVOTDreambooth-Stable-DiffusionHumanRF大里飛鳥DynamixyzMOFLINActors-HQRomiGoogle EarthSAG-AFTRAU-NetミクシィGEPPETTO AIWGA13フェイズ構造ユニロボットStable Diffusion web UIチャーリー・ブルッカーADVユニボPoint-EXLandGatoアパレル岡野原大輔AGIAI model自己教師あり学習DEATH STRANDINGAI ModelsIn-Context Learning(ICL)Eric Johnson汎用強化学習AIZMO.AILoRAデザインMOBBY’SファインチューニングOculus Questコジマプロダクションロンドン芸術大学モビーディックグランツーリスモ生体情報デシマエンジンGoogle Brainダイビング量子コンピュータSound Controlアウトドアqubit写真SYNTH SUPERAIスキャニングIBM Quantum System 2照明Maxim PeterKarl Sims自動採寸北野宏明Joshua RomoffArtnome3DLOOKダリオ・ヒルハイパースケープICONATESizerジェン・スン・フアン山崎陽斗ワコールHuggingFace立木創太スニーカーStable Audio浜中雅俊UNSTREET宗教ミライ小町Newelse仏教テスラ福井健策CheckGoodsコカ・コーラGameGAN二次流通食品パックマンTesla Bot中古市場Coca‑Cola Y3000 Zero SugarTesla AI DayWikipediaDupe KillerCopilot Copyright Commitmentソサエティ5.0Sphere偽ブランドテラバースSIGGRAPH 2020バズグラフXaver 1000配信京都大学ニュースタンテキ養蜂立福寛東芝Beewiseソニー・ピクチャーズ アニメーション音声解析DIB-R倉田宜典フィンテック感情分析投資Fosters+Partners周 済涛韻律射影MILIZEZaha Hadid Architectsステートマシン韻律転移三菱UFJ信託銀行ディープニューラルネットワーク
CGへの扉 Vol.41:AIが促進させるCG研究。SIGGRAPH2022論文より
バンクーバー会場とオンラインのハイブリッド開催、CGの学会SIGGRAPH 2022
毎年7月から8月にかけて北米で開催されていたコンピュータグラフィックスに関する学会・展示会であるSIGGRAPHが、2022年はカナダバンクーバーの会場と、オンライン配信とのハイブリッド環境で開催されました。
SIGGRAPH 2022 開催概要:https://s2022.siggraph.org/
昨年の SIGGRAPH 2021 紹介記事
・CGへの扉 Vol.29:AIの恩恵を受けるCG研究の世界。#SIGGRAPH2021 論文より
・CGへの扉 Vol.30:SIGGRAPH2021レポート「ディープフェイクとの戦い」
SIGGRAPH2022のスケジュール
- 7月25日(米国時間)より、オンデマンドのいつでも見られるオンラインコンテンツの配信が開始
- 8月8日〜11日(米国時間)の4日間は会場とオンライン配信のハイブリッド開催。同時期にライブQ&Aやライブ配信を実施(ライブのみで収録配信がないものもあり)
- 10月31日(米国時間)まで、3か月間弱、上記開催期間中のライブ配信の収録もふくめ、オンデマンドのオンラインコンテンツが観られる
近年、SIGGRAPHの3DCG研究、画像や映像、音声研究に際して、人工知能関連のアプローチや手法、フレームワークの活用は重要な要素になっています。本記事では、SIGGRAPH 2022 の論文発表より、人工知能によってCG研究が促進されたもの、人工知能がそのCG研究の根幹をなすもの、新しい取り組みに人工知能を活用しているCG研究をご紹介します。今年は 194本の論文と、学会誌 ToG(Transactions on Graphics)から優秀論文 53本が採択されました。こちらの動画は、SIGGRAPH 2022 の論文ダイジェスト(一部)です。
SIGGRAPH 2022 の論文リンク集(非公式版):https://kesen.realtimerendering.com/sig2022.html
今年のBest Paper(優秀論文)は5本、そのうち4本が人工知能技術に関係し、研究の重要な要素となっている論文です。
- Image Features Influence Reaction Time: A Learned Probabilistic Perceptual Model for Saccade Latency
- CLIPasso: Semantically Aware Object Sketching
- Instant Neural Graphics Primitives with a Multiresolution Hash Encoding
- Spelunking the Deep: Guaranteed Queries on General Neural Implicit Surfaces
- DeepPhase: Periodic Autoencoders for Learning Motion Phase Manifolds
SIGGRAPH 2022 で発表された AIが関連したCG研究論文
CLIPasso: Semantically Aware Object Sketching
論文:https://arxiv.org/pdf/2202.05822.pdf
サンプルコード:https://github.com/nerfies/nerfies.github.io
動画:https://clipasso.github.io/clipasso/
写真画像を抽象的なスケッチに変換。人間の画家が描くような、対象物の本質を捉え少ないストロークで表現したスケッチ画を生成するためのAI研究。クリップと画家のピカソを混ぜ合わせた造語であるCLIPassoと銘打ったこの研究では、AIには難しいと考えられてきた写真の「要約」としてのスケッチ表現を導き出すものです。本研究では、抽象化した線画のストローク数によって詳細度のレベルを調整しています。
人間であれば子どもでも自然と猫の絵を線画で描いたり、人の顔を抽象化たりして描くことができています。ピカソが雄牛を抽象化して描いた作品も、一気に線画にしたわけではなく、段階を踏みながら余計な要素を削ぎ落としていったことが知られています。

DeepPhase: Periodic Autoencoders for Learning Motion Phase Manifolds
論文:https://dl.acm.org/doi/pdf/10.1145/3528223.3530178
サンプルコード:https://github.com/sebastianstarke/AI4Animation
キャラクタの動きに関する空間的な構造、時間的な構造を把握することは、キャラクタアニメーションの合成における基本的な課題です。本研究は、教師データなしで、構造化されていない動きから周期的な特徴を取り出し、活用することのできるアプローチです。例えばサッカーにおけるドリブル動作や、音楽に合わせたダンスの動き、ある特定の運動技能、動物の動きなどの独特のスタイルを持った動きなど、さまざまなキメポーズ用アニメーションデータベースの構築が期待できる研究です。
VoLux-GAN: A Generative Model for 3D Face Synthesis with HDRI Relighting
動画:https://augmentedperception.github.io/voluxgan/
論文:https://arxiv.org/pdf/2201.04873.pdf
サンプルコード:https://github.com/google/volux-gan
本研究は、2Dの顔画像生成だけではない、3D顔データを生成し、拡散データなどを含むHDR(High Dynamic Range:ハイダイナミックレンジ)環境を考慮したGAN(Genera tive Adversarial Networks:敵対的生成ネットワーク)を提案するものです。一枚の写真に映った顔画像へ2D画像処理として再照明を施すテクノロジーは、すでにスマートフォンの写真アプリなどで実現しています。そこから一歩進んで、再照明可能な、3D顔モデルを生成できるようにすることで、リアルなアバターの生成などの可能性が広がります。
GANimator: Neural Motion Synthesis from a Single Sequence
論文:https://peizhuoli.github.io/ganimator/paper/ganimator-camera-ready.pdf
サンプルコード:https://github.com/PeizhuoLi/ganimator
GANimatorは、ひとつの短い動作シーケンスから新しい動作を合成するための生成モデルです。オリジナルのモーションに類似したモーションを生成するとともに、新しく多様なモーションを合成することができます。既存の様々なモーションを扱う技術は骨格に依存していますが、本研究ではひとつのモーションシーケンスを学習するだけで、2足歩行、4足歩行、6足歩行など、さまざまな骨格構造をもったモーションを生成することができるため、人の動きをもとに6足モンスターの動きを生成するといったことが可能です。群衆シミュレーション、キーフレーム編集、スタイルの転記、インタラクティブな制御など、ひとつのモーションシーケンスからさまざまなアプリケーションの可能性を示唆しています。
StyleGAN-XL:Scaling StyleGAN to Large Diverse Datasets
画像合成に使われるStyleGANは、従来手法に比べ高精細で制御が容易なGAN(Genera tive Adversarial Networks:敵対的生成ネットワーク)として広く活用されています。ところが構造が揃っていないデータセットには向かないことや、そういったデータセットを扱った際の処理スピードの低下、高解像度になると生成画像が安定しないという課題が潜在しています。StyleGAN-XLではこれらの課題に対処し、StyleGAN3をベースに正規化、大量の計算、ハイパーパラメータ調整を行うProjected GANを組み合わせ、多様なデータセットでも安定して1024×1024解像度の画像生成を比較的高速に出力できるようにしたものです。
Self-Distilled StyleGAN: Towards Generation from Internet Photos
論文:https://arxiv.org/pdf/2202.12211.pdf
サンプルコード:https://github.com/self-distilled-stylegan/self-distilled-internet-photos
画像生成に広く使われているStyleGANは、粒度の揃ったあらかじめ準備されたデータセットでの学習を想定しています。本研究は、インターネット上にある雑多な画像をデータセットとして活用できるアプローチを提供するものです。ネット上から入手された画像にフィルタ処理することで異常値をふくむ画像を排除することや、集めた画像を系統分けすることで、データの多様性の損失を最小限に抑えつつ、高品質な画像を生成することができるようになりました。機械学習用の一般的なデータセットには少数ではありますが不適切な画像も混在していること、意図的に収集したデータセットには無意識のうちに偏りが生じていることなどから、Self-Distilled StyleGANはひとつの解決策を示したものとなるでしょう。
異色のAI活用、ドイツ語映画の英語吹き替えをAIで
マチェイ・バルチェフスキ監督の2020年始めはポーランドで公開された長編映画『The Champion(邦題:アウシュヴィッツのチャンピオン)』は、もともとドイツ語とポーランド語で撮影、公開されていた映画です。当初は英語圏への公開、英語への吹き替え予定はありませんでした。ところが全世界向けの配給権を取得した企業が現れ、英語対応する必要が生じました。そこでニューラルレンダリングの技術を活用し、単純な吹き替えではなく、俳優の演技のすべてと、自然な英語を話しているような音声に、顔や口の動きもふくめて、完全に英語化したのです。
もともとの出演俳優に再度英語でセリフを発話してもらい、それを5台のカメラで収録しました。元となる学習データは完成済みの映画の各シーンであること、差し替える先の顔や音声も、元の俳優であることから、技術的にはそう難しくないながらも、膨大な計算時間を要したそうです。
映像処理に使われたのは、過去のSIGGRAPHでも注目されていたバーチャルアバターを生み出すPinscreen社とテルアビブ、ロサンゼルス・シドニーを拠点とするAdapt社のジョイントベーンチャーであるPLATOでした。PLATOは機械学習を活用し、異なる言語を話す俳優の口の動きに合わせて映像を差し替えることのできる技術です。
制作作業は、ほとんどすべてリモートワークで実施されました。再録音はポーランド、VFX編集はオーストラリアで、ニューラルレンダリングはオーストラリアと米国で行われ、指示を出すプロデューサーはイスラエルに居たそうです。作業の進行には、クラウドベースの映像制作フローツールframe.ioが活用されました。
声優や俳優による吹き替えの違和感や、字幕による視線の移動は、物語の信ぴょう性や映像表現の忠実さが失われてしまう要因となります。Netflixの躍進からわかるように、グローバルマーケットで受け入れられる英語圏以外の作品も多く制作されており、これらの映像作品を違和感なく多言語化することによるメリットは計り知れないものがあるでしょう。
今回取り上げられた「アウシュヴィッツのチャンピオン」の事例は、制作の背景、事情、予算、世の中のタイミングなど、さまざまな条件がうまく行った事例かもしれませんが、今後はニューラルレンダリングで多言語化前提の映画やドラマが制作されてくることが予想されます。
The Champion(ドイツ語版の予告編)
今回取り上げたニューラルレンダリングの仕組みについて興味のある方は、昨年の SIGGRAPH 2021 のコース(チュートリアル)のひとつAdvances in Neural Rendering (SIGGRAPH 2021 Course) もご覧になってみてください。
SIGGRAPH のこれから
世界各国でさまざまなイベントがオンラインで開催されています。オンラインのメリットもあればデメリットも存在します。SIGGRAPHもハイブリッド開催、オンライン開催、状況に応じて工夫とバランスを取りつつ開催されています。今後の予定は次のとおりです。
SIGGRAPH ASIA 2022 DEAGU/韓国、11月7〜11日
SIGGRAPH 2023 50th/開催場所、開催時期とも調整中
SIGGRAPH ASIA 2023 Sydney/オーストラリア、12月12日〜15日
コロナ禍において、映像業界でもさまざまな工夫や努力が、ある意味強制的に進んでいます。バーチャルスタジオによる撮影、少人数での撮影プロトコル(規定)、Google Map(ストリートビュー)を活用してロケ地の検索、リモートワークを活用した制作フローなど、さまざまな工夫によって業界全体で乗り越えようと多くの人々が尽力しています。近い将来コロナが落ち着く時代が戻って来るかもしれませんが、コロナ禍で得られたさまざまな工夫は今後も生きていくと考えられます。
本連載の今後の予定:「CGへの扉」では、単なるAIの話題とは少し異なり、CG/VFX, アートの文脈から話題を切り取り紹介していきます。映像制作の現場におけるAI活用や、AIで価値が高まった先進的なツール、
これからの可能性を感じさせるような話題、テクノロジーの話題にご期待ください。何か取り上げて欲しいテーマやご希望などがございましたら、ぜひ編集部までお知らせください。
Vol.37:NVIDIA GTC 2022 レポート/アートとAIの視点で
Vol.36:創るためのAI〜AIと人間の創造性の未来:徳井直生氏講演レポート
Vol.35:マーベル・シネマティック・ユニバースを支える機械学習
Vol.34:注目論文よりCGの祭典 #SIGGRAPHAsia2021 を振り返る
Vol.33:AIの必然性 #SIGGRAPHAsia2021 レポート
Vol.32:Adobe Sneaks より進化の方向性を知る
Vol.30:SIGGRAPH2021レポート「ディープフェイクとの戦い」
Contributor:安藤幸央