モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。
- TAG LIST
- CGCGへの扉機械学習安藤幸央ディープラーニング月刊エンタメAIニュースGAN河合律子OpenAINVIDIA音楽吉本幸記ニューラルネットワーク三宅陽一郎強化学習GoogleQAグーグルDeepMindGPT-3Facebook自然言語処理人工知能学会大内孝子森川幸人敵対的生成ネットワークシナリオキャラクターAIスクウェア・エニックスモリカトロンAIラボインタビューマイクロソフトルールベースStable DiffusionAIと倫理アート映画デバッグNFTDALL-E2StyleGAN倫理ゲームプレイAI自動生成SIGGRAPHモリカトロンメタAIテキスト画像生成ロボット深層学習ファッションCEDEC2019プロシージャルVFXデジタルツイン遺伝的アルゴリズムテストプレイNPCDALL-ECLIP画像生成大規模言語モデルChatGPTビヘイビア・ツリーディープフェイクCEDEC2021CEDEC2020ゲームAIメタバース不完全情報ゲームVRナビゲーションAI画像生成AIボードゲーム畳み込みニューラルネットワークGDC 2021JSAI2022生成系AIAdobeGDC 2019マルチエージェントCEDEC2022著作権AIアート懐ゲーから辿るゲームAI技術史toioジェネレーティブAICNNMicrosoftNVIDIA OmniverseUnity小説アニメーション鴫原盛之HTN階層型タスクネットワークマンガ汎用人工知能JSAI2020GTC2023TensorFlowインタビューバーチャルヒューマンBERTMidjourneyイベントレポート対話型エージェントAmazonロボティクスMetaMinecraft水野勇太アバターOmniverse3DCGUbisoftGenvid TechnologiesガイスターStyleGAN2GTC2022教育ソニーJSAI2021スポーツ研究シムピープルMCS-AI動的連携モデルマーケティングGDC SummerLLMブロックチェーン作曲アストロノーカキャリアeスポーツスタンフォード大学サイバーエージェント音声認識eSportsDQNBLUE PROTOCOLシーマンStability AIメタAlphaZeroTransformerGPT-2rinnaAIりんなデジタルヒューマンカメラ環世界中島秀之PaLM哲学ベリサーブPlayable!理化学研究所SIGGRAPH ASIANetflix東京大学DARPAドローンシムシティImagenZorkバイアスモーションキャプチャーTEZUKA2020AI美空ひばり手塚治虫テキスト生成バンダイナムコ研究所スパーシャルAIElectronic Arts3DメタデータLEFT 4 DEAD通しプレイOpenAI Five本間翔太CMAudio2Faceピクサープラチナエッグイーサリアムボエダ・ゴティエビッグデータ中嶋謙互Amadeus Codeデータ分析Microsoft AzureMILE模倣学習ナラティブNVIDIA RivaアーケードゲームOmniverse ReplicatorWCCFレコメンドシステムNVIDIA DRIVE SimWORLD CLUB Champion FootballNVIDIA Isaac Simセガ柏田知大軍事田邊雅彦トレーディングカードトレカメディアアートGPTPyTorch眞鍋和子バンダイナムコスタジオaibo合成音声齊藤陽介マインクラフトお知らせMagic Leap Oneチャットボットサルでもわかる人工知能VAEDreamFusionリップシンキングUbisoft La Forge自動運転車ワークショップ知識表現ウォッチドッグス レギオンIGDA秋期GTC2022市場分析どうぶつしょうぎEpic Gamesジェイ・コウガミ音楽ストリーミングMITAIロボ「迷キュー」に挑戦AWS野々下裕子徳井直生マシンラーニング5GMuZeroRival Peakpixivクラウド対話エンジン斎藤由多加リトル・コンピュータ・ピープルCodexコンピューティショナル・フォトグラフィーゴブレット・ゴブラーズ絵画ARMicrosoft Designerイラストシミュレーション完全情報ゲーム坂本洋典釜屋憲彦ウェイポイントパス検索対談藤澤仁生物学GTC 2022画像認識GPT-3.5SiemensStyleCLIPDeNA長谷洋平masumi toyota宮路洋一OpenSeaGDC 2022Gen-1TextWorldEarth-2BingMagenta音楽生成AISFELYZA Pencil松尾豊GTC2021CycleGANテンセントデータマイニングNetHackはこだて未来大学Bardキャラクターモーションフェイクニュース現代アートエージェントRPGSIGGRAPH 2022レベルデザインAIボイスアクターNVIDIA CanvasGPUALife人工生命オルタナティヴ・マシンサウンドスケープLaMDATRPGAI DungeonプロンプトASBS栗原聡ぱいどんアドベンチャーゲーム不気味の谷ナビゲーションメッシュ松井俊浩ELYZAフルコトELYZA DIGEST建築音声合成NeRF西成活裕Apex LegendsELIZA群衆マネジメントライブポートレイトNinjaコンピュータRPGライブビジネスWonder Studioアップルタウン物語新型コロナ土木KELDIC周済涛BIMメロディ言語清田陽司インフラゲームTENTUPLAYサイバネティックスMARVEL Future FightAstro人工知能史Amazon BedrockタイムラプスEgo4DAI哲学マップイーロン・マスクバスキア星新一X.AI日経イノベーション・ラボStyleGAN-XLX Corp.敵対的強化学習StyleGAN3Twitter階層型強化学習GOSU Data LabGANimatorXホールディングスWANNGOSU Voice AssistantVoLux-GANMagi竹内将SenpAI.GGProjected GANStable Diffusion XLMobalyticsSelf-Distilled StyleGANSDXL馬淵浩希CygamesニューラルレンダリングRTFKT岡島学AWS SagemakerPLATONIKE映像セリア・ホデント形態素解析frame.ioClone XUXAWS LambdaFoodly村上隆誤字検出森山和道認知科学中川友紀子Digital MarkゲームデザインSentencePieceアールティSnapchatLUMINOUS ENGINEクリエイターコミュニティLuminous ProductionsBlenderBot 3バーチャルペットパターン・ランゲージ竹村也哉Meta AINVIDIA NeMo Serviceちょまどマーク・ザッカーバーグヴァネッサ・ローザGOAPWACULVanessa A RosaAdobe MAX 2021陶芸自動翻訳Play.ht音声AIAIライティングLiDAROmniverse AvatarAIのべりすとPolycamFPSQuillBotdeforumマルコフ決定過程NVIDIA MegatronCopysmith動画生成AINVIDIA MerlinJasperハーベストNVIDIA MetropolisForGamesパラメータ設計テニスゲームマーケットバランス調整岡野翔太協調フィルタリング郡山喜彦人狼知能テキサス大学ジェフリー・ヒントンGoogle I/O 2023AlphaDogfight TrialsAI Messenger VoicebotGoogle I/OエージェントシミュレーションOpenAI Codex武蔵野美術大学StarCraft IIHyperStyleMax CooperBingAIFuture of Life InstituteRendering with StyleIntelDisney類家利直FireflyLAIKADisneyリサーチヴィトゲンシュタインPhotoshopRotomationGauGAN論理哲学論考LightroomGauGAN2京都芸術大学Canvaドラゴンクエストライバルズ画像言語表現モデルChatGPT4不確定ゲームSIGGRAPH ASIA 2021PromptBaseBOOTHDota 2モンテカルロ木探索ディズニーリサーチpixivFANBOXMitsuba2バンダイナムコネクサス虎の穴ソーシャルゲームEmbeddingワイツマン科学研究所ユーザーレビューFantiaGTC2020CG衣装mimicとらのあなNVIDIA MAXINEVRファッションBaidu集英社淡路滋ビデオ会議ArtflowERNIE-ViLG少年ジャンプ+グリムノーツEponym古文書ComicCopilotゴティエ・ボエダ音声クローニング凸版印刷コミコパGautier Boeda階層的クラスタリングGopherAI-OCRゲームマスター画像判定Inowrld AIJuliusSIE鑑定ラベル付けMODTPRGOxia Palus大澤博隆Ghostwriterバーチャル・ヒューマン・エージェントtoio SDK for UnityArt RecognitionSFプロトタイピングSkyrimクーガー田中章愛実況パワフルサッカースカイリム石井敦銭起揚NHC 2021桃太郎電鉄RPGツクールMZ茂谷保伯池田利夫桃鉄ChatGPT_APIMZGDMC新刊案内パワサカダンジョンズ&ドラゴンズマーベル・シネマティック・ユニバースコナミデジタルエンタテインメントOracle RPG成沢理恵MITメディアラボMCU岩倉宏介深津貴之アベンジャーズPPOxVASynthマジック・リープDigital DomainMachine Learning Project CanvasLaser-NVMagendaMasquerade2.0国立情報学研究所TencentノンファンジブルトークンDDSPフェイシャルキャプチャー石川冬樹MERFサッカーモリカトロン開発者インタビュースパコンAlibaba里井大輝Kaggle宮本茂則スーパーコンピュータVQRFバスケットボール山田暉松岡 聡nvdiffrecAssassin’s Creed OriginsAI会話ジェネレーターTSUBAME 1.0NeRFMeshingSea of ThievesTSUBAME 2.0LERFGEMS COMPANYmonoAI technologyLSTMABCIマスタリングモリカトロンAIソリューション富岳TikTok初音ミクOculusコード生成AISociety 5.0リアム・ギャラガー転移学習テストAlphaCode夏の電脳甲子園グライムスBaldur's Gate 3Codeforces座談会BoomyCandy Crush Saga自己増強型AItext-to-imageジョン・レジェンドSIGGRAPH ASIA 2020COLMAPtext-to-3Dザ・ウィークエンドADOPNVIDIA GET3DドレイクデバッギングBigGANGANverse3DMaterialGANRNNグランツーリスモSPORTAI絵師ReBeLグランツーリスモ・ソフィーUGCGTソフィーPGCVolvoFIAグランツーリスモチャンピオンシップNovelAIRival PrakDGX A100NovelAI DiffusionVTuberユービーアイソフトWebcam VTuberモーションデータ星新一賞北尾まどかHALOポーズ推定将棋メタルギアソリッドVフォートナイトメッシュ生成FSMメルセデス・ベンツRobloxMagic Leapナップサック問題Live NationEpyllion汎用言語モデルWeb3.0マシュー・ボールAIOpsムーアの法則SpotifyスマートコントラクトReplica StudioamuseChitrakarQosmoAdobe MAX 2022巡回セールスマン問題Adobe MAXジョルダン曲線メディアAdobe Research政治Galacticaクラウドゲーミングがんばれ森川君2号和田洋一リアリティ番組映像解析Stadiaジョンソン裕子セキュリティMILEsNightCafe東芝デジタルソリューションズインタラクティブ・ストリーミングLuis RuizSATLYS 映像解析AIインタラクティブ・メディアポケモン3DスキャンPFN 3D Scanシーマン人工知能研究所東京工業大学Ludo博報堂Preferred NetworksラップPFN 4D ScanSIGGRAPH 2019ArtEmisZ世代DreamUpAIラッパーシステムDeviantArtWaifu DiffusionGROVERプラスリンクス ~キミと繋がる想い~元素法典FAIRSTCNovel AIチート検出Style Transfer ConversationOpen AIオンラインカジノRCPアップルRealFlowRinna Character PlatformiPhoneCALADeep FluidsSoul Machines柿沼太一MeInGameAmeliaELSIAIGraphブレイン・コンピュータ・インタフェースバーチャルキャラクターBCIGateboxアフォーダンスLearning from VideoANIMAKPaLM-SayCan予期知能逢妻ヒカリセコムGitHub Copilotユクスキュルバーチャル警備システムCode as Policiesカント損保ジャパンCaP上原利之ドラゴンクエストエージェントアーキテクチャアッパーグラウンドコリジョンチェックPAIROCTOPATH TRAVELER西木康智OCTOPATH TRAVELER 大陸の覇者山口情報芸術センター[YCAM]アルスエレクトロニカ2019品質保証YCAMStyleRigAutodeskアンラーニング・ランゲージ逆転オセロニアBentley Systemsカイル・マクドナルドワールドシミュレーターローレン・リー・マッカーシー奥村エルネスト純いただきストリートH100鎖国[Walled Garden]プロジェクト齋藤精一大森田不可止COBOLSIGGRAPH ASIA 2022高橋智隆DGX H100VToonifyロボユニザナックDGX SuperPODControlVAE泉幸典仁井谷正充クラウドコンピューティング変分オートエンコーダーロボコレ2019Instant NeRFフォトグラメトリartonomous回帰型ニューラルネットワークbitGANsDeepJoinぎゅわんぶらあ自己中心派Azure Machine LearningAzure OpenAI Service意思決定モデル脱出ゲームDeepLHybrid Reward Architectureコミュニティ管理DeepL WriteウロチョロスSuper PhoenixSNSProject Malmoオンラインゲーム気候変動Project PaidiaシンギュラリティProject Lookoutマックス・プランク気象研究所レイ・カーツワイルWatch Forビョルン・スティーブンスヴァーナー・ヴィンジ気象モデルRunway ResearchLEFT ALIVE気象シミュレーションMake-A-Video長谷川誠ジミ・ヘンドリックス環境問題PhenakiBaby Xカート・コバーンエコロジーDreamixロバート・ダウニー・Jr.エイミー・ワインハウスSDGsText-to-ImageモデルYouTubeダフト・パンクメモリスタ音声生成AIGlenn MarshallScenarioThe Age of A.I.Story2Hallucination音声変換LatitudeレコメンデーションJukeboxAIピカソVeap JapanAI素材.comEAPneoAISIFT福井千春DreamIconDCGAN医療mignMOBADANNCEメンタルケアstudiffuse人事ハーバード大学Edgar HandyAndreessen Horowitz研修デューク大学AIQVE ONEQA Tech Nightmynet.aiローグライクゲーム松木晋祐東京理科大学下田純也人工音声NeurIPS 2021産業技術総合研究所桑野範久リザバーコンピューティングプレイ動画ヒップホップ対話型AIモデル詩ソニーマーケティングControlNetサイレント映画もじぱnoteNBA環境音暗号通貨note AIアシスタントFUZZLEKetchupAlterationAI News粒子群最適化法Art Selfie進化差分法オープンワールドArt Transfer群知能下川大樹AIFAPet Portraitsウィル・ライト高津芳希P2EBlob Opera大石真史クリムトBEiTStyleGAN-NADA世界モデルDETRゲームエンジンDreamerV3SporeUnreal Engineクリティックネットワークデノイズ南カリフォルニア大学Unity for Industryアクターネットワーク画像処理DMLabSentropyGLIDEControl SuiteCPUDiscordAvatarCLIPAtari 100kSynthetic DataAtari 200MCALMYann LeCunプログラミングサム・アルトマン鈴木雅大ソースコード生成コンセプトアートGMAIシチズンデベロッパーSonanticColie WertzGitHubCohereリドリー・スコットウィザードリィMCN-AI連携モデルマジック:ザ・ギャザリング絵コンテUrzas.aiストーリーボード介護大阪大学西川善司並木幸介KikiBlenderサムライスピリッツ森寅嘉Zoetic AIゼビウスSIGGRAPH 2021ペットGPT-4ストリートファイター半導体Digital Dream LabsPaLM APITopaz Video Enhance AICozmoMakerSuiteDLSSタカラトミーSkeb山野辺一記NetEaseLOVOTDreambooth-Stable-Diffusion大里飛鳥DynamixyzMOFLINゲーム背景RomiGoogle EarthU-NetミクシィGEPPETTO AI13フェイズ構造ユニロボットStable Diffusion web UIADVユニボPoint-EXLandGatoアパレルAGIAI model手塚眞DEATH STRANDINGマルチモーダルAI ModelsEric Johnson汎用強化学習AIZMO.AIデザインMOBBY’SOculus Questコジマプロダクションロンドン芸術大学モビーディック生体情報デシマエンジンGoogle BrainダイビングインディーゲームSound Controlアウトドア写真高橋ミレイSYNTH SUPERAIスキャニング照明Maxim PeterKarl Sims自動採寸Joshua RomoffArtnome3DLOOKハイパースケープICONATESizer山崎陽斗深層強化学習ワコール立木創太松原仁スニーカー浜中雅俊UNSTREETミライ小町武田英明Newelseテスラ福井健策CheckGoodsGameGAN二次流通パックマンTesla BotNEDO中古市場Tesla AI DayWikipediaDupe Killerソサエティ5.0Sphere偽ブランドSIGGRAPH 2020バズグラフXaver 1000配信ニュースタンテキ養蜂東芝Beewiseソニー・ピクチャーズ アニメーションDIB-R倉田宜典フィンテック投資Fosters+Partners韻律射影MILIZEZaha Hadid Architects広告韻律転移三菱UFJ信託銀行
CGへの扉 Vol.46:AIを活用したCG論文紹介 #SIGGRAPHAsia2022 より
CGの学会SIGGRAPHのアジア版 SIGGRAPH ASIA 2022 が韓国大邱(テグ)で開催
SIGGRAPHはコンピュータグラフィックスとインタラクティブ技術に関する学会・展示会であり、毎年7月から8月にかけて北米で開催されています。それにひき続き、毎年年末に開催されるアジア版の SIGGRAPH ASIAは、世界的にみても新型コロナウイルスが落ち着いたとはまだ言えない状況の中、2022年12月6日から12月9日の4日間、渡航や入国が緩和された韓国大邱(テグ)のカンファレンス会場EXCOとオンライン配信によるハイブリッド開催で実施されました。
オンラインによる配信は、会期終了後3か月間、2023年3月10日まで配信が続きます。今年のテーマは “COLORFUL WORLD” 。直訳すると「色彩世界」ですが、そこにはさまざまな色、さまざまな先端的研究、さまざまな作品といった「多様性を受け入れる世界」という意味合いがふくまれています。
【昨年の SIGGRAPH ASIA 2021 紹介記事】注目論文よりCGの祭典 #SIGGRAPHAsia2021 を振り返る
今年のCG論文の傾向は、やはり「人工知能」活用が注目されており、機械学習のテクノロジーを活用し従来の研究の精度を向上させたり、結果を生成するまでのスピードを向上させたり、スマートフォンなどの非力なコンピューティングパワーでも良好な結果が得られる工夫など、さまざまなアプローチで人工知能が活用されていました。
論文発表ダイジェスト:SIGGRAPH Asia 2022 – Technical Papers Trailer(4分半)
全論文のリンク集は公式のものもありますが、有志による情報が大変充実しており無料で見られます。
SIGGRAPH Asia 2022 papers on the web(Ke-Sen Huang氏らがまとめたもの)
本記事では、SIGGRAPH ASIA 2022 の論文発表より、人工知能によってCG研究が促進されたもの、人工知能がそのCG研究の根幹をなすもの、新しい取り組みに人工知能を活用しているCG研究などをご紹介します。
SIGGRAPH ASIA 2022 で発表された注目のCG研究論文
今年は投稿と論文集からの採択も合わせて合計150本以上の論文が発表されました。CG研究においても、コロナ禍での工夫が見られ、遠隔地同士でツールを活用した共同研究や、コンピューティング環境としてクラウドを最大限に活用した研究など、さまざまな工夫がなされていることがうかがえました。
(01)VToonify : Controllable High-Resolution Portrait Video Style Transfer
論文:https://arxiv.org/abs/2209.11224
プロジェクトページ:https://www.mmlab-ntu.com/project/vtoonify/
サンプルコード:https://github.com/williamyang1991/VToonify
VToonify は自然な動きを持った高解像度の人物動画のスタイル変換を行う仕組みです。主な目的はトゥーン化と呼ばれるアニメ風の人物像に変換することですが、特徴としてその変換モデルを自由に差し替えられる点にあります。アニメ風や水彩画風など、StyleGANを用いたスタイル変換の研究において多様なものがすでに存在します。そういったStyleGANベースのスタイル変換のアルゴリズム部分をVToonifyに組み込むことで、求めるスタイル変換を動画でできるようになるのです。
(02)ControlVAE: Model-Based Learning of Generative Controllers for Physics-Based Characters
論文:https://arxiv.org/abs/2210.06063
プロジェクトページ:https://heyuanyao-pku.github.io/Control-VAE/
サンプルコード:https://github.com/heyuanYao-pku/Control-VAE(準備中)
3DCG表現で、人間型キャラクターのリアルな動きを表現しようとすると、モーションキャプチャと呼ばれる実際の人間、それも表現力豊かな俳優やモーション専用のアクターが注意深く何度も演技した動きをデータとして取得し、それらのデータを目的に応じて整形して用いるのが現在は一般的です。ただしこういった方法は、動きの収録に高額な施設や機材、膨大な時間がかかるとともに、一連の収録後に欲しい動きが必要になった場合、再収録の手間やコストが生じます。
ControlVAE では、変分オートエンコーダー(Variational AutoEncoder) の仕組みを用い、訓練データを元にその特徴をとらえて訓練データに似たデータを生成することができます。つまりその都度モーション収録するのではなくキャラクタの動きをモデル化することでさまざまな動きを生成させることができるのです。自動生成した物理的法則に沿った動きを限りなく生身の人間の動きに近づけ、応用や修正が容易にできるようにするアプローチです。
(03)Learning-based Inverse Rendering of Complex Indoor Scenes with Differentiable Monte Carlo Raytracing
動画:https://jingsenzhu.github.io/invrend/#video
論文:https://arxiv.org/abs/2211.03017
プロジェクトページ:https://jingsenzhu.github.io/invrend/
サンプルコード:https://github.com/jingsenzhu/IndoorInverseRendering
通常であれば、現実世界の照明や物質の色合いに近づけた表現ができるよう工夫するのがCGレンダリング技術ですが、本研究では、現実世界の屋内の写真を入力情報とし、物質表面の反射率、形状、空間的に変化する照明などを自動的に推測する学習ベースの逆レンダリングの手法をとっています。それにより画面中の写真の中に仮想的な物体を追加したり、写真中の物質の素材感を編集したりと、3DCGのように現実世界の写真を扱えるようになるというものです。
(04)Learning Reconstructability for Drone Aerial Path Planning
動画:https://vcc.tech/research/2022/DroneRecon(ページ下部)
論文:https://arxiv.org/abs/2209.10174
プロジェクトページ:https://vcc.tech/research/2022/DroneRecon
遺跡などの人間が侵入することが難しい建築物や土地の3D形状データ取得のためには、ドローンを飛ばしてその撮影データから3D形状を再現するフォトグラメトリという手法が一般的に使われています。巨大建造物のフォトグラメトリでは、あらゆる部分を満遍なく、それも多数の重複をもった画像や動画を収録しなければいけません。
本研究では、撮影箇所、撮影方向を最小限にするため、3D形状を再現するにはどの角度からどの部分を撮影する必要があるのかを逆に解析することで、必要最小限の撮影で全体の3D形状を再現しようというアプローチです。
(05)Learning-Based Bending Stiffness Parameter Estimation by a Drape Tester
論文:https://wanghmin.github.io/Feng-2022-LBB/Feng-2022-LBB.pdf
プロジェクトページ:https://wanghmin.github.io/publications.html
サンプルコード:https://github.com/DrapeTester/ClothDrapeTester
現実世界の布地は、表面の質感といい、その物質としての変形の度合いといい、とても複雑な特性を有しています。そういった布地を3DCGでリアルに表現しようとした際、従来用いられてきた物理シミュレーションだけでは膨大な計算時間がかかり、膨大なコンピューティングパワーが消費される割には、表現に不自然さが残ってしまう場合もあります。本研究は剛性パラメータを推定する Recurrent Neural Network(RNN:回帰型ニューラルネットワーク)を用いることで、表現力が高く、かつ物理的にも正しい結果を素早く導き出すことができるアプローチです。
(06)Learning to Generate 3D Shapes from a Single Example
論文:https://arxiv.org/abs/2208.02946
プロジェクトページ:http://www.cs.columbia.edu/cg/SingleShapeGen/
サンプルコード:https://github.com/ChrisWu1997/SingleShapeGen
通常、三次元モデルは複数のシンプルなオブジェクトの組み合わせによって、複雑な形状を表現しています。本研究では、複雑な三次元物体を、複雑なひとつのデータとして扱い、そこから大きさや形状のスムーズさを変更したオブジェクトをランダムに生成するアプローチをとっています。この研究はCG制作の現場で求められている、大量の学習データを必要とせず出力データにさまざまな演出が可能な方法を平易に利用できる手段であり、今後の可能性が期待される分野のひとつです。
(07)DeepJoin: Learning a Joint Occupancy, Signed Distance, and Normal Field Function for Shape Repair
プロジェクトページ:https://nikwl.github.io/publication/2022-deepjoin/
サンプルコード:https://github.com/Terascale-All-sensing-Research-Studio/DeepJoin/
DeepJoinは3D形状の欠けている部分を、残された部分を学習データとして推測し、再現するための手法です。従来こういったニーズはあり、さまざまな研究は存在したが、本研究ではニューラルネットワークを活用することで解像度の高い形状を再現することができるようになっている。さらに従来手法と比べ、元の部分と再現部分の接合が滑らかであり、割れた陶器を金で繋ぎ新しい価値を生み出す古典的手法である「金継ぎ」のような、ある意味「デジタル金継ぎ」ともいえる人工知能活用例です。
(08)Learning to Relight Portrait Images via a Virtual Light Stage and Synthetic-to-Real Adaptation
論文:https://arxiv.org/abs/2209.10510
プロジェクトページ:https://deepimagination.cc/Lumos/
サンプルコード:http://imaginaire.cc/Lumos/
人物写真において、顔に当たっている日光や照明の方向や状態、色合いなどを調整することを「再照明」と呼んでおり、スマートフォンにおける写真機能として広くニーズが存在する研究分野のひとつです。従来型の再照明手法は、ライトステージと呼ばれる360度全周にLED照明とカメラを配置した高価な機材で収録した学習データをもとに再照明を実現していました。本研究では、ライトステージのデータ無しで、同等の成果が得られるよう工夫されました。また、再照明時にメガネの反射の眩しさを抑える仕組みなど、実利用における配慮がなされています。
(09)Neural Brushstroke Engine: Learning a Latent Style Space of Interactive Drawing Tools
論文:https://drive.google.com/file/d/1RNFgMXEp85MGlV6w99JC_MBBg45TFgzI/view
プロジェクトページ:https://nv-tlabs.github.io/brushstroke_engine/
サンプルコード:https://github.com/nv-tlabs/brushstroke_engine
Neural Brushstroke Engine (NeuBE) と命名された本研究は、ユーザーが描いた線画そのものを模倣するGAN(敵対的生成ネットワーク)モデルを実現したものです。つまり有名な画家風のスタイルを真似た画像を人工知能で生成するのではなく、利用者の描くストロークや描き方の癖、雰囲気などを模倣し、まるで自分が描いたようなスタイルの画像を生成させることができます。もちろんすでに大量の画像を描いたものを学習データとして画像生成用人工知能を再学習させることはできますが、本研究ではインタラクティブに学習内容や結果がアップデートしていくことが特徴です。
(10)NeuralMarker: A Framework for Learning General Marker Correspondence
論文:https://arxiv.org/abs/2209.08896
プロジェクトページ:https://drinkingcoder.github.io/publication/neuralmarker/
サンプルコード:https://github.com/drinkingcoder/NeuralMarker
NeuralMarkerはAR表現やCG合成において必須であるマーカーと呼ばれる映像中の目印を、個別に用意すること無しに、画面中に映っているオブジェクトそのものをマーカーとして形状の変形や移動を追いかけることができる仕組みです。従来手法でも画像の中から特徴点を選出し、2次元の形状の変化しないオブジェクトをマーカーとして利用することが可能でした。
本研究ではニューラルネットワークを活用することで、曲面的に変化する形状においても、その変化をとらえることができます。AR空間でのCG表現や、特殊なビデオ編集など、さまざまな応用が期待される研究です。
論文だけじゃない。CGアートの世界
SIGGRAPHの本分は学会であり、論文発表やCG映像の発表が中心ですが、CGやテクノロジーを活用したアート作品も展示発表の場が設けられています。いくつか興味深い作品を紹介しましょう。
Inner self drawing machine
ジェンダーについて再認識するため、自分の顔を映すと、性別を切り替えてドローイングしてくれる装置。(作家:Qing Zhang, Fan Xie, Yifei Huang, Yun Suen Pai, George Chernyshov, Jing Huang, Xiongqi Wang, Jamie A. Ward, Kai Kunze)
Digital Being
世の中のあらゆるものがデジタル化していることを示す、機械装置に憑依した生命を表現したNFTクリーチャー。(作家:Taezoo Park)
Keep Smiling
将来実際に起こるかもしれないAIによる面談を皮肉った作品。面談者から笑顔が消えると、即解雇される。感情検出アルゴリズムがいかに脆弱で曖昧なものであるのかを示唆した作品。(作家:Varvara Guljajeva, Mar Canet Sola)
Emerging Media Art Perfomance of Eine Kleine Machtmusik
音楽家の音声信号だけでなく、観客の発するノイズも収集・分析・反映し、映像化したものを見ながら楽しむコンサート。(作家:Kyungho Lee, Yousang Kwon, Luce String Ensemble)
***
今回紹介したSIGGRAPH ASIA 2022のアーカイブ配信は会期終了後も3か月間続きます。来年以降のSIGGRAPHも、会場とオンライン配信によるハイブリッド開催の形式が続くと思われます。新型コロナウイルスによって世界は大きく変わってしまいましたが、それによってより一層 CGやVRの価値や役目が重要視されていることが実感されます。今後のSIGGRAPH開催予定は次のとおりです。
SIGGRAPH 2023 米国 ロサンゼルス 2023/8/6〜10 50周年記念
SIGGRAPH ASIA 2023 オーストラリア シドニー 2023/12/12〜15
SIGGRAPH 2024(未定)
SIGGRAPH ASIA 2024(乞うご期待!)
本連載の今後の予定:「CGへの扉」では、単なるAIの話題とは少し異なり、CG/VFX, アートの文脈から話題を切り取り紹介していきます。映像制作の現場におけるAI活用や、AIで価値が高まった先進的なツール、これからの可能性を感じさせるような話題、テクノロジーの話題にご期待ください。何か取り上げて欲しいテーマやご希望などがございましたら、ぜひ編集部までお知らせください。
Vol.45:大規模言語モデルChatGPTは仲間?ライバル?
Vol.44:AdobeMAX2022開催。SneaksよりAI活用の方向性を知る
Vol.42:現代の呪文promptが生み出すAIとの新しい関係性
Vol.41:AIが促進させるCG研究。SIGGRAPH2022論文より
Vol.37:NVIDIA GTC 2022 レポート/アートとAIの視点で
Vol.36:創るためのAI〜AIと人間の創造性の未来:徳井直生氏講演レポート
Vol.35:マーベル・シネマティック・ユニバースを支える機械学習
Contributor:安藤幸央