モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。
- TAG LIST
- CGCGへの扉安藤幸央機械学習月刊エンタメAIニュースディープラーニング河合律子生成AI吉本幸記OpenAIGANNVIDIA音楽Google三宅陽一郎強化学習ニューラルネットワークStable DiffusionChatGPTグーグル森川幸人シナリオDeepMindQA人工知能学会GPT-3自然言語処理マイクロソフト大規模言語モデルFacebook大内孝子映画著作権AIと倫理キャラクターAI敵対的生成ネットワークルールベースアート倫理SIGGRAPHモリカトロンゲームプレイAIスクウェア・エニックスモリカトロンAIラボインタビュー画像生成LLMNPCNFTプロシージャルMidjourneyデバッグMinecraftDALL-E2StyleGAN遺伝的アルゴリズム画像生成AIロボット自動生成VFXAdobeテストプレイメタAIアニメーションテキスト画像生成深層学習ファッションCEDEC2019音楽生成AIディープフェイクデジタルツインメタバースVRボードゲームDALL-ECLIPビヘイビア・ツリーマンガCEDEC2021CEDEC2020ゲームAI不完全情報ゲームナビゲーションAI小説畳み込みニューラルネットワークGDC 2021JSAI2022作曲MicrosoftNVIDIA OmniverseGDC 2019マルチエージェントCEDEC2022MetaマインクラフトAIアート3DCGStability AIメタデジタルヒューマン懐ゲーから辿るゲームAI技術史toioジェネレーティブAIスポーツエージェントプロンプト栗原聡手塚治虫CNNNeRFDALL-E 3バーチャルヒューマンBERTロボティクスUnityOmniverseJSAI2023鴫原盛之HTN階層型タスクネットワークソニーGPT-4マルチモーダル汎用人工知能JSAI2020GTC20233DTensorFlowインタビューブロックチェーンイベントレポート対話型エージェントAmazonDQN水野勇太アバターUbisoftGenvid TechnologiesガイスターStyleGAN2ARELSIGTC2022教育SIGGRAPH ASIANetflixJSAI2021はこだて未来大学Bard研究シムピープルMCS-AI動的連携モデルRed RamモーションキャプチャーTEZUKA2020CEDEC2023テキスト生成インディーゲームElectronic Arts音声合成マーケティングメタデータGDC SummerStable Diffusion XLCMMicrosoft Azureアストロノーカキャリア模倣学習動画生成AIeスポーツスタンフォード大学アーケードゲームテニスサイバーエージェントトレーディングカード音声認識メディアアート類家利直eSportsBLUE PROTOCOLシーマンaibo合成音声チャットボットブラック・ジャックEpic GamesAWS徳井直生クラウド斎藤由多加AlphaZeroTransformerGPT-2rinnaAIりんなカメラ環世界中島秀之PaLM哲学ベリサーブPlayable!GPT-3.5ハリウッド理化学研究所Gen-1SFテキスト画像生成AIデータマイニング東京大学現代アートDARPAドローンシムシティゲームエンジンImagenZorkバイアスマーダーミステリーASBSぱいどんアドベンチャーゲームAI美空ひばり手塚眞バンダイナムコ研究所スパーシャルAINEDOFSM-DNNLEFT 4 DEADイーロン・マスク通しプレイ論文OpenAI Five本間翔太馬淵浩希Cygames森山和道Audio2Faceピクサープラチナエッグイーサリアム効果音ボエダ・ゴティエビッグデータ中嶋謙互Amadeus Codeデータ分析MILENVIDIA ACEナラティブNVIDIA RivaOmniverse ReplicatorWCCFレコメンドシステムNVIDIA DRIVE SimWORLD CLUB Champion FootballNVIDIA Isaac Simセガ柏田知大軍事田邊雅彦トレカMax CooperGPTDisneyFireflyPyTorchChatGPT4眞鍋和子バンダイナムコスタジオAI Frog Interactive新清士大澤博隆SFプロトタイピング齊藤陽介お知らせMagic Leap OneTencentモリカトロン開発者インタビュー宮本茂則バスケットボールGeminiTikToktext-to-imageサルでもわかる人工知能text-to-3DVAEDreamFusionTEZUKA2023リップシンキングRNNUbisoft La Forge自動運転車ワークショップ知識表現ウォッチドッグス レギオンVTuberIGDA立教大学秋期GTC2022市場分析フォートナイトどうぶつしょうぎRobloxジェイ・コウガミ音楽ストリーミングMITAIロボ「迷キュー」に挑戦野々下裕子Adobe MAXマシンラーニング村井源5GMuZeroRival Peakpixivオムロン サイニックエックスGPTs電気通信大学対話エンジン稲葉通将ポケモン3Dスキャン橋本敦史リトル・コンピュータ・ピープルCodexシーマン人工知能研究所コンピューティショナル・フォトグラフィーPreferred Networksゴブレット・ゴブラーズ絵画3D Gaussian SplattingMicrosoft DesignerアップルイラストシミュレーションSoul Machines柿沼太一完全情報ゲーム坂本洋典釜屋憲彦GitHub CopilotウェイポイントLLaMAパス検索対談藤澤仁生物学GTC 2022Apple Vision Pro画像認識SiemensストライキStyleCLIPDeNA長谷洋平クラウドコンピューティングmasumi toyotaIBM宮路洋一OpenSeaGDC 2022SNSTextWorldEarth-2BingMagentaYouTube音声生成AIELYZA PencilScenarioSIGGRAPH2023松尾豊AIピカソGTC2021AI素材.comCycleGANテンセントAndreessen HorowitzAIQVE ONENetHackキャラクターモーションControlNet音源分離NBAフェイクニュースユニバーサルミュージックRPG法律Web3SIGGRAPH 2022世界モデルレベルデザインDreamerV3AIボイスアクターUnreal Engine南カリフォルニア大学NVIDIA CanvasGPUALife人工生命オルタナティヴ・マシンサウンドスケープLaMDATRPGマジック:ザ・ギャザリングAI Dungeonゲーム背景AGI不気味の谷ナビゲーションメッシュ高橋ミレイ深層強化学習松原仁松井俊浩武田英明ELYZAフルコトELYZA DIGEST建築広告西成活裕ハイブリッドアーキテクチャApex LegendsELIZA群衆マネジメントライブポートレイトNinjaコンピュータRPGライブビジネスWonder StudioAdobe Max 2023アップルタウン物語新型コロナ土木MindAgentKELDIC周済涛BIMBing Chatメロディ言語清田陽司インフラBing Image CreatorゲームTENTUPLAYサイバネティックスMARVEL Future FightAstro人工知能史Amazon BedrockAssistant with BardタイムラプスEgo4DAI哲学マップThe Arcadeバスキア星新一X.AISearch Generative Experience日経イノベーション・ラボStyleGAN-XLX Corp.Dynalang敵対的強化学習StyleGAN3TwitterVLE-CE階層型強化学習GOSU Data LabGANimatorXホールディングスWANNGOSU Voice AssistantVoLux-GANMagiAI Act竹内将SenpAI.GGProjected GANEUMobalyticsSelf-Distilled StyleGANSDXLArs ElectronicaニューラルレンダリングRTFKTAI規制岡島学AWS SagemakerPLATONIKE欧州委員会映像セリア・ホデント形態素解析frame.ioClone X欧州議会UXAWS LambdaFoodly村上隆欧州理事会誤字検出MusicLM認知科学中川友紀子Digital MarkAudioLMゲームデザインSentencePieceアールティSnapchatMusicCapsLUMINOUS ENGINEクリエイターコミュニティAudioCraftLuminous ProductionsBlenderBot 3バーチャルペットパターン・ランゲージ竹村也哉Meta AINVIDIA NeMo ServiceMubertちょまどマーク・ザッカーバーグヴァネッサ・ローザMubert RenderGOAPWACULVanessa A RosaGen-2Adobe MAX 2021陶芸Runway AI Film Festival自動翻訳Play.htPreViz音声AIAIライティングLiDARCharacter-LLMOmniverse AvatarAIのべりすとPolycam復旦大学FPSQuillBotdeforumChat-Haruhi-Suzumiyaマルコフ決定過程NVIDIA MegatronCopysmith涼宮ハルヒNVIDIA MerlinJasperハーベストEmu VideoNVIDIA MetropolisForGamesNianticパラメータ設計ゲームマーケットペリドットバランス調整岡野翔太Dream Track協調フィルタリング郡山喜彦Music AI Tools人狼知能テキサス大学ジェフリー・ヒントンLyriaGoogle I/O 2023Yahoo!知恵袋AlphaDogfight TrialsAI Messenger VoicebotGoogle I/OインタラクティブプロンプトAIエージェントシミュレーションOpenAI Codex武蔵野美術大学慶應義塾大学StarCraft IIHyperStyleBingAI石渡正人Future of Life InstituteRendering with Style手塚プロダクションIntel林海象LAIKADisneyリサーチヴィトゲンシュタインPhotoshop古川善規RotomationGauGAN論理哲学論考Lightroom大規模再構成モデルGauGAN2京都芸術大学CanvaLRMドラゴンクエストライバルズ画像言語表現モデルObjaverse不確定ゲームSIGGRAPH ASIA 2021PromptBaseBOOTHMVImgNetDota 2モンテカルロ木探索ディズニーリサーチpixivFANBOXOne-2-3-45Mitsuba2バンダイナムコネクサス虎の穴3DガウシアンスプラッティングソーシャルゲームEmbeddingワイツマン科学研究所ユーザーレビューFantiaワンショット3D生成技術GTC2020CG衣装mimicとらのあな高橋力斗NVIDIA MAXINEVRファッションBaidu集英社FGDC淡路滋ビデオ会議ArtflowERNIE-ViLG少年ジャンプ+Future Game Development ConferenceグリムノーツEponym古文書ComicCopilot佐々木瞬ゴティエ・ボエダ音声クローニング凸版印刷コミコパヒストリアGautier Boeda階層的クラスタリングGopherAI-OCRゲームマスター画像判定Inowrld AIJuliusSIE鑑定ラベル付けMODAniqueTPRGOxia PalusGhostwriter中村太一バーチャル・ヒューマン・エージェントtoio SDK for UnityArt RecognitionSkyrimエグゼリオクーガー田中章愛実況パワフルサッカースカイリムCopilot石井敦銭起揚NHC 2021桃太郎電鉄RPGツクールMZComfyUI茂谷保伯池田利夫桃鉄ChatGPT_APIMZserial experiments lainGDMC新刊案内パワサカダンジョンズ&ドラゴンズAI lainマーベル・シネマティック・ユニバースコナミデジタルエンタテインメントOracle RPGPCG成沢理恵MITメディアラボMCU岩倉宏介深津貴之PCGRLアベンジャーズPPOxVASynthDungeons&Dragonsマジック・リープDigital DomainMachine Learning Project CanvasLaser-NVビートルズMagendaMasquerade2.0国立情報学研究所ザ・ビートルズ: Get BackノンファンジブルトークンDDSPフェイシャルキャプチャー石川冬樹MERFDemucsサッカースパコンAlibaba音楽編集ソフト里井大輝KaggleスーパーコンピュータVQRFAdobe Audition山田暉松岡 聡nvdiffreciZotopeAssassin’s Creed OriginsAI会話ジェネレーターTSUBAME 1.0NeRFMeshingRX10Sea of ThievesTSUBAME 2.0LERFMoisesGEMS COMPANYmonoAI technologyLSTMABCIマスタリングモリカトロンAIソリューション富岳レベルファイブ初音ミクOculusコード生成AISociety 5.0リアム・ギャラガーSuno AI転移学習テストAlphaCode夏の電脳甲子園グライムスKaKa CreationBaldur's Gate 3Codeforces座談会BoomyVOICEVOXCandy Crush Saga自己増強型AIジョン・レジェンドGenie AISIGGRAPH ASIA 2020COLMAPザ・ウィークエンドSIGGRAPH Asia 2023ADOPNVIDIA GET3DドレイクC·ASEデバッギングBigGANGANverse3DFLAREMaterialGANダンスグランツーリスモSPORTAI絵師エッジワークスMagicAnimateReBeLグランツーリスモ・ソフィーUGC日本音楽作家団体協議会Animate AnyoneGTソフィーPGCFCAインテリジェントコンピュータ研究所VolvoFIAグランツーリスモチャンピオンシップVoiceboxアリババNovelAIさくらインターネットDreaMovingRival PrakDGX A100NovelAI DiffusionVISCUITぷよぷよScratchユービーアイソフトWebcam VTuberモーションデータスクラッチ星新一賞大阪公立大学ビスケット北尾まどかHALOポーズ推定TCGプログラミング教育将棋メタルギアソリッドVメッシュ生成KLabFSMメルセデス・ベンツQRコードVALL-EMagic Leap囲碁Deepdub.aiナップサック問題Live NationEpyllionデンソーAUDIOGEN汎用言語モデルWeb3.0マシュー・ボールデンソーウェーブEvoke MusicAIOpsムーアの法則原昌宏AutoFoleySpotifyスマートコントラクト日本機械学会Colourlab.AiReplica Studioロボティクス・メカトロニクス講演会ディズニーamuseChitrakarQosmoAdobe MAX 2022トヨタ自動車Largo.ai巡回セールスマン問題かんばん方式Cinelyticジョルダン曲線メディアAdobe ResearchTaskade政治Galacticaプロット生成Pika.artクラウドゲーミングがんばれ森川君2号AI Filmmaking Assistant和田洋一リアリティ番組映像解析FastGANStadiaジョンソン裕子セキュリティ4コママンガAI ScreenwriterMILEsNightCafe東芝デジタルソリューションズ芥川賞インタラクティブ・ストリーミングLuis RuizSATLYS 映像解析AI文学インタラクティブ・メディア恋愛PFN 3D ScanElevenLabsタップル東京工業大学HeyGenAbema TVLudo博報堂After EffectsNECラップPFN 4D Scan絵本木村屋SIGGRAPH 2019ArtEmisZ世代DreamUp出版GPT StoreAIラッパーシステムDeviantArtAmmaar Reshi生成AIチェッカーWaifu DiffusionStoriesユーザーローカルGROVERプラスリンクス ~キミと繋がる想い~元素法典StoryBird九段理江FAIRSTCNovel AIVersed東京都同情塔チート検出Style Transfer ConversationOpen AIProlificDreamerオンラインカジノRCPUnity Sentis4Dオブジェクト生成モデルRealFlowRinna Character PlatformUnity MuseAlign Your GaussiansiPhoneCALACaleb WardAYGDeep Fluids宮田龍MAV3DMeInGameAmelia清河幸子ファーウェイAIGraphブレイン・コンピュータ・インタフェースバーチャルキャラクター西中美和4D Gaussian SplattingBCIGateboxアフォーダンス安野貴博4D-GSLearning from VideoANIMAKPaLM-SayCan斧田小夜Glaze予期知能逢妻ヒカリ宮本道人WebGlazeセコムLLaMA 2NightShadeユクスキュルバーチャル警備システムCode as PoliciesSpawningカント損保ジャパンCaPHugging FaceHave I Been Trained?CM3leonFortnite上原利之Stable DoodleUnreal Editor For FortniteドラゴンクエストエージェントアーキテクチャアッパーグラウンドコリジョンチェックT2I-AdapterXRPAIROCTOPATH TRAVELERxAI西木康智VolumetricsOCTOPATH TRAVELER 大陸の覇者山口情報芸術センター[YCAM]AIワールドジェネレーターアルスエレクトロニカ2019品質保証YCAM日本マネジメント総合研究所Rosebud AI GamemakerStyleRigAutodeskアンラーニング・ランゲージVoyagerLayer逆転オセロニアBentley Systemsカイル・マクドナルドLily Hughes-RobinsonCharisma.aiワールドシミュレーターローレン・リー・マッカーシーColossal Cave AdventureGDC 2024奥村エルネスト純いただきストリートH100鎖国[Walled Garden]プロジェクトAdventureGPT調査齋藤精一大森田不可止COBOLSIGGRAPH ASIA 2022リリー・ヒューズ=ロビンソンMeta Quest高橋智隆DGX H100VToonifyBabyAGIIPロボユニザナックDGX SuperPODControlVAEGPT-3.5 Turbo泉幸典仁井谷正充変分オートエンコーダーカーリング強いAIロボコレ2019Instant NeRFフォトグラメトリウィンブルドン弱いAIartonomous回帰型ニューラルネットワークbitGANsDeepJoin戦術分析ぎゅわんぶらあ自己中心派Azure Machine LearningAzure OpenAI Serviceパフォーマンス測定Lumiere意思決定モデル脱出ゲームDeepLIoTUNetHybrid Reward Architectureコミュニティ管理DeepL WriteProFitXImageFXウロチョロスSuper PhoenixWatsonxMusicFXProject MalmoオンラインゲームAthleticaTextFX気候変動コーチングSoraProject Paidiaシンギュラリティ北見工業大学KeyframerProject Lookoutマックス・プランク気象研究所レイ・カーツワイル北見カーリングホールAppleWatch Forビョルン・スティーブンスヴァーナー・ヴィンジ画像解析Gemini 1.5気象モデルRunway ResearchじりつくんAI StudioLEFT ALIVE気象シミュレーションMake-A-VideoNTT SportictVertex AI長谷川誠ジミ・ヘンドリックス環境問題PhenakiAIカメラChat with RTXBaby Xカート・コバーンエコロジーDreamixSTADIUM TUBESlackロバート・ダウニー・Jr.エイミー・ワインハウスSDGsText-to-ImageモデルPixelllot S3Slack AIソフトバンクPokémon Battle Scopeダフト・パンクメモリスタAIスマートコーチポケットモンスターGlenn MarshallkanaeruThe Age of A.I.Story2Hallucination音声変換Latitude占いレコメンデーションJukeboxDreambooth行動ロジック生成AIVeap Japanヤン・ルカンConvaiEAPneoAIPerfusionNTTドコモSIFT福井千春DreamIconニューラル物理学EmemeDCGAN医療mign毛髪GenieMOBADANNCEメンタルケアstudiffuse荒牧英治汎用AIエージェント人事ハーバード大学Edgar Handy中ザワヒデキ研修デューク大学大屋雄裕QA Tech Night中川裕志mynet.aiローグライクゲーム松木晋祐Adreeseen Horowitz東京理科大学下田純也NVIDIA Avatar Cloud Engine人工音声NeurIPS 2021産業技術総合研究所桑野範久Replica StudiosリザバーコンピューティングSmart NPCsプレイ動画ヒップホップ対話型AIモデルRoblox Studio詩ソニーマーケティングPromethean AIサイレント映画もじぱnote環境音暗号通貨note AIアシスタントMusiioFUZZLEKetchupEndelAlterationAI News粒子群最適化法Art Selfie進化差分法オープンワールドArt TransferSonar群知能下川大樹AIFAPet PortraitsSonar+Dウィル・ライト高津芳希P2EBlob Opera大石真史クリムトDolby AtmosBEiTStyleGAN-NADASonar Music FestivalDETRライゾマティクスSporeクリティックネットワーク真鍋大度デノイズUnity for Industryアクターネットワーク花井裕也画像処理DMLabRitchie HawtinSentropyGLIDEControl SuiteErica SynthCPUDiscordAvatarCLIPAtari 100kUfuk Barış MutluSynthetic DataAtari 200MJapanese InstructBLIP AlphaCALMYann LeCun日本新聞協会プログラミングサム・アルトマン鈴木雅大AIいらすとやソースコード生成コンセプトアートAI PicassoGMAIシチズンデベロッパーSonanticColie WertzEmposyGitHubCohereリドリー・スコットAIタレントウィザードリィMCN-AI連携モデル絵コンテAIタレントエージェンシーUrzas.aiストーリーボードmodi.ai介護大阪大学BitSummit西川善司並木幸介KikiBlenderBitSummit Let’s Go!!サムライスピリッツ森寅嘉Zoetic AIゼビウスSIGGRAPH 2021ペットストリートファイター半導体Digital Dream LabsPaLM APIデジタルレプリカTopaz Video Enhance AICozmoMakerSuiteGOT7DLSSタカラトミーSkebsynthesia山野辺一記NetEaseLOVOTDreambooth-Stable-DiffusionHumanRF大里飛鳥DynamixyzMOFLINActors-HQRomiGoogle EarthSAG-AFTRAU-NetミクシィGEPPETTO AIWGA13フェイズ構造ユニロボットStable Diffusion web UIチャーリー・ブルッカーADVユニボPoint-EXLandGatoアパレル岡野原大輔AI model自己教師あり学習DEATH STRANDINGAI ModelsIn-Context Learning(ICL)Eric Johnson汎用強化学習AIZMO.AILoRAデザインMOBBY’SファインチューニングOculus Questコジマプロダクションロンドン芸術大学モビーディックグランツーリスモ生体情報デシマエンジンGoogle Brainダイビング量子コンピュータSound Controlアウトドアqubit写真SYNTH SUPERAIスキャニングIBM Quantum System 2照明Maxim PeterKarl Sims自動採寸北野宏明Joshua RomoffArtnome3DLOOKダリオ・ヒルハイパースケープICONATESizerジェン・スン・フアン山崎陽斗ワコールHuggingFace立木創太スニーカーStable Audio浜中雅俊UNSTREET宗教ミライ小町Newelse仏教テスラ福井健策CheckGoodsコカ・コーラGameGAN二次流通食品パックマンTesla Bot中古市場Coca‑Cola Y3000 Zero SugarTesla AI DayWikipediaDupe KillerCopilot Copyright Commitmentソサエティ5.0Sphere偽ブランドテラバースSIGGRAPH 2020バズグラフXaver 1000配信京都大学ニュースタンテキ養蜂立福寛東芝Beewiseソニー・ピクチャーズ アニメーション音声解析DIB-R倉田宜典フィンテック感情分析投資Fosters+Partners周 済涛韻律射影MILIZEZaha Hadid Architectsステートマシン韻律転移三菱UFJ信託銀行ディープニューラルネットワーク
CGへの扉 Vol.25:変幻自在の顔も実は人工知能
人間が認識する顔と人工知能が認識する顔
人間が乳幼児の頃、まず最初に認識し始めるのは人の顔です。まず生まれたばかりの頃は、ぼんやりと見える顔の輪郭や匂いや声を頼りに人を認識しています。ですから周りにいる人の髪型が変わったり、風邪で声が変わったりすると別人だと思われます。
そして生後2か月ごろから目や口に注意が行くようになり、6か月から12か月ごろは相手の喜怒哀楽といった顔の表情や、顔に似た目や口のあるものすべてに興味を持ち始めます。また実際の人間だけではなく、絵本や映像を見ている時でも目や口のあるものに注目します。アンパンマンが子ども達に好まれるのも、目鼻口がはっきりしていて顔が分かり易いのものひとつの理由かもしれません(人の顔を覚えるのが苦手な人がいたり、先天的または後天的に相貌失認と呼ばれる人の顔の認識が難しかったり、人の顔が見分けられないタイプの人もいるため、すべての人に当てはまる事象ではありません)。
「CGへの扉 Vol.14:AIが生み出す顔と人間の表情」では、人工知能で生成した存在しない顔写真を提供するサービスGenerated Photosなどを紹介しました。現在、人工知能が生成した顔画像はもはや実在の人物写真なのか、生成された画像なのか、そう簡単には見分けがつかないレベルに達しています。さらに画像生成の工程に、ひと工夫を加え、さまざまな応用が広がってきています。
言葉で顔画像を自由に修正 StyleCLIP
StyleCLIP は言葉によって画像を操作可能な画像生成ツールです。画像生成のために StyleGAN2 と StyleGANを高速に実行できるよう改変したものを利用しています。元となる顔画像に対して「誰々風に」「○○な髪型で」「メイク無しで」「もっと可愛く」といった、いわゆる言葉でディレクションするような指示で目的の画像が生成されます。
StyleCLIP サンプルコード : https://github.com/orpatashnik/StyleCLIP
StyleClip 論文 : StyleCLIP:Text-Driven Manipulation of StyleGAN Imagery
StyleClip 動画解説:https://www.youtube.com/watch?v=5icI0NgALnQ
本研究は OpenAI社の Contrastive Language-Image Pre-training(CLIP)と呼ばれる、自然言語を教師データとして視覚的な概念を効率的に学習する手法を利用しています。CLIPの恩恵により細かなパラメータ調整や手作業を必要とせずにStyleGANのパラメータを言葉で操作することを可能にしています。StyleGANそのものは、顔画像に限らず、さまざまな画像表現に用いることができます( CLIPに関しては「CGへの扉 Vol.22:言葉から画像を生成、DALL-Eはクリエイティブなのか?」を参照)。
顔の向き、顔への照明を自由にコントロール StyleRig
StyleRigは、StyleGANによって生成された顔画像をさまざまな方向から見た画像に変更したり、表情を変化させたり、顔に当たっている照明や光の加減を調整したりできる仕組みです。3DCGでキャラクタアニメーションを作る際にRigと呼ばれる骨格を設定し、動きや向きを調整します。それと同様にStyleRigは、StyleGANによって生成された、もともとは1枚しかない顔画像にRigを設定し、頭部の向きや、照明の状態を細かくパラメータで調整できるようになります。ここで調整した顔の向きなどのパラメータは、StyleGANで生成された他の顔画像に適用することもできます。
StyleRig 論文:StyleRig: Rigging StyleGAN for 3D Control over Portrait Images
StyleRig 動画解説:https://www.youtube.com/watch?v=eaW_P85wQ9k
人工知能で生成した画像は、実在する人物を撮影するときのように顔の向きや表情、照明などを演出できない課題がありました。その点で限界を感じていた人工的に生成された顔画像の利用方法も、StyleRigのような技術で操作できる幅が広がり、将来的にはモデルや俳優のような役割が果たせることが期待されます。広告や映像配信などでスキャンダルとは無縁の、存在しない人物が掲載されることが重宝される時代がやってくるのかもしれません。
顔写真を歴史的な肖像画風に Portrait AI
Portrait AI は、実写の写真を加工し、18世紀の歴史的な肖像画のように大胆に変化させる人工知能を活用したサービスです。パスポート写真や運転免許の写真のように、正面を向いたはっきりと顔が映った写真が向いており、写真が肖像画風に加工されます。可能な限りメガネ無し、写真いっぱいに顔が写っている方が良い結果が得られます。現在は学習用のデータの元となっているのがヨーロッパを中心とした肖像画のため、生成される画像も雰囲気がヨーロッパ風になっています。今後は世界中のより広い地域における肖像画をベースに機械学習させていく予定とのこと。
Portrait AI デモサイト:https://portraitai.app/
Portrait AI アプリ:https://apps.apple.com/app/apple-store/id1474684190 (iOS 11.2以降)
https://play.google.com/store/apps/details?id=com.portraitai.portraitai (Android 5.1以降)
※Portrait AIでは個人の顔写真をネット上にアップロードすることになるので、プライバシーポリシーをご理解の上、ご利用ください。
普通の顔写真がアニメーションキャラクター風、浮世絵風に Toonify
Toonify は、顔写真をディズニーやピクサーのアニメーション作品に登場するキャラクター風に加工したり、浮世絵風の画像に加工したりできる技術です。デモサイトでは Toonify Classic という旧版が無料で利用できます。最新版やさまざまな加工スタイルを選ぶ場合は枚数単位で有料(10枚の加工で3ポンド(約450円)から)となります。
ToonifyもStyleGANを利用しています。StyleGANの元々の仕組みとして、最初は数ピクセル四方の画像生成から始め、解像度を高めながら何回も繰り返し画像を生成することで、最終的に1024×1024サイズの得ています。その段階的な手法を逆手にとって、すべての段階で実写の顔画像のデータセットを用いるのではなく、画像生成の最終工程、高解像度生成の段階で、浮世絵やアニメーションキャラクターを元データとしたデータセットに差し替えて計算することで、Toonifyの興味深い顔画像が生成できています。
Toonify デモサイト:https://toonify.photos/
Toonifyの元となる技術論文:Resolution Dependent GAN Interpolation for Controllable Image Synthesis Between Domains
解説動画:https://www.youtube.com/watch?v=7Oqpiaj0IUM
サンプルコード:https://github.com/justinpinkney/toonify
※上記の画像はどれも「uncurated」と呼ばれる研究中の出力そのままのサンプルのため若干のアーティファクト(歪み)が見られる
アーティストもAIと組む時代 Breathtaking AI Generated Portraits
オランダ在住の写真家 Bas Uterwijk 氏は人工知能の手助けを得ながらポートレート写真を著名な絵画風にする作風を模索中です。制作には StyleGAN が用いられ、作品として満足のいく出来のものは、NFT(Non-fungible token:非代替性トークン:希少性が証明されたデジタルコンテンツの流通プラットフォーム)での販売も考えているそうです。
作例:https://www.basuterwijk.com/portfolio/G0000WVKM6MbiIAc
動画解説:https://www.youtube.com/watch?v=rZSaD4QLjxE
Uterwijk氏のInstagram : @ganbrood AI生成ポートレートが多数投稿されている
これからのリアルとフェイク
2018年に登場した、画像生成でよく使われるようになったStyleGANも、顔画像生成の際に不自然なノイズが生成する課題や、歯の並び、視線の方向が不自然になる課題が認識されており、用途によってはその違和感が目立ちます。そこで最近は、これらの課題を解決した StyleGAN2が使われるようになってきました。今後はさらに高解像度の生成画像や、高速化、さまざまな技術との組み合わせや応用が求められています。
ベースとなるテクノロジーが進化する一方、顔画像生成などの機械学習の元となっているデータセットが人種的に偏っていたり、現代の複雑な性差が扱えていなかったり、本人の同意無しに集められた顔写真が混じっているケース、そもそものデータにつけられているラベルが間違っている状況などが危惧されています(「CGへの扉 Vol.17:描画を進化させるTensorFlow Graphicsの真価」参照)。
この問題に関しては、データセット中のエラーを修正するためのソリューションが台頭してきています。単に大量のデータセットで、そこそこの精度、そこそこの結果、場合によっては間違った結果を得るよりも、少量でも正確で信頼できるデータセットを用いた方が後々良い結果が得られるという考えが適切な研究や実装もあるでしょう。
一例を示すと、データセットのエラー浄化のためのソリューションのひとつcleanlabではImageNetと呼ばれる定番データセットから数多くのエラーを見つけ出しています。データセットの多くは専門家ではない多数の人の手でラベル付けされており、どうしてもラベルの付け間違いや画像に写っているものの見間違いが生じます。間違ったラベルがつけられたデータは、ノイズとなり機械学習の精度を低下させてしまいます。
1枚1枚の画像を目視&手作業で確認し間違いがあれば除去していくのは大変な作業ですが、cleanlabを用いるとノイズとなる可能性の高い画像を選び出すことで、エラーと疑わしき画像を除去できます。cleanlabは特定のデータセットに限らず、どのようなタイプの画像データセットでも利用できます。cleanlab の実装の元となっているのは 2020年の Confident Learning: Estimating Uncertainty in Dataset Labels という論文です。
人の顔は、人間が一番読み取りやすく普段からよく見ているにもかかわらず、人工的に作られた顔画像の精度が高まったことにより、さまざまな課題や問題が生まれているのも確かです。ディープフェイクで人工的に作られた偽の顔画像がソーシャルメディアのプロフィール写真に使われ、あたかも実在の人物の意見であるかのように振舞ったり、存在しない社員の写真として使われたりと、ネガティブな面が話題になりがちですが、今回紹介したようなポジティブな用途、研究、ネガティブ面を払拭するような研究も数多く行われています。
人工知能を活用して生み出される顔画像は、単にこれは面白い!という段階から、クリエイティブな手法として生かされたり、匿名性を保つための手段や、思い出の写真を風化させない方法など、現実には存在しない画像を生み出し、今後さまざまな切り口で人工知能が活用されていくことが期待されます。
本連載の今後の予定:「CGへの扉」では、単なるAIの話題とは少し異なり、CG/VFX, アートの文脈から話題を切り取り紹介していきます。映像制作の現場におけるAI活用や、AIで価値が高まった先進的なツール、これからの可能性を感じさせるような話題、テクノロジーの話題にご期待ください。なにか取り上げて欲しいテーマやご希望などがございましたら、ぜひ編集部までお知らせください。
Vol.22:言葉から画像を生成、DALL-Eはクリエイティブなのか?
Vol.21:人工知能+3DCGの最新論文をまとめて紹介 #SIGGRAPHAsia2020
Vol.20:Adobeと人工知能の将来を見極める #AdobeMAX2020
Vol.19:コミュニケーションツールの新境地「NVIDIA MAXINE」
Vol.18:SIGGRAPH2020レポート 映像制作の現場で活躍する人工知能
Contributor:安藤幸央