モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。

TAG LIST
ディープラーニング機械学習CGCGへの扉安藤幸央GANニューラルネットワーク月刊エンタメAIニュース三宅陽一郎強化学習音楽モリカトロンAIラボインタビュー敵対的生成ネットワークQAOpenAI河合律子スクウェア・エニックスシナリオキャラクターAINVIDIAFacebookデバッグCEDEC2019ルールベースプロシージャルDeepMind人工知能学会ビヘイビア・ツリーGoogleCEDEC2020ゲームAI映画SIGGRAPH遺伝的アルゴリズム不完全情報ゲームメタAIナビゲーションAI森川幸人畳み込みニューラルネットワーク自然言語処理深層学習マイクロソフトAIと倫理グーグルGDC 2021GDC 2019マルチエージェントVRボードゲームロボットStyleGAN自動生成CEDEC2021GPT-3CNNVFXモリカトロンゲームプレイAIファッションHTN階層型タスクネットワークJSAI2020TensorFlowMicrosoftイベントレポートテストプレイ水野勇太アニメーションガイスターNPCCLIPアートtoio吉本幸記JSAI2021スポーツディープフェイクシムピープル汎用人工知能大内孝子GDC Summereスポーツ対話型エージェントeSportsBLUE PROTOCOLシーマン小説DALL-EStyleGAN2AlphaZeroカメラ環世界中島秀之懐ゲーから辿るゲームAI技術史研究DARPAドローンシムシティAI美空ひばり手塚治虫Electronic Artsメタデータ通しプレイOpenAI Five本間翔太CM倫理ピクサーAdobe作曲中嶋謙互Amadeus CodeMicrosoft AzureアストロノーカキャリアナラティブAmazon音声認識ロボティクスPyTorchDQN眞鍋和子バンダイナムコスタジオUnity齊藤陽介マインクラフトお知らせAIアートサルでもわかる人工知能VAEUbisoftUbisoft La ForgeワークショップGenvid Technologies知識表現ウォッチドッグス レギオンIGDAどうぶつしょうぎジェイ・コウガミ音楽ストリーミングマシンラーニングクラウド斎藤由多加リトル・コンピュータ・ピープルコンピューティショナル・フォトグラフィーGPT-2完全情報ゲーム坂本洋典釜屋憲彦ウェイポイントパス検索藤澤仁生物学画像認識DeNANFT長谷洋平鴫原盛之masumi toyota宮路洋一TextWorldSIGGRAPH ASIAソニーCycleGANフェイクニュースGPUALifeZork人工生命オルタナティヴ・マシンサウンドスケープMCS-AI動的連携モデルASBSマンガぱいどんTEZUKA2020ナビゲーションメッシュ松井俊浩スパーシャルAIマーケティングApex LegendsELIZANinjaコンピュータRPGアップルタウン物語KELDICメロディ言語ゲームTENTUPLAYLEFT 4 DEADMARVEL Future FightAstroタイムラプスEgo4Dバスキアバーチャルヒューマン日経イノベーション・ラボブロックチェーン敵対的強化学習階層型強化学習GOSU Data LabWANNGOSU Voice Assistant竹内将SenpAI.GGMobalytics馬淵浩希Cygames岡島学AWS Sagemaker映像セリア・ホデント形態素解析UXAWS Lambda誤字検出認知科学BERTゲームデザインSentencePieceLUMINOUS ENGINELuminous Productionsパターン・ランゲージちょまどビッグデータ模倣学習FPSマルコフ決定過程スタンフォード大学パラメータ設計テニスバランス調整レコメンドシステム協調フィルタリング人狼知能軍事AlphaDogfight TrialsエージェントシミュレーションStarCraft IIFuture of Life InstituteIntelLAIKARotomationドラゴンクエストライバルズ不確定ゲームDota 2モンテカルロ木探索ソーシャルゲームEmbeddingGTC2020NVIDIA MAXINE淡路滋ビデオ会議グリムノーツゴティエ・ボエダGautier Boeda階層的クラスタリングaiboJuliusSIETPRGバーチャル・ヒューマン・エージェントtoio SDK for Unityクーガー田中章愛石井敦銭起揚茂谷保伯MinecraftGDMC成沢理恵MITメディアラボ著作権マジック・リープMagic Leap OneMagendaノンファンジブルトークンDDSPサッカー里井大輝KaggleバスケットボールAssassin’s Creed OriginsSea of ThievesGEMS COMPANYmonoAI technologyアバター初音ミクOculus転移学習テストBaldur's Gate 3Candy Crush SagaSIGGRAPH ASIA 2020デバッギングBigGANMaterialGANリップシンキングRNNReBeL自動運転車VolvoRival Prakユービーアイソフト北尾まどかHALO将棋メタルギアソリッドVFSMナップサック問題汎用言語モデルSpotifyMITReplica StudioamuseChitrakar巡回セールスマン問題ジョルダン曲線5GMuZeroクラウドゲーミングRival Peak和田洋一リアリティ番組Stadiaジョンソン裕子MILEs対話エンジンインタラクティブ・ストリーミングインタラクティブ・メディアシーマン人工知能研究所Ludoゴブレット・ゴブラーズTransformerSIGGRAPH 2019ArtEmis絵画ARGROVERFAIRAIりんなチート検出オンラインカジノアップルRealFlowiPhoneシミュレーションDeep FluidsMeInGameAIGraphブレイン・コンピュータ・インタフェースBCILearning from Video予期知能ユクスキュルカント哲学ドラゴンクエストエージェントアーキテクチャPAIROCTOPATH TRAVELER西木康智OCTOPATH TRAVELER 大陸の覇者アルスエレクトロニカ2019StyleCLIPStyleRig逆転オセロニア奥村エルネスト純いただきストリート齋藤精一大森田不可止高橋智隆ロボユニザナック泉幸典仁井谷正充ロボコレ2019ぎゅわんぶらあ自己中心派Azure Machine Learning意思決定モデル脱出ゲームHybrid Reward ArchitectureウロチョロスSuper Phoenix理化学研究所Project Malmo教育Project PaidiaProject LookoutWatch ForBingLEFT ALIVE長谷川誠ジミ・ヘンドリックスBaby Xカート・コバーンロバート・ダウニー・Jr.エイミー・ワインハウスMagentaYouTubeダフト・パンクSFGlenn MarshallThe Age of A.I.Story2HallucinationレコメンデーションJukeboxGTC2021テンセントSIFTDCGANMOBADANNCE人事ハーバード大学研修デューク大学mynet.aiローグライクゲームNetHack人工音声NeurIPS 2021はこだて未来大学プレイ動画ヒップホップサイレント映画NBA環境音現代アートエージェント粒子群最適化法進化差分法群知能下川大樹ウィル・ライト高津芳希大石真史BEiTレベルデザインDETRSporeAIボイスアクターデノイズ南カリフォルニア大学画像処理NVIDIA CanvasSentropyCPUDiscordCALMプログラミングソースコード生成GMAIシチズンデベロッパーTRPGGitHubウィザードリィMCN-AI連携モデルAI Dungeon西川善司並木幸介サムライスピリッツ森寅嘉ゼビウスSIGGRAPH 2021ストリートファイター半導体Topaz Video Enhance AI栗原聡DLSS山野辺一記NetEase大里飛鳥DynamixyzモーションキャプチャーU-Net13フェイズ構造アドベンチャーゲームADVXLandAGI手塚眞DEATH STRANDING不気味の谷Eric JohnsonOculus Questコジマプロダクション生体情報デシマエンジンインディーゲーム写真高橋ミレイ照明Maxim PeterJoshua Romoffハイパースケープ山崎陽斗深層強化学習立木創太バンダイナムコ研究所ミライ小町テスラGameGANELYZAパックマンTesla BotTesla AI Dayソサエティ5.0ELYZA DIGESTSIGGRAPH 2020バズグラフニュースタンテキ東芝DIB-R倉田宜典3D音声合成韻律射影広告韻律転移

CGへの扉 Vol.14:AIが生み出す顔と人間の表情

2020.5.13アート

CGへの扉 Vol.14:AIが生み出す顔と人間の表情

人間が認識する「顔」とは?

「不気味の谷」と呼ばれる現象があります。これは芸術やロボット工学などで取りざたされる現象のひとつです。例えば人間に似せたロボットを作る際、あくまでロボット的な風貌をしていればかえって親近感がわきますが、あまりにも人間に似せて作られた場合、微妙に本物の人間とは異なるために、かえって不気味に感じてしまう現象です。なぜ人間にそれほど似ていなければ動きがぎこちなくても違和感がないのに、風貌が人間に近くなればなるほど違和感があるのでしょうか?

ロボットに限らず服飾販売で一般的なマネキンにも同じことが言えます。人の型をとって人と同じような精巧なマネキンを製作したところ、かえって違和感が生じたためマネキンに着せた服が売れなくなるという現象がありました。

人の動きや人間の表情はとても複雑なもので、人間は日々それらを見て過ごしています。人の表情や身振りからさまざまな情報を読み取りながら暮らしています。ロボットの風貌が人間とかけ離れていれば、非人間的な特徴を先に意識しますが、だんだん人間と似てくるに従って、逆に「人間的特徴」の方を意識するようになってしまう上に、その細かな振る舞いが人間と異なることに感づいてしまうのです。

「不気味の谷」と同様の現象はデータの扱いやレコメンデーション(推奨)においても存在します。例えば自分が入力する前に勝手に値が入力されているとどう感じるでしょう? 自分の趣味趣向に合ったレコメンデーションがあまりにもピッタリ当たっていたらどう感じるでしょうか? スマートフォンによる位置情報検知は大変便利な機能ですが、あまりにも正確に行動が捕捉されていると何かに監視されている気分にもなるかもしれないのです。

人間が認識する「表情」とは?

人はさまざまな事象を顔、表情から判断する認識力が高く、違和感に気付きやすい傾向にあります。海外ドラマ『ライ・トゥ・ミー 嘘は真実を語る(Lie to me)』は、俳優ティム・ロスが演じる心理学者カル・ライトマン博士が、犯人の細かな表情を読み取り、嘘を見抜くというストーリー展開のフィクションです。

フィクションではあるものの、実在する感情・表情に関する研究者ポール・エクマン博士がモデルになっています。エクマン博士の研究ではFACS(Facial Action Coding System)と呼ばれる表情を分類し記録するための仕組みが用いられています。人間の基本的な表情は怒り、軽蔑、恐怖、嫌悪、喜び、悲しみ、驚きの7つを基本とし、面白い、軽蔑、満足、困惑、興奮、罪悪感、安心、納得感、恥ずかしいなどといった感覚も表情に現れます(※基本の表情を6つとする分類もあり)。

ネット上に行き交う、動く顔文字や、CGキャラクターの表情、AIで生成する顔写真など、人工的に作られた表情も基本的にはFACSの分類に基づいて作られているものがほとんどです。

FACS(Facial Action Coding System)で分類される顔の上(目元)、鼻、口もとの表情(※researchgate.netからの引用)

AIによる顔研究の取り組み

This person does not exist」というサイトでは、NVIDIAの敵対的生成ネットワーク(GANs)ライブラリStyleGAN2を用いて、この世には存在しない人の顔を延々と表示します。実在しない人物の顔写真ではありますが、もととなっている学習データは実在する人間の顔であり、ゼロから作成されたCGキャラクターとは異なります。シワや顔の歪みなども表現されており、なんとなくそういう人が実在する気がしてきます。こちらは、StyleGANによる顔生成解説ビデオです。

また、こちらは機械学習に関する国際会議ICLR 2018で発表された顔画像生成の連続動画です。

論文:PROGRESSIVE GROWING OF GANS FOR IMPROVED QUALITY, STABILITY, AND VARIATION

解説動画:Progressive Growing of GANs for Improved Quality, Stability, and Variation

Watch Face is Real ?」というサイトでは AIで作られた顔と、実在の人の顔写真とを見比べ、どちらがAIで作られた顔写真かを当てるゲームが提供されています。それらの顔写真を見るとたまに眼鏡や背景に違和感があってあからさまにAI生成の顔写真だと分かるものもありますが、ほとんどの顔写真は「作られた顔」と感じることなく、見分けることはできません。もちろんサンプルは欧米人の顔、知らない人の顔であることも見分けられない要因のひとつかもしれません。

AIで作られた顔写真か実在の人物の顔写真かを当てるゲーム:Watch Face is Real ?

Generated Photos」というサイトでは、AIで生成した約200万人分の顔写真を公開しています。商用利用も許可されており、一枚2.99ドル(約320円)程度の価格で広告やWebへの掲載にも使えます。実在のタレントであれば、不祥事やスキャンダル、引退などで広告が取り下げられることがありますが、実在しないAIキャラクターであれば、そういった心配もありません。

Generated Photosでは、性別、年齢、肌の色、目の色、髪の色、髪の長さなどで写真を選ぶことができます。さらに最近「美男美女」や「普通の顔」に限定した選択も可能になりました(賛否両論かもしれませんが)。Generated PhotosのシステムはAPIで外部サービスから呼び出して利用することも可能です。

Generated Photosから「黒髪、目はブラウン、アジア人」で選んだAI顔写真

AIが生成した顔画像を写真素材として購入できるサイト:Generated Photos

広告などで用いるAI生成の顔写真は、実際に居そうな人、不自然ではない表情を作り出すのが重要ですが、それとはまた違った、変わったニーズもあります。例えば映画やドラマに出て来る脇役、悪役俳優はクセのある特徴的な顔や表情をしていることが多いとは思いませんか?

ゲーム中に登場するキャラクタ、それもメインストーリーとは関係ない群衆キャラクターは、一体一体ゲームデザイナーがゼロから作るわけではなく、合成したり自動生成したりして作られることが多くなってきました。そこでの課題は「普通の顔」は求められていないということです。現代が舞台のゲームもありますが大抵はファンタジー世界や、未来など特殊な環境が舞台になっています。現代人、それも街中ですれ違うような普通の顔が登場人物では味気ない世界になってしまうのです。

そこで実際のキャラクター製作では歯並びや肌の質感、髪型やヒゲなどといった部分を操作し意図的に極端な特徴をブレンドしています。平均的な顔ではなくクセのある顔、時には目立つ傷のある顔や引きつった表情など、さまざまな工夫によって顔が作られているのです。

これから生み出される「顔」とは?

オンライン自動チェスボードを開発中の企業 Regium社 が、自社のサイトにAIで作られた実在しない従業員の顔写真を掲載していたのではないかと問題になりました。真偽のほどは定かではありませんが、商品の存在そのものも懐疑的にとらえられています。現在はまだ目立った利用例はありませんが、人工知能で生成された顔写真が一般的に使われるようになると、さまざまな問題や、今までになかったような課題も出てくることが考えられます。

ディープフェイクと呼ばれるディープラーニングのアプローチで動画像の中の顔を別人に差し替える手法が話題になっています。目的を持って利用する場合もあれば、悪意を持って利用することもでき、さらに合成された映像の精度が一般的には気づけないくらい良くできていることが事を複雑にしています。

このような背景から、人工的に生成されたフェイク顔を見つけ出す仕組みが研究されています。2019年から2020年にかけて「Deepfake Detection Challenge(ディープフェイク検出大会)」が開催されています。Facebook、AWS(Amazon Web Services)、Microsoft などの企業、全米の工学系の大学などが協力しディープフェイク検出技術を競うものです。結構な金額の賞金や、AWSの利用クレジット、機械学習のもととなる大量のデータ提供など、各社、各大学が協力しつつ進められています。

現在はAIで合成されたディープフェイク映像を90%の確率で検知できるようになったそうですが、ディープフェイクの進歩のスピードも早く、イタチごっこの状況のようです。

Deepfake Detection Challange (DFDC)
Google が DFDCの活動を後押しするために公開したディープフェイク検出用の学習データ

例えばMicrosoftのディープフェイク検出のための研究「Face X-ray for More General Face Forgery Detection」は顔画像の合成された痕跡、境界線に着目した検出モデルです。検出のために大量のフェイク画像を学ばせる必要のない手法を用いています。見かけは似ていても色が異なったり、照明条件が異なったりする人間の目にはわからない差異を検出するのです。とても有用な方法のように思えますが、意図的にノイズを載せてこの手法を騙そうとするAdversarial Samples には現状対処できないことが課題とのこと。また合成されていることが前提なので、単なるそっくりさんが嘘のニュースを話している映像などは、検知できません。いくつかのアルゴリズムや手法を組み合わせて検知していく必要があるそうです。

論文:Face X-ray for More General Face Forgery Detection

また逆ディープフェイクと呼ばれるネット上で顔検出されないための技術の研究も進んでいます。人間がみたところ修正に気づかない顔映像でも、コンピュータには判別できないよう検出を防御するためのノイズを載せて使われます。プライバシーやセキュリティー技術で活用される顔認識ですが、その真偽も怪しくなってきているとも言えるのです。

Facebook Research による逆ディープフェイク研究:Live Face De-Identification in Video

Affectiva社のような表情の読み取りを専門とした企業も台頭してきており、顔を見るだけで感情がわかるのであれば、それを分からなくする手法もあるはずです。逆に違和感のある表情の違和感を排除する方法も導き出していけるはずです。同社の創設者で情報工学者のラナ・エル・カリウビ氏は、TEDで顔を見るだけで感情がわかるアプリについて講演しています。

Affectivaのテクノロジーの紹介ビデオでは、表情によってその人が今どういった感情なのかが検出されている様子が見られます。

Affectivaのテクノロジーを試してみることできる無料アプリ「AffdexMe」(iOS版Android版

オンラインでのコミュニケーションが広がるにつれて対面では読み取れていた表情がビデオ会議のコマ落ちした小さな画面では読み取れず、顔認識ソフトに相手の表情を代わりに読み取ってもらう試みも進んでいます。さらにAIによる顔の自動生成は相貌失認(顔を認識できない)患者の治療に応用できるといった副次的な展開も期待されています。近い将来ビデオ会議の相手の顔はAIで作られたものかもしれません。

顔や表情に関する事柄は個人差もあり、脳科学的にも心理学的にもまだまだ分かっていない事柄もあります。人の表情を読み取るのが得意な人もそうでない人も、顔の表情を豊かに変化させられる人もそうでない人も居ます。AIの助けを借りることで、顔や表情に関する制限が取り払われ様々な可能性が広がることが期待されます。

本連載の今後の予定:「CGへの扉」では、単なるAIの話題とは少し異なり、CG/VFX, アートの文脈から話題を切り取り紹介していきます。映像制作の現場におけるAI活用や、AIで価値が高まった先進的なツール、これからの可能性を感じさせるような話題、テクノロジーの話題にご期待ください。なにか取り上げて欲しいテーマやご希望などがございましたら、ぜひ編集部までお知らせください。

CGへの扉:

Vol.1:CG/VFXにおける人工知能の可能性と、その限界

Vol.2:なめらかなキャラクタアニメーションと、ディープラーニングの役目

Vol.3:CGとAIの蜜月が今まで不可能だった映像を生みだす

Vol.4:CG/VFX制作に欠かせなくなったマシーンラーニングの勘所

Vol.5:SIGGRAPH 2019に見るCG研究と機械学習

Vol.6:Facebookが取り組むVRとAIのアプローチ

Vol.7:AIによる差別やバイアスを避ける取り組み“PAIR”

Vol.8:一流オークションハウスも注目するアートとAIの関係性

Vol.9:現実の課題を解決するCGとAIの相互作用 #SIGGRAPHAsia2019

Vol.10:老齢とは無縁、De-Aging技術の台頭

Vol.11:動き、ダンスに新しい要素を加えるAIの役目

Vol.12:AIのおかげで映像の拡大やノイズ除去が高品質に

Vol.13:AIのクリエイティブとクリエイティビティ再考

Contributor:安藤幸央

RELATED ARTICLE関連記事

CGへの扉 Vol.13:AIのクリエイティブとクリエイティビティ再考

2020.4.23アート

CGへの扉 Vol.13:AIのクリエイティブとクリエイティビティ再考

【JSAI2021】AIが自動生成したシナリオは人間にとって本当に面白いのか?

2021.6.24アート

【JSAI2021】AIが自動生成したシナリオは人間にとって本当に面白いのか?

CGへの扉 Vol.31:人工知能が考える「顔」と、人が考える「顔」

2021.10.14アート

CGへの扉 Vol.31:人工知能が考える「顔」と、人が考える「顔」

RANKING注目の記事はこちら