モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。

TAG LIST
機械学習ディープラーニングCGCGへの扉モリカトロンAIラボインタビュー三宅陽一郎GANCEDEC2019小説ゲームAIスクウェア・エニックスGDC 2019音楽シナリオ強化学習VFX映画ニューラルネットワーク遺伝的アルゴリズムデバッグ不完全情報ゲームVRさかき漣薄明のバルドは知っているボードゲームファッションルールベースSIGGRAPHイベントレポートQAキャラクターAIガイスターロボットグーグルメタAIAlphaZero深層学習toioビヘイビア・ツリー自動生成研究DeepMindCMAmadeus Codeマルチエージェント音声認識ナビゲーションAIOpenAIシーマン齊藤陽介お知らせ敵対的生成ネットワークサルでもわかる人工知能ワークショップ知識表現IGDAどうぶつしょうぎマシンラーニングクラウドマイクロソフト藤澤仁AIと倫理宮路洋一GoogleStyleGANNVIDIAスポーツフェイクニュースディープフェイクASBSぱいどんTEZUKA2020ゲームブロックチェーンOpenAI Five映像ピクサーAdobe作曲ビッグデータアストロノーカナラティブモリカトロンパラメータ設計バランス調整対話型エージェント人狼知能エージェントシミュレーションロボティクスeSportsDota 2ソーシャルゲーム眞鍋和子淡路滋グリムノーツゴティエ・ボエダGautier BoedaJuliusTPRGバーチャル・ヒューマン・エージェントクーガー石井敦茂谷保伯森川幸人成沢理恵マジック・リープMagic Leap Oneノンファンジブルトークン水野勇太里井大輝GEMS COMPANY初音ミク転移学習デバッギングアニメーションリップシンキングUbisoftUbisoft La Forge北尾まどか将棋畳み込みニューラルネットワークナップサック問題ジェイ・コウガミ音楽ストリーミングSpotifyReplica Studioamuse5Gクラウドゲーミング和田洋一Stadia対話エンジン斎藤由多加シーマン人工知能研究所ゴブレット・ゴブラーズSIGGRAPH 2019ARAIりんなアップルiPhoneカメラ完全情報ゲームAIGraph環世界中島秀之予期知能ウェイポイントパス検索ドラゴンクエストPAIR画像認識アルスエレクトロニカ2019DeNA逆転オセロニア長谷洋平奥村エルネスト純齋藤精一高橋智隆ロボユニ泉幸典ロボコレ2019アートぎゅわんぶらあ自己中心派意思決定モデルウロチョロス理化学研究所教育SIGGRAPH ASIAHTN階層型タスクネットワークLEFT ALIVE長谷川誠Baby Xロバート・ダウニー・Jr.YouTubeSFThe Age of A.I.レコメンデーションソニーテンセントMOBA人事研修プロシージャルmynet.ai人工音声プレイ動画NBADARPAドローン群知能ウィル・ライトシムシティシムピープルレベルデザインSporeデノイズ画像処理GPUCPUALife人工生命オルタナティヴ・マシンサウンドスケープGMAITRPGウィザードリィAI Dungeon西川善司サムライスピリッツゼビウスストリートファイター栗原聡山野辺一記大里飛鳥マンガ13フェイズ構造AI美空ひばり手塚治虫手塚眞不気味の谷月刊エンタメAIニュースOculus Quest生体情報汎用人工知能

CGへの扉 Vol.14:AIが生み出す顔と人間の表情

2020.5.13アート

CGへの扉 Vol.14:AIが生み出す顔と人間の表情

人間が認識する「顔」とは?

「不気味の谷」と呼ばれる現象があります。これは芸術やロボット工学などで取りざたされる現象のひとつです。例えば人間に似せたロボットを作る際、あくまでロボット的な風貌をしていればかえって親近感がわきますが、あまりにも人間に似せて作られた場合、微妙に本物の人間とは異なるために、かえって不気味に感じてしまう現象です。なぜ人間にそれほど似ていなければ動きがぎこちなくても違和感がないのに、風貌が人間に近くなればなるほど違和感があるのでしょうか?

ロボットに限らず服飾販売で一般的なマネキンにも同じことが言えます。人の型をとって人と同じような精巧なマネキンを製作したところ、かえって違和感が生じたためマネキンに着せた服が売れなくなるという現象がありました。

人の動きや人間の表情はとても複雑なもので、人間は日々それらを見て過ごしています。人の表情や身振りからさまざまな情報を読み取りながら暮らしています。ロボットの風貌が人間とかけ離れていれば、非人間的な特徴を先に意識しますが、だんだん人間と似てくるに従って、逆に「人間的特徴」の方を意識するようになってしまう上に、その細かな振る舞いが人間と異なることに感づいてしまうのです。

「不気味の谷」と同様の現象はデータの扱いやレコメンデーション(推奨)においても存在します。例えば自分が入力する前に勝手に値が入力されているとどう感じるでしょう? 自分の趣味趣向に合ったレコメンデーションがあまりにもピッタリ当たっていたらどう感じるでしょうか? スマートフォンによる位置情報検知は大変便利な機能ですが、あまりにも正確に行動が捕捉されていると何かに監視されている気分にもなるかもしれないのです。

人間が認識する「表情」とは?

人はさまざまな事象を顔、表情から判断する認識力が高く、違和感に気付きやすい傾向にあります。海外ドラマ『ライ・トゥ・ミー 嘘は真実を語る(Lie to me)』は、俳優ティム・ロスが演じる心理学者カル・ライトマン博士が、犯人の細かな表情を読み取り、嘘を見抜くというストーリー展開のフィクションです。

フィクションではあるものの、実在する感情・表情に関する研究者ポール・エクマン博士がモデルになっています。エクマン博士の研究ではFACS(Facial Action Coding System)と呼ばれる表情を分類し記録するための仕組みが用いられています。人間の基本的な表情は怒り、軽蔑、恐怖、嫌悪、喜び、悲しみ、驚きの7つを基本とし、面白い、軽蔑、満足、困惑、興奮、罪悪感、安心、納得感、恥ずかしいなどといった感覚も表情に現れます(※基本の表情を6つとする分類もあり)。

ネット上に行き交う、動く顔文字や、CGキャラクターの表情、AIで生成する顔写真など、人工的に作られた表情も基本的にはFACSの分類に基づいて作られているものがほとんどです。

FACS(Facial Action Coding System)で分類される顔の上(目元)、鼻、口もとの表情(※researchgate.netからの引用)

AIによる顔研究の取り組み

This person does not exist」というサイトでは、NVIDIAの敵対的生成ネットワーク(GANs)ライブラリStyleGAN2を用いて、この世には存在しない人の顔を延々と表示します。実在しない人物の顔写真ではありますが、もととなっている学習データは実在する人間の顔であり、ゼロから作成されたCGキャラクターとは異なります。シワや顔の歪みなども表現されており、なんとなくそういう人が実在する気がしてきます。こちらは、StyleGANによる顔生成解説ビデオです。

また、こちらは機械学習に関する国際会議ICLR 2018で発表された顔画像生成の連続動画です。

論文:PROGRESSIVE GROWING OF GANS FOR IMPROVED QUALITY, STABILITY, AND VARIATION

解説動画:Progressive Growing of GANs for Improved Quality, Stability, and Variation

Watch Face is Real ?」というサイトでは AIで作られた顔と、実在の人の顔写真とを見比べ、どちらがAIで作られた顔写真かを当てるゲームが提供されています。それらの顔写真を見るとたまに眼鏡や背景に違和感があってあからさまにAI生成の顔写真だと分かるものもありますが、ほとんどの顔写真は「作られた顔」と感じることなく、見分けることはできません。もちろんサンプルは欧米人の顔、知らない人の顔であることも見分けられない要因のひとつかもしれません。

AIで作られた顔写真か実在の人物の顔写真かを当てるゲーム:Watch Face is Real ?

Generated Photos」というサイトでは、AIで生成した約200万人分の顔写真を公開しています。商用利用も許可されており、一枚2.99ドル(約320円)程度の価格で広告やWebへの掲載にも使えます。実在のタレントであれば、不祥事やスキャンダル、引退などで広告が取り下げられることがありますが、実在しないAIキャラクターであれば、そういった心配もありません。

Generated Photosでは、性別、年齢、肌の色、目の色、髪の色、髪の長さなどで写真を選ぶことができます。さらに最近「美男美女」や「普通の顔」に限定した選択も可能になりました(賛否両論かもしれませんが)。Generated PhotosのシステムはAPIで外部サービスから呼び出して利用することも可能です。

Generated Photosから「黒髪、目はブラウン、アジア人」で選んだAI顔写真

AIが生成した顔画像を写真素材として購入できるサイト:Generated Photos

広告などで用いるAI生成の顔写真は、実際に居そうな人、不自然ではない表情を作り出すのが重要ですが、それとはまた違った、変わったニーズもあります。例えば映画やドラマに出て来る脇役、悪役俳優はクセのある特徴的な顔や表情をしていることが多いとは思いませんか?

ゲーム中に登場するキャラクタ、それもメインストーリーとは関係ない群衆キャラクターは、一体一体ゲームデザイナーがゼロから作るわけではなく、合成したり自動生成したりして作られることが多くなってきました。そこでの課題は「普通の顔」は求められていないということです。現代が舞台のゲームもありますが大抵はファンタジー世界や、未来など特殊な環境が舞台になっています。現代人、それも街中ですれ違うような普通の顔が登場人物では味気ない世界になってしまうのです。

そこで実際のキャラクター製作では歯並びや肌の質感、髪型やヒゲなどといった部分を操作し意図的に極端な特徴をブレンドしています。平均的な顔ではなくクセのある顔、時には目立つ傷のある顔や引きつった表情など、さまざまな工夫によって顔が作られているのです。

これから生み出される「顔」とは?

オンライン自動チェスボードを開発中の企業 Regium社 が、自社のサイトにAIで作られた実在しない従業員の顔写真を掲載していたのではないかと問題になりました。真偽のほどは定かではありませんが、商品の存在そのものも懐疑的にとらえられています。現在はまだ目立った利用例はありませんが、人工知能で生成された顔写真が一般的に使われるようになると、さまざまな問題や、今までになかったような課題も出てくることが考えられます。

ディープフェイクと呼ばれるディープラーニングのアプローチで動画像の中の顔を別人に差し替える手法が話題になっています。目的を持って利用する場合もあれば、悪意を持って利用することもでき、さらに合成された映像の精度が一般的には気づけないくらい良くできていることが事を複雑にしています。

このような背景から、人工的に生成されたフェイク顔を見つけ出す仕組みが研究されています。2019年から2020年にかけて「Deepfake Detection Challenge(ディープフェイク検出大会)」が開催されています。Facebook、AWS(Amazon Web Services)、Microsoft などの企業、全米の工学系の大学などが協力しディープフェイク検出技術を競うものです。結構な金額の賞金や、AWSの利用クレジット、機械学習のもととなる大量のデータ提供など、各社、各大学が協力しつつ進められています。

現在はAIで合成されたディープフェイク映像を90%の確率で検知できるようになったそうですが、ディープフェイクの進歩のスピードも早く、イタチごっこの状況のようです。

Deepfake Detection Challange (DFDC)
Google が DFDCの活動を後押しするために公開したディープフェイク検出用の学習データ

例えばMicrosoftのディープフェイク検出のための研究「Face X-ray for More General Face Forgery Detection」は顔画像の合成された痕跡、境界線に着目した検出モデルです。検出のために大量のフェイク画像を学ばせる必要のない手法を用いています。見かけは似ていても色が異なったり、照明条件が異なったりする人間の目にはわからない差異を検出するのです。とても有用な方法のように思えますが、意図的にノイズを載せてこの手法を騙そうとするAdversarial Samples には現状対処できないことが課題とのこと。また合成されていることが前提なので、単なるそっくりさんが嘘のニュースを話している映像などは、検知できません。いくつかのアルゴリズムや手法を組み合わせて検知していく必要があるそうです。

論文:Face X-ray for More General Face Forgery Detection

また逆ディープフェイクと呼ばれるネット上で顔検出されないための技術の研究も進んでいます。人間がみたところ修正に気づかない顔映像でも、コンピュータには判別できないよう検出を防御するためのノイズを載せて使われます。プライバシーやセキュリティー技術で活用される顔認識ですが、その真偽も怪しくなってきているとも言えるのです。

Facebook Research による逆ディープフェイク研究:Live Face De-Identification in Video

Affectiva社のような表情の読み取りを専門とした企業も台頭してきており、顔を見るだけで感情がわかるのであれば、それを分からなくする手法もあるはずです。逆に違和感のある表情の違和感を排除する方法も導き出していけるはずです。同社の創設者で情報工学者のラナ・エル・カリウビ氏は、TEDで顔を見るだけで感情がわかるアプリについて講演しています。

Affectivaのテクノロジーの紹介ビデオでは、表情によってその人が今どういった感情なのかが検出されている様子が見られます。

Affectivaのテクノロジーを試してみることできる無料アプリ「AffdexMe」(iOS版Android版

オンラインでのコミュニケーションが広がるにつれて対面では読み取れていた表情がビデオ会議のコマ落ちした小さな画面では読み取れず、顔認識ソフトに相手の表情を代わりに読み取ってもらう試みも進んでいます。さらにAIによる顔の自動生成は相貌失認(顔を認識できない)患者の治療に応用できるといった副次的な展開も期待されています。近い将来ビデオ会議の相手の顔はAIで作られたものかもしれません。

顔や表情に関する事柄は個人差もあり、脳科学的にも心理学的にもまだまだ分かっていない事柄もあります。人の表情を読み取るのが得意な人もそうでない人も、顔の表情を豊かに変化させられる人もそうでない人も居ます。AIの助けを借りることで、顔や表情に関する制限が取り払われ様々な可能性が広がることが期待されます。

本連載の今後の予定:「CGへの扉」では、単なるAIの話題とは少し異なり、CG/VFX, アートの文脈から話題を切り取り紹介していきます。映像制作の現場におけるAI活用や、AIで価値が高まった先進的なツール、これからの可能性を感じさせるような話題、テクノロジーの話題にご期待ください。なにか取り上げて欲しいテーマやご希望などがございましたら、ぜひ編集部までお知らせください。

CGへの扉:

Vol.1:CG/VFXにおける人工知能の可能性と、その限界

Vol.2:なめらかなキャラクタアニメーションと、ディープラーニングの役目

Vol.3:CGとAIの蜜月が今まで不可能だった映像を生みだす

Vol.4:CG/VFX制作に欠かせなくなったマシーンラーニングの勘所

Vol.5:SIGGRAPH 2019に見るCG研究と機械学習

Vol.6:Facebookが取り組むVRとAIのアプローチ

Vol.7:AIによる差別やバイアスを避ける取り組み“PAIR”

Vol.8:一流オークションハウスも注目するアートとAIの関係性

Vol.9:現実の課題を解決するCGとAIの相互作用 #SIGGRAPHAsia2019

Vol.10:老齢とは無縁、De-Aging技術の台頭

Vol.11:動き、ダンスに新しい要素を加えるAIの役目

Vol.12:AIのおかげで映像の拡大やノイズ除去が高品質に

Vol.13:AIのクリエイティブとクリエイティビティ再考

Contributor:安藤幸央

RELATED ARTICLE関連記事

CGへの扉 Vol.12:AIのおかげで映像の拡大やノイズ除去が高品質に

2020.3.12アート

CGへの扉 Vol.12:AIのおかげで映像の拡大やノイズ除去が高品質に

CGへの扉 Vol.7:AIによる差別やバイアスを避ける取り組み“PAIR”

2019.10.16アート

CGへの扉 Vol.7:AIによる差別やバイアスを避ける取り組み“PAIR”

人工知能に作家性を宿らせる方法:栗原聡氏×山野辺一記氏インタビュー(前編)

2020.4.17アート

人工知能に作家性を宿らせる方法:栗原聡氏×山野辺一記氏インタビュー(前編)

RANKING注目の記事はこちら