モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。

TAG LIST: CG CGへの扉生成AI 安藤幸央吉本幸記月刊エンタメAIニュース河合律子機械学習ディープラーニング OpenAI LLM 大規模言語モデル Google NVIDIA 音楽グーグル GAN モリカトロン森川幸人 ChatGPT 三宅陽一郎 Stable Diffusion DeepMind 強化学習人工知能学会ニューラルネットワークシナリオマイクロソフト QA 自然言語処理 AIと倫理 GPT-3 倫理 Facebook 大内孝子映画 SIGGRAPH スクウェア・エニックス著作権アートキャラクターAI ルールベースゲームプレイAI Minecraft 敵対的生成ネットワーク NPC 音楽生成AI 動画生成AI モリカトロンAIラボインタビューアニメーション 3DCG 画像生成 NFT ロボットファッション DALL-E2 StyleGAN プロシージャルディープフェイクマルチモーダル VFX Midjourney 遺伝的アルゴリズムデバッグ自動生成 VR メタAI Meta 画像生成AI Red Ram マンガインタビューゲームAI Adobe Microsoft テストプレイマインクラフト小説 CLIP テキスト画像生成深層学習 CEDEC2019 toio 教育 NeRF デジタルツインメタバース不完全情報ゲーム Stability AI ボードゲーム DALL-E Sora ビヘイビア・ツリー CEDEC2021 CEDEC2020 作曲アストロノーカロボティクスナビゲーションAI 高橋力斗 AIアート Gemini メタ畳み込みニューラルネットワークアップルデジタルヒューマン ELSI Playable!スポーツはこだて未来大学エージェント GDC 2021 プロンプト GPT-4 手塚治虫汎用人工知能 JSAI2022 3D 広告 DALL-E 3 バーチャルヒューマン NVIDIA Omniverse GDC 2019 マルチエージェント CEDEC2022 市場分析 AR 懐ゲーから辿るゲームAI技術史鴫原盛之ジェネレーティブAI ソニー東京大学栗原聡 CNN マーケティング JSAI2024 CM BERT Microsoft Azure 音声認識言霊の迷宮 Unity Omniverse Ubisoft JSAI2023 Roblox がんばれ森川君2号電気通信大学 SIGGRAPH ASIA HTN Apple 階層型タスクネットワーク AIQVE ONE 世界モデルアドベンチャーゲームインディーゲーム JSAI2020 GTC2023 音声合成メタデータ TensorFlow ブロックチェーンイベントレポートキャリア模倣学習対話型エージェント Amazon サイバーエージェントトレーディングカードメディアアート DQN シーマン合成音声 SIE Runway 水野勇太モリカトロン開発者インタビュー宮本茂則アバターブラック・ジャック Genvid Technologies ガイスター StyleGAN2 徳井直生村井源稲葉通将斎藤由多加 Open AI ベリサーブ GTC2022 GPT-3.5 YouTube 音声生成AI SF Netflix JSAI2021 松木晋祐 Bard 研究シムシティシムピープル Zork GPT-4o MCS-AI動的連携モデルマーダーミステリーモーションキャプチャー TEZUKA2020 CEDEC2023 AGI テキスト生成スパーシャルAI Electronic Arts GDC Summer イーロン・マスク論文 Stable Diffusion XL 森山和道 Audio2Face NVIDIA Riva eスポーツスタンフォード大学アーケードゲームテニスセガ人狼知能 Google I/O 類家利直 Firefly eSports BLUE PROTOCOL CEDEC2024 aibo 大澤博隆 SFプロトタイピング銭起揚 Runway Gen-3 Alpha チャットボット TikTok text-to-3D DreamFusion 自動運転車ワークショップ Epic Games AIロボ「迷キュー」に挑戦 AWS Adobe MAX クラウド AlphaZero Preferred Networks Transformer GPT-2 rinna AIりんなカメラ環世界中島秀之 PaLM GitHub Copilot LLaMA 哲学 Apple Vision Pro ハリウッド宮路洋一 Whisk 理化学研究所 Gen-1 SIGGRAPH Asia 2024 テキスト画像生成AI 松尾豊人事データマイニング ControlNet 現代アート DARPA 法律ドローンゲームエンジン Unreal Engine Imagen 人工生命バイアスサム・アルトマン Veo ASBS ぱいどん AI美空ひばり手塚眞 LoRA デザイン GDC 2025 バンダイナムコ研究所 ELYZA NEDO 建築 ELIZA FSM-DNN MindAgent BIM LEFT 4 DEAD くまうた通しプレイソニー・インタラクティブエンタテインメント OpenAI Five Meshy 本間翔太馬淵浩希 Cygames 岡島学ピクサー九州大学プラチナエッグイーサリアム効果音ボエダ・ゴティエビッグデータ中嶋謙互 Amadeus Code データ分析自動翻訳 MILE NVIDIA ACE Veo 3 ナラティブ Niantic Omniverse Replicator WCCF レコメンドシステム NVIDIA DRIVE Sim WORLD CLUB Champion Football NVIDIA Isaac Sim Sakana AI 柏田知大軍事田邊雅彦トレカ慶應義塾大学 Max Cooper GPT Disney Photoshop PyTorch 京都芸術大学 ChatGPT4 モンテカルロ木探索 JSAI2025 ByteDance 眞鍋和子バンダイナムコスタジオコミコパヒストリア AI Frog Interactive 新清士ラベル付け田中章愛 ComfyUI 齊藤陽介コナミデジタルエンタテインメント成沢理恵お知らせ Magic Leap One Tencent サッカーバスケットボール LINEヤフー Suno AI KaKa Creation VOICEVOX text-to-image サルでもわかる人工知能 VAE TEZUKA2023 DOOM リップシンキング RNN GameNGen グランツーリスモ・ソフィー Ubisoft La Forge スーパーマリオブラザーズ社員インタビュー知識表現ウォッチドッグスレギオン VTuber IGDA 立教大学秋期GTC2022 大阪公立大学 HALO フォートナイト KLab どうぶつしょうぎジェイ・コウガミ音楽ストリーミング MIT 野々下裕子 Movie Gen Qosmo マシンラーニング 5G MuZero Rival Peak pixiv オムロンサイニックエックス GPTs セキュリティ対話エンジンポケモン 3Dスキャン橋本敦史リトル・コンピュータ・ピープル Codex シーマン人工知能研究所コンピューティショナル・フォトグラフィーゴブレット・ゴブラーズ絵画 3D Gaussian Splatting Microsoft Designer イラストシミュレーション Soul Machines 柿沼太一完全情報ゲームバーチャルキャラクター坂本洋典宮本道人釜屋憲彦 LLaMA 2 ウェイポイントパス検索 Hugging Face 対談藤澤仁生物学 XR GTC 2022 xAI 画像認識 Siemens ストライキ StyleCLIP DeNA Voyager 長谷洋平 GDC 2024 クラウドコンピューティング masumi toyota IBM ぎゅわんぶらあ自己中心派 OpenSea GDC 2022 Veo 2 ウロチョロス SNS TextWorld Earth-2 Bing エコロジー Magenta ソフトバンク SONY ポケットモンスター ELYZA Pencil Scenario SIGGRAPH2023 AIピカソ GTC2021 AI素材.com CycleGAN テンセント Andreessen Horowitz QA Tech Night NetHack 下田純也桑野範久キャラクターモーション音源分離 NBA フェイクニュースユニバーサルミュージック RPG ウィル・ライト Web3 SIGGRAPH 2022 レベルデザイン DreamerV3 SIMA AIボイスアクター南カリフォルニア大学 NVIDIA Canvas GDC GPU ALife オルタナティヴ・マシンサウンドスケープ LaMDA TRPG マジック：ザ・ギャザリング AI Dungeon 介護 BitSummit Gemma 2 Cube 3D ゼビウス NetEase Inworld AI モリカトロンAIコネクトゲーム背景 IEEE Point-E アパレル Claude 不気味の谷ナビゲーションメッシュファインチューニング早稲田大学グランツーリスモ写真高橋ミレイ北野宏明深層強化学習松原仁松井俊浩武田英明フルコトモリカコミックパックマン ELYZA DIGEST ジョージア工科大学 Apple Intelligence WWDC WWDC 2024 西成活裕ハイブリッドアーキテクチャ AI野々村真 LINE AIトークサジェスト Apex Legends 群衆マネジメントライブポートレイト GTC2025 Ninja コンピュータRPG ライブビジネス Wonder Studio Adobe Max 2023 GPT-4-turbo Fuxi Lab アップルタウン物語新型コロナ土木佐藤恵助 Naraka:Bladepoint Mobile KELDIC 周済涛 Bing Chat 大道麻由バトルロイヤルメロディ言語清田陽司インフラ Bing Image Creator 物語構造分析ビヘイビアツリーゲーム TENTUPLAY サイバネティックス慶応義塾大学 SoftServe MARVEL Future Fight Astro 人工知能史 Amazon Bedrock Assistant with Bard 渡邉謙吾 ALNAIR タイムラプス Ego4D AI哲学マップ The Arcade ここ掘れ！プッカ AMRI バスキア星新一 X.AI Search Generative Experience BLADE 日経イノベーション・ラボ StyleGAN-XL X Corp.Dynalang 濱田直希 GAGA 敵対的強化学習 StyleGAN3 Twitter VLE-CE 大柳裕⼠QUEEN 階層型強化学習 GOSU Data Lab GANimator Xホールディングス加納基晴 Runway Gen-4 WANN GOSU Voice Assistant VoLux-GAN Magi AI Act SkyReels 竹内将 SenpAI.GG Projected GAN EU 研究開発事例 Mobalytics Self-Distilled StyleGAN SDXL Ars Electronica 赤羽進亮 Stable Virtual Camera ニューラルレンダリング RTFKT AI規制遊戯王 Intangible AWS Sagemaker PLATO NIKE 欧州委員会 UDI（Universal Duel Interface）ブライアン・イーノ映像セリア・ホデント形態素解析 frame.io Clone X 欧州議会第一工科大学 Eno UX AWS Lambda Foodly 村上隆欧州理事会佐竹空良 Brain One 誤字検出 MusicLM 小林篤史 AlphaEvolve 認知科学中川友紀子 Digital Mark AudioLM Continuous Thought Machine（CTM）ゲームデザイン SentencePiece アールティ Snapchat MusicCaps 荻野宏実 Arm LUMINOUS ENGINE クリエイターコミュニティ AudioCraft 伊藤黎 Stable Audio Open Small Luminous Productions BlenderBot 3 バーチャルペットビヘイビアブランチ Word2World パターン・ランゲージ竹村也哉 Meta AI NVIDIA NeMo Service Mubert WPP STORY2GAME ちょまどマーク・ザッカーバーグヴァネッサ・ローザ Mubert Render General Computer Control（GCC）ウィットウォーターランド大学 GOAP WACUL Vanessa A Rosa Gen-2 Cradle 森川の頭の中 Adobe MAX 2021 陶芸 Runway AI Film Festival Spiral.AI 花森リド Play.ht PreViz ItakoLLM-7b Google I/O 2025 音声AI 静岡大学 AIライティング LiDAR Character-LLM 明治大学 Flow Omniverse Avatar AIのべりすと Polycam 復旦大学北原鉄朗 Lyra 2 FPS QuillBot deforum Chat-Haruhi-Suzumiya 中村栄太 MusicFX DJ マルコフ決定過程 NVIDIA Megatron Copysmith 涼宮ハルヒ日本大学 Animon.ai NVIDIA Merlin Jasper ハーベスト Emu Video ヤマハツインズひなひま NVIDIA Metropolis ForGames 前澤陽 Maya パラメータ設計ゲームマーケットペリドット増田聡 Deep Q-Learning バランス調整岡野翔太 Dream Track 採用 AlphaGO 協調フィルタリング郡山喜彦 Music AI Tools スペースインベーダーテキサス大学ジェフリー・ヒントン Lyria 科学史プリンス・オブ・ペルシャ Google I/O 2023 Yahoo!知恵袋 AIサイエンティストドラゴンクエストIV AlphaDogfight Trials AI Messenger Voicebot インタラクティブプロンプトAI Terra 堀井雄二エージェントシミュレーション OpenAI Codex 武蔵野美術大学 AI Overview 山名学 StarCraft II HyperStyle BingAI 石渡正人電通タイトー Future of Life Institute Rendering with Style 手塚プロダクション AICO2 カプコン Intel 林海象 BitSummit Drift Ubi Anvilエンジン LAIKA Disneyリサーチヴィトゲンシュタイン古川善規 V1 Video Model Rotomation GauGAN 論理哲学論考 Lightroom 大規模再構成モデル Omega Crafter Artificial Analysis GauGAN2 Canva LRM SPACE INVADIANS Video Arena ドラゴンクエストライバルズ画像言語表現モデル Objaverse 西島大介 Video Model Leaderboard 不確定ゲーム SIGGRAPH ASIA 2021 PromptBase BOOTH MVImgNet 吉田伸一郎 Claude 3.5 Dota 2 ディズニーリサーチ pixivFANBOX One-2-3-45 SIGGRAPH2024 Mistral Mitsuba2 バンダイナムコネクサス虎の穴 3Dガウシアンスプラッティング Motion-I2V ソーシャルゲーム Embedding ワイツマン科学研究所ユーザーレビュー Fantia ワンショット3D生成技術樋口恭介 GTC2020 CG衣装 mimic とらのあな Toonify3D Claude 4 NVIDIA MAXINE VRファッション Baidu 集英社 FGDC 生成対向ネットワーク小川昴淡路滋ビデオ会議 Artflow ERNIE-ViLG 少年ジャンプ＋Future Game Development Conference 拡散モデルホラーゲームグリムノーツ Eponym 古文書 ComicCopilot 佐々木瞬 Diffusion Stable Diffusion 1.5 ゴティエ・ボエダ音声クローニング凸版印刷階層型物語構造 Gautier Boeda 階層的クラスタリング Gopher AI-OCR ゲームマスターうめ夏目漱石画像判定 Inowrld AI 小沢高広漱石書簡 Julius 鑑定 MOD Anique ドリコム京都情報大学院大学 TPRG Oxia Palus Ghostwriter 中村太一 ai and 上野未貴バーチャル・ヒューマン・エージェント toio SDK for Unity Art Recognition Skyrim エグゼリオ SaaS クーガー実況パワフルサッカースカイリム Copilot インサイト石井敦 NHC 2021 桃太郎電鉄 RPGツクールMZ カスタマーサポート茂谷保伯池田利夫桃鉄 ChatGPT_APIMZ serial experiments lain ComfyUI-AdvancedLivePortrait GDMC 新刊案内パワサカダンジョンズ&ドラゴンズ AI lain GUI マーベル・シネマティック・ユニバース Oracle RPG PCG MITメディアラボ MCU 岩倉宏介深津貴之 PCGRL アベンジャーズ PPO xVASynth Dungeons&Dragons Video to Video マジック・リープ Digital Domain Machine Learning Project Canvas Laser-NV ビートルズ iPhone 16 Magenda Masquerade2.0 国立情報学研究所ザ・ビートルズ: Get Back OpenAI o1 ノンファンジブルトークン DDSP フェイシャルキャプチャー石川冬樹 MERF Demucs AIスマートリンクスパコン Alibaba 音楽編集ソフトシャープ里井大輝 Kaggle スーパーコンピュータ VQRF Adobe Audition ウェアラブル山田暉松岡聡 nvdiffrec iZotope CE-LLM Assassin’s Creed Origins AI会話ジェネレーター TSUBAME 1.0 NeRFMeshing RX10 Communication Edge-LLM Sea of Thieves TSUBAME 2.0 LERF Moises GEMS COMPANY monoAI technology LSTM ABCI マスタリング AIペットモリカトロンAIソリューション富岳レベルファイブ Yahoo!ニュース初音ミク Oculus コード生成AI Society 5.0 リアム・ギャラガー AI Comic Factory 転移学習テスト AlphaCode 夏の電脳甲子園グライムス AI comic Generator Baldur's Gate 3 Codeforces 座談会 Boomy ComicsMaker.ai Candy Crush Saga 自己増強型AI ジョン・レジェンド Genie AI LlamaGen.ai SIGGRAPH ASIA 2020 COLMAP ザ・ウィークエンド SIGGRAPH Asia 2023 GAZAI ADOP NVIDIA GET3D ドレイク C·ASE Flame Planner デバッギング BigGAN GANverse3D FLARE 動画ゲーム生成モデル MaterialGAN ダンスグランツーリスモSPORT AI絵師エッジワークス MagicAnimate ReBeL UGC 日本音楽作家団体協議会 Animate Anyone Virtuals Protocol GTソフィー PGC FCA インテリジェントコンピュータ研究所 Volvo FIAグランツーリスモチャンピオンシップ Voicebox アリババ MarioVGG NovelAI さくらインターネット DreaMoving Rival Prak DGX A100 NovelAI Diffusion VISCUIT 松原卓二ぷよぷよ Scratch Art Transfer 2 ユービーアイソフト Webcam VTuber モーションデータスクラッチ Art Selfie 2 星新一賞ビスケット Musical Canvas 北尾まどかポーズ推定 TCG プログラミング教育 The Forever Labyrinth 将棋メタルギアソリッドV メッシュ生成 Refik Anadol FSM メルセデス・ベンツ QRコード VALL-E Alexander Reben Magic Leap 囲碁 Deepdub.ai Rhizomatiks ナップサック問題 Live Nation Epyllion デンソー AUDIOGEN Molmo 汎用言語モデル Web3.0 マシュー・ボールデンソーウェーブ Evoke Music PixMo AIOps ムーアの法則原昌宏 AutoFoley Qwen2 72B Spotify スマートコントラクト日本機械学会 Colourlab.Ai Depth Pro Replica Studio ロボティクス・メカトロニクス講演会ディズニー amuse Chitrakar Adobe MAX 2022 トヨタ自動車 Largo.ai VARIETAS 巡回セールスマン問題かんばん方式 Cinelytic AI面接官ジョルダン曲線メディア Adobe Research Taskade キリンホールディングス政治 Galactica プロット生成 Pika.art 空間コンピューティングクラウドゲーミング AI Filmmaking Assistant Dream Screen 和田洋一リアリティ番組映像解析 FastGAN SynthID Stadia ジョンソン裕子 4コママンガ AI Screenwriter Firefly Video Model MILEs NightCafe 東芝デジタルソリューションズ芥川賞 Stable Video 4D インタラクティブ・ストリーミング Luis Ruiz SATLYS 映像解析AI 文学 AI受託開発事例インタラクティブ・メディア恋愛田中志弥 PFN 3D Scan ElevenLabs タップル Playable!3D 東京工業大学 HeyGen Abema TV Playable!Mobile Ludo 博報堂 After Effects NEC Adobe MAX 2024 ラップ PFN 4D Scan 絵本木村屋 Sneaks SIGGRAPH 2019 ArtEmis Z世代 DreamUp 出版 GPT Store Illustrator AIラッパーシステム DeviantArt Ammaar Reshi 生成AIチェッカー Meta Quest 3 Waifu Diffusion Stories ユーザーローカル XR-Objects GROVER プラスリンクス～キミと繋がる想い～元素法典 StoryBird 九段理江 Peridot FAIR STC Novel AI Versed 東京都同情塔 Orion チート検出 Style Transfer Conversation ProlificDreamer 防犯オンラインカジノ RCP Unity Sentis 4Dオブジェクト生成モデル O2 RealFlow Rinna Character Platform Unity Muse Align Your Gaussians Scam Detection iPhone CALA Caleb Ward AYG Live Threat Detection Deep Fluids 宮田龍 MAV3D 乗換NAVITIME MeInGame Amelia 清河幸子ファーウェイ Kaedim AIGraph ブレイン・コンピュータ・インタフェース西中美和 4D Gaussian Splatting 3DFY.ai BCI Gatebox アフォーダンス安野貴博 4D-GS Luma AI Learning from Video ANIMAK PaLM-SayCan 斧田小夜 Glaze Avaturn 予期知能逢妻ヒカリ WebGlaze Bestat セコム NightShade Oasis ユクスキュルバーチャル警備システム Code as Policies Spawning Decart カント損保ジャパン CaP Have I Been Trained?Dejaboom!CM3leon Fortnite Unbounded 上原利之 Stable Doodle Unreal Editor For Fortnite Etched ドラゴンクエストエージェントアーキテクチャアッパーグラウンドコリジョンチェック T2I-Adapter 声優 PAIR OCTOPATH TRAVELER パブリシティ権西木康智 Volumetrics 日本俳優連合 OCTOPATH TRAVELER 大陸の覇者山口情報芸術センター［YCAM］AIワールドジェネレーター日本芸能マネージメント事業者協会アルスエレクトロニカ2019 品質保証 YCAM 日本マネジメント総合研究所 Rosebud AI Gamemaker 日本声優事業社協議会 StyleRig Autodesk アンラーニング・ランゲージ Layer IAPP 逆転オセロニア Bentley Systems カイル・マクドナルド Lily Hughes-Robinson Charisma.ai Tripo 2.0 ワールドシミュレーターローレン・リー・マッカーシー Colossal Cave Adventure Meta 3D Gen 奥村エルネスト純いただきストリート H100 鎖国［Walled Garden］プロジェクト AdventureGPT 調査スマートシティ齋藤精一大森田不可止 COBOL SIGGRAPH ASIA 2022 リリー・ヒューズ＝ロビンソン Meta Quest 都市計画高橋智隆 DGX H100 VToonify BabyAGI IP 松本雄太ロボユニザナック DGX SuperPOD ControlVAE GPT-3.5 Turbo 早瀬悠真泉幸典仁井谷正充変分オートエンコーダーカーリング強いAI Genie 2 ロボコレ2019 Instant NeRF フォトグラメトリウィンブルドン弱いAI World Labs artonomous 回帰型ニューラルネットワーク Cybever bitGANs DeepJoin 戦術分析 Third Dimension AI Azure Machine Learning Azure OpenAI Service パフォーマンス測定 Lumiere 東北大学意思決定モデル脱出ゲーム DeepL IoT UNet Gemini 2.0 Hybrid Reward Architecture コミュニティ管理 DeepL Write ProFitX ImageFX Super Phoenix Watsonx MusicFX Project Malmo オンラインゲーム Athletica TextFX フロンティアワークス気候変動コーチング機械翻訳 Project Paidia シンギュラリティ北見工業大学 Keyframer Simplified Project Lookout マックス・プランク気象研究所レイ・カーツワイル北見カーリングホール AI Voice over Generator Watch For ビョルン・スティーブンスヴァーナー・ヴィンジ画像解析 Gemini 1.5 AI Audio Enhancer 気象モデル Runway Research じりつくん AI Studio エーアイ LEFT ALIVE 気象シミュレーション Make-A-Video NTT Sportict Vertex AI AITalk 長谷川誠ジミ・ヘンドリックス環境問題 Phenaki AIカメラ Chat with RTX コエステーション Baby X カート・コバーン Dreamix STADIUM TUBE Slack ロバート・ダウニー・Jr.エイミー・ワインハウス SDGs Text-to-Imageモデル Pixelllot S3 Slack AI PlayStation Pokémon Battle Scope ダフト・パンクメモリスタ AIスマートコーチ VRML Glenn Marshall kanaeru Techno Magic The Age of A.I.Story2Hallucination 音声変換 Latitude 占いゴーストバスターズレコメンデーション Jukebox Dreambooth 行動ロジック生成AI スパイダーマン Veap Japan ヤン・ルカン Convai ポリフォニー・デジタル EAP neoAI Perfusion NTTドコモ荒牧伸志 SIFT 福井千春 DreamIcon ニューラル物理学 Ememe Project Sid DCGAN 医療 mign 毛髪 Genie Altera MOBA DANNCE メンタルケア studiffuse 荒牧英治汎用AIエージェント Robert Yang ハーバード大学 Edgar Handy 中ザワヒデキ AIファッションウィーク Razer 研修デューク大学大屋雄裕インフルエンサー Project AVA 中川裕志 Grok-1 Streamlabs mynet.ai ローグライクゲーム Adreeseen Horowitz Mixture-of-Experts Intelligent Streaming Assistant 東京理科大学 NVIDIA Avatar Cloud Engine MoE Project DIGITS 人工音声 NeurIPS 2021 産業技術総合研究所 Replica Studios Claude 3 スーパーコンピューターリザバーコンピューティング Smart NPCs Claude 3 Haiku エージェンテックプレイ動画ヒップホップ対話型AIモデル Roblox Studio Claude 3 Sonnet AI Shorts 詩ソニーマーケティング Promethean AI Claude 3 Opus テルアビブ大学サイレント映画もじぱ note 森永乳業 DiffUHaul 環境音暗号通貨 note AIアシスタント Musiio C2PA TrailBlazer FUZZLE Ketchup Endel ゲーミフィケーションヴィクトリア大学ウェリントン Alteration AI News Tomo Kihara zeroscope 粒子群最適化法 Art Selfie Playfool QNeRF 進化差分法オープンワールド Art Transfer Sonar 遊びカーネギーメロン大学群知能下川大樹 AIFA Pet Portraits Sonar+D tsukurun RALF 高津芳希 P2E Blob Opera 地方創生グラフィック大石真史クリムト Dolby Atmos 吉田直樹メイク BEiT StyleGAN-NADA Sonar Music Festival 素材 Canvas DETR ライゾマティクス Projects Spore クリティックネットワーク真鍋大度 OpenAI Japan DeepSeek デノイズ Unity for Industry アクターネットワーク花井裕也 Voice Engine DeepSeek-R1 画像処理 DMLab Ritchie Hawtin Command R+Sentropy GLIDE Control Suite Erica Synth Oracle Cloud Infrastructure Loopy CPU Discord AvatarCLIP Atari 100k Ufuk Barış Mutlu Google Workspace リップシンク Synthetic Data Atari 200M Japanese InstructBLIP Alpha Udio CyberHost CALM Yann LeCun 日本新聞協会立命館大学 OmniHuman-1 プログラミング鈴木雅大 AIいらすとや京都精華大学 CSAM ソースコード生成コンセプトアート AI Picasso TacticAI Imagen 3 GMAI シチズンデベロッパー Sonantic Colie Wertz Emposy NPMP Google Labs GitHub Cohere リドリー・スコット AIタレント FOOH Microsoft Muse ウィザードリィ MCN-AI連携モデル絵コンテ AIタレントエージェンシーゲーム生成モデル Urzas.ai ストーリーボード modi.ai Project Astra WHAMデモンストレーター大阪大学 Google I/O 2024 ChatGPT Edu 西川善司並木幸介 Kiki Blender BitSummit Let’s Go!!滋賀大学サムライスピリッツ森寅嘉 Zoetic AI SIGGRAPH 2021 ペット感情認識キリンビールストリートファイター半導体 Digital Dream Labs PaLM API デジタルレプリカ音声加工桜AIカメラ Topaz Video Enhance AI Cozmo MakerSuite GOT7 マルタ大学 Solist-AI DLSS タカラトミー Skeb synthesia 田中達大ローム山野辺一記 LOVOT Dreambooth-Stable-Diffusion HumanRF 大里飛鳥 Dynamixyz MOFLIN Actors-HQ Move AI ベンチマーク Romi Google Earth SAG-AFTRA ICRA2024 Factorio U-Net ミクシィ GEPPETTO AI WGA Hao AI Lab 13フェイズ構造ユニロボット Stable Diffusion web UI チャーリー・ブルッカー大規模基盤モデルカリフォルニア大学 ADV ユニボ Torobo GamingAgent XLand Gato 岡野原大輔東京ロボティクス AI model 自己教師あり学習インピーダンス制御 Anthropic DEATH STRANDING AI Models In-Context Learning（ICL）深層予測学習 Claude 3.7 Sonnet Eric Johnson 汎用強化学習AI ZMO.AI 日立製作所 Factorio Learning Environment MOBBY’S FLE Oculus Quest コジマプロダクションロンドン芸術大学モビーディック尾形哲也 Deepseek-v3 生体情報デシマエンジン Google Brain ダイビング量子コンピュータ AIREC Gemini-2-Flash Sound Control アウトドア qubit 汎用ロボット Llama-3.3-70B SYNTH SUPER AIスキャニング IBM Quantum System 2 オムロンサイニックエックス GPT-4o-Mini 照明 Maxim Peter Karl Sims 自動採寸 ViLaIn Joshua Romoff Artnome 3DLOOK ダリオ・ヒル PDDL ZOZO NEXT ハイパースケープ ICONATE Sizer ジェン・スン・フアンニューサウスウェールズ大学 ZOZO 山崎陽斗ワコール HuggingFace Claude Sammut Fashion Intelligence System 立木創太スニーカー Stable Audio オックスフォード大学 Partial Visual-Semantic Embedding 浜中雅俊 UNSTREET 宗教 Lars Kunze WEAR ミライ小町 Newelse 仏教杉浦孔明 GPT-4V テスラ福井健策 CheckGoods コカ・コーラ田向権ソイル大学 GameGAN 二次流通食品 VASA-1 Tesla Bot 中古市場 Coca‑Cola Y3000 Zero Sugar VoxCeleb2 AIパズルジェネレーター Tesla AI Day Wikipedia Dupe Killer Copilot Copyright Commitment AniTalker DolphinGemma ソサエティ5.0 Sphere 偽ブランドテラバース上海大学 SIGGRAPH 2020 バズグラフ Xaver 1000 配信京都大学 Wild Dolphin Project ニュースタンテキ養蜂立福寛 SoundStreamトークナイザー東芝 Beewise ソニー・ピクチャーズアニメーション音声解析音声処理技術 DIB-R 倉田宜典フィンテック感情分析 Luma GPT-4.1 投資 Fosters+Partners 周済涛 Dream Machine GPT-4.1 mini 韻律射影 MILIZE Zaha Hadid Architects ステートマシン NTT GPT-4.1 nano 韻律転移三菱UFJ信託銀行ディープニューラルネットワーク Perplexity LINE AI

CGへの扉 Vol.31：人工知能が考える「顔」と、人が考える「顔」

2021.10.14アート

人間はどうやって顔を認識しているのか

人が他人の顔を認識する仕組みは特殊で、ほかの物や形とは異なる脳が使われていることがわかっています。その証拠に、顔を認識する際に使われる脳の部位と、顔画像を上下逆さまにした際に働く脳の部位とは異なるそうです（参照：正常な顔認識に必要な脳内ネットワークを解明）。

人は過去に経験のあるもの、身近なものから認識し始める傾向があります。人は目に入るさまざまな要素の中からとくに「顔」の要素を重点的に認識します。小さな子どもの遊び道具にも顔が描かれていたり、子ども向けアプリのボタンに顔が描かれていたりします。幼い子どもが、街でアンパンマンの絵柄や広告、おもちゃなどをすぐに見つけるなど、顔は人にとって認識しやすく、意識しやすいものなのです。

大人にとっても、コンビニの書架に並んでいる雑誌の表紙はどれもタレントの顔がコチラを向いたものになっており、自然と目が引き寄せられてしまう経験はないでしょうか。逆に目が複数あるモンスターやアート作品等であれば、どこに意識を持っていけば良いのか迷うこともあります。

一方、相貌失認と呼ばれる人の顔をまったく認識できないタイプの人も100人に1人程度存在するそうです。これは、よくある人の顔を覚えるのが苦手といった感じではなく、雰囲気や服装、髭や髪型などなければ人を見分けることができないそう。

人工知能活用に限らず、顔にまつわるテクノロジーはさまざまな場面で活用されています。スマートフォンカメラの顔追従、自販機の年齢確認、空港のセキュリティ、オフィスの入退室ゲート、テーマパークの個人認証、人気のコンサートのチケット転売防止のための本人確認等々、他にも枚挙にいとまがありません。

人工知能や専用のアルゴリズムやテクノロジーを活用した顔認識と顔認証は、よく間違えられますが異なる概念です。顔認識では、画像や映像の中から顔を見つけ出し利用します。顔から性別や年齢、感情などを読み取る場合もあります。顔認証は事前に登録した特定個人の特徴を照合するために用います。パスワード認証や指紋認証、手のひらや指での静脈認証等、生体認証の手段のひとつとして使われます。

コンピュータが顔検出する場合、目（瞳）、鼻の先、口角、頬骨の形、眉毛など、顔の中でも特徴的な部分を検出します。人間の認識ではこれら顔の各部位を全体像として認識しており、よっぽど印象的でない限り個別に眉の形がどんなだったのか、鼻の形がどうなのか、細かく覚えているわけではありません。その証拠に、顔を知っている知人であれば、顔の一部が隠れていても認識できることが多いでしょう。

日本人は目の周辺から表情を読み取り、欧米人は顔全体または口元から表情を読み取る人が多いとされており、コロナ禍におけるマスク生活が素直に受け入れられた理由も、表情をどの部分から読み取るかといった要因も影響しています。

顔の認識の不思議さを感じる体験として、2人の顔を合成した顔画像を作ると、誰と誰が混ざっているのか、わからなくなってしまうという事象があります。またシワが増えたり、髪の色や量が変わっても、目や鼻、口などは基本的にはそう大きくは変わりません。数年以来の友人と街でばったり出会ったり、数十年前のクラスメートを見分けられるのもそういった認識の仕組みに由来するのかもしれません。

人の認識の仕組みとしては、普段よく見る顔から導き出された標準の顔というものがあり、そこからの差分で覚えていると言われています。ですからずっと日本に暮らしている人の場合、日本人やアジア人の顔は見分けられても、欧米人やアフリカ人などを見分けるのが不得意なのもそういった理由が背景にあります。

一方、コンピュータが顔認識、または顔認証する場合、人が顔を見分ける方法とは異なり、人間の画家が似顔絵を描く時の状況に似ているそうです。つまり、目（瞳）の間隔、鼻の形や幅、顎の形、口から顎の先までの長さなど、表情によってあまり左右されない場所が判定に使われています。実装としては顔を100要素から1,000要素程度のベクトル表現に変換し、その距離が近ければ同一人物、離れていれば異なる人物として認識します。また精度を高めるために同じ人が写っている違う写真を大量に学習させ、照明や顔の角度が違っていても、同じ人であれば、どの部分が同一で、同じような照明や顔であっても、どういう部分が異なれば他人なのか、見分けるべき要素を抽出し、事前に正しい顔認識のモデルを作ってしまうアプローチも取られています。

FacebookなどのSNSやGoogle Photos、Appleの写真アプリなど、スマートフォンのツールで「これはあなたですか？」みたいな写真から顔が検知されると、なんだか恐ろしくもあり、間違った結果に笑えたりしつつも、便利に活用していることでしょう。現在ヨーロッパでは、顔認証を利用した遠隔監視の禁止が進められており、今後もプライバシーと利便性のバランスが議論されていくことでしょう。

参照：Use of artificial intelligence by the police: MEPs oppose mass surveillance

例えばAIを活用した嘘発見器iBorderCtrl利用の是非が話題となっている一方、バイアスのかかった認識をしていないことを示すためにEmoPyという顔画像から感情を読み取るツールキットはソースコードをすべて公開しています。ソースコードが公開されているからといってバイアスがかかっていない証明になるかと言うとそうではありません。けれどもブラックボックス的に中身が分からないものに比べ、誰もが調べることができるよう開示されていることはひとつの安心感につながります。

SNSで一般公開されている写真から顔認識用の情報を収集したClearview AI 社が物議を醸し出していることからも単に法律を守ればなんでもして良いのか？ということではありません。顔写真データが本人の知らないところで想定外の使われ方がされていたり、許諾していないと考える用途で再利用されたり、データが勝手に譲渡されたりすることがないよう、データ利用の透明性や、人々の基本的権利を守り、不当な扱いがなされることのないよう配慮し続ける必要があると考えています。

存在しない顔の活用

CGで作られた顔は、シワやシミ、毛穴や傷跡などをリアルに表現することで、現実の人間に近づこうとしています。逆に実在の人間は、顔のシワやシミ、毛穴や傷跡などを除去しようと必死です。

実在の人物の顔であると利用に制限があったり、倫理的に問題の無い方法で大量のデータを収集することが難しかったりするため、人工知能研究や顔認識、顔認証のテスト用として、実在しない顔画像を利用する流れも起きてきています。Datagen社やSynthesis AI社では、研究用に大量の顔画像を生成し、存在しない人物の顔をパラメータで管理し、欲しい属性の顔素材を集めることができるようになっている。

「CGへの扉 Vol.30：SIGGRAPH2021レポート「ディープフェイクとの戦い」」でも紹介した This person does not existでは実在しない顔画像を次々と見ることができます。たまに違和感のある顔画像が出て来る時がありますが、ほとんどの場合見分けはつきません。人間は顔に関しては少しの違和感でも感じ取ることができ、人工知能が勝手に作った顔画像は瞳が歪んでいることから見分けられると言われますが、その判別レベルを凌駕するほどの性能になってきているのが機械学習の現状です。

Which Face is Real?というサイトでは一方が実在の人物の顔写真、もう一方は人工知能が生み出した実在しない人物の顔写真を表示し、どちらの顔がリアル？というクイズを出してきます。ほとんど見分けがつかないですし、答えが合っていても外れていても、どちらも自身があってそう答えているわけではない単なる「感」に頼るしかないのがほとんどの人ではないでしょうか？

この「存在しない…」にはパロディ版とも言える、さまざまな別バージョンが存在します。

存在しない言葉版：https://www.thisworddoesnotexist.com/

存在しない猫版：https://thiscatdoesnotexist.com

存在しない犬版：https://github.com/GuillaumeMougeot/DogFaceNet

存在しない仔馬キャラ版：https://thisponydoesnotexist.net/

存在しない動物キャラ版：https://thisfursonadoesnotexist.com/

存在しないアニメ版：https://thisanimedoesnotexist.ai/
存在しないアニメキャラクタ版：https://www.thiswaifudoesnotexist.net/
（※世界中のアニメ好きが好きなキャラクタのことを「嫁」wife→waifu ということに由来）

これらの生成にはGAN（敵対的生成ネットワーク）や StyleGAN が使われていますが猫と犬、アニメキャラクターでは少しアプローチが違うのが興味深いところです。猫版はKaggle にある9,000匹以上の猫画像のデータセットCat Datasetの一部を元にしました。犬の場合、品種によって目鼻口のバランスが大きく異なることと、犬写真は大抵口を開けてベロを出しているものが多いことから、人間や猫とはまた違った工夫や苦労があったようです。

少し変わったアプローチとしては、一枚の顔写真から「実在しないそっくりな顔」を生成してくれるARTBREEDERという有料サービスが存在します。肖像画風、CDやレコードのアルバムジャケット風、アニメ風キャラクタや、最新の3Dゲームに出てきそうなキャラクタまで様々な加工が可能です。サービスの名前どおり、ペットのブリーダーになった気分で、見た目を華やかにしたり、雰囲気を変更したり、さまざまな要素を細かく掛け合わせていくことができます。

これからの顔認識の役目と重要性

顔認識、顔認証に関する事業ポリシーは企業によって異なります。テクノロジー大手企業の中でもAmazonとMicrosoftには顔認識データを安易に提供しないことを打ち出し、IBMは顔認識事業から撤退することを表明しています。Appleも顔認識のフレームワークを厳重に取り扱っています。顔認識をSNS用途で活用しているFacebookは、その利用ポリシーを明らかにしており、次のように表明しています。

他人になりすましたり、他人の情報を不正に利用することはできないこと
希望により顔認識機能をオフにすることもオンにすることもできること
顔認識によって他人に身元情報が漏れることはないこと
18歳以上のみが顔認識の機能が使えること
顔認識によって個別操作によってタグ付け機能は行われる（手間はかかるが代替手段が提供されていること）

色々とネガティブな面ばかり焦点が当てられがちですが、Facebookの顔認識機能によって視覚障害者も、写真に自分が写っているのかどうかを代替テキストによって知ることができるというテクノロジーの恩恵を受けられる部分もあります。一方、ロシアのSNS VK.com では街中で撮影された写真から、その写真に写っている顔の人物のSNSアカウントを探し出すという機能を設け、物議を醸し出しました。利便性とプライバシーと、世代や文化、個々人によっても考え方が異なるこれらの課題は、今すぐ正解が出るわけではありません。テクノロジーの進化とともに課題として意識していく必要があるのです。

顔は指紋と同じで、よほどでない限り、形や特徴を変更することができません。ですから認証で用いるには十分な配慮と、十分考えられた仕組みが必要なのです。ネットの世界ではIDとパスワードが流出したので、念のため新しいパスワードに付け直すということがありますが、顔認証のコードが盗まれたので、念のため、顔と指紋を付け替える…みたいなことはできないからです。

顔認証や顔認識のテクノロジーから分かるように、人工知能の活用には人間の脳と同じような手順とアプローチが向いているもの、圧倒的なコンピューティングパワーと、機械学習によって、人間の脳とは異なるアプローチでほぼ同じ目的、結果を実現するものと、異なる方法が混在しているのが現状です。すなわち脳の仕組み、構造にはまだまだヒントが隠されているのかもしれないと考えています。

2019年にチューリング賞を受賞した現Googleのジェフリー・ヒントン氏は、ニューラルネットワークの課題を克服し、
次に来るテクノロジーを予測しています。”How to represent part-whole hierarchies in a neural network”（抄訳：ニューラルネットワークにおけるパート・ホール階層の表現方法）という論文の中でGLOM という新モデルを提唱しています（※GLOMは何かの頭文字の略ではなく agglomerate［塊］と口語のglom together［ひっつかんで一緒に並べる］に由来しているそう）。

論文：How to represent part-whole hierarchies in a neural network

GLOMはまだ実装が存在せず、論文の中での議論でしかありませんが、人工知能による様々なアプローチも日々進化し続けており、現在の常識が過去のものになり、新しい考え方や新しい使い方が広がってくるのが興味深いところでもあり大変なところなのかもしれません。

本連載の今後の予定：「CGへの扉」では、単なるAIの話題とは少し異なり、CG/VFX, アートの文脈から話題を切り取り紹介していきます。映像制作の現場におけるAI活用や、AIで価値が高まった先進的なツール、これからの可能性を感じさせるような話題、テクノロジーの話題にご期待ください。何か取り上げて欲しいテーマやご希望などがございましたら、ぜひ編集部までお知らせください。

CGへの扉：

Vol.30：SIGGRAPH2021レポート「ディープフェイクとの戦い」

Vol.29：AIの恩恵を受けるCG研究の世界。#SIGGRAPH2021 論文より

Vol.28：定番手法の他分野応用、自然言語処理AI由来の画像処理AI

Vol.27：眼に追いつけ追い越せ？カメラは機械学習により進化

Vol.26：アートを加速させるAIの役割 #GTC2021 レポート

Vol.25：変幻自在の顔も実は人工知能

Vol.24：自然現象もすべて人工知能で再現する時代

Vol.23：AIで人の眼に進化するカメラ

Vol.22：言葉から画像を生成、DALL-Eはクリエイティブなのか？

Vol.20：Adobeと人工知能の将来を見極める #AdobeMAX2020

Vol.19：コミュニケーションツールの新境地「NVIDIA MAXINE」