モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。

TAG LIST
CGCGへの扉安藤幸央生成AI吉本幸記月刊エンタメAIニュース河合律子機械学習ディープラーニングOpenAIGAN音楽NVIDIAGoogleLLM大規模言語モデルChatGPTグーグル強化学習三宅陽一郎Stable Diffusion森川幸人モリカトロン人工知能学会ニューラルネットワークシナリオDeepMindマイクロソフトQAGPT-3自然言語処理AIと倫理Facebook大内孝子倫理アート映画著作権ルールベースSIGGRAPHゲームプレイAIキャラクターAIスクウェア・エニックス敵対的生成ネットワークモリカトロンAIラボインタビューNPC画像生成NFT音楽生成AIMinecraftロボットDALL-E2StyleGANプロシージャルMidjourneyデバッグファッション自動生成ディープフェイクVFX遺伝的アルゴリズムアニメーション画像生成AIマンガゲームAIAdobeテストプレイ動画生成AIVRメタAIMeta3DCGCLIPテキスト画像生成深層学習CEDEC2019マルチモーダルMicrosoftデジタルツインメタバース不完全情報ゲーム小説ボードゲームDALL-Etoioビヘイビア・ツリーCEDEC2021CEDEC2020作曲ロボティクスナビゲーションAIマインクラフトAIアートメタ畳み込みニューラルネットワークアップルスポーツエージェントGDC 2021Red RamGPT-4手塚治虫汎用人工知能JSAI2022インタビューバーチャルヒューマンNVIDIA OmniverseGDC 2019マルチエージェントCEDEC2022Stability AIARデジタルヒューマン懐ゲーから辿るゲームAI技術史教育ジェネレーティブAISora東京大学はこだて未来大学プロンプト栗原聡CNN3DNeRFマーケティングJSAI2024DALL-E 3BERTMicrosoft Azure高橋力斗UnityOmniverseJSAI2023電気通信大学ELSIPlayable!鴫原盛之HTN階層型タスクネットワークソニーAIQVE ONE世界モデルアドベンチャーゲームJSAI2020GTC2023広告メタデータTensorFlowブロックチェーンCMイベントレポートアストロノーカキャリア模倣学習対話型エージェントAmazonトレーディングカードメディアアートDQN合成音声水野勇太モリカトロン開発者インタビュー宮本茂則Geminiアバターブラック・ジャックUbisoftGenvid TechnologiesガイスターStyleGAN2徳井直生稲葉通将ベリサーブGTC2022GPT-3.5SIGGRAPH ASIAAppleNetflixJSAI2021松木晋祐Bard研究シムピープルMCS-AI動的連携モデルマーダーミステリーモーションキャプチャーTEZUKA2020CEDEC2023AGIテキスト生成インディーゲームElectronic Arts音声合成GDC Summerイーロン・マスクStable Diffusion XL森山和道eスポーツスタンフォード大学アーケードゲームテニスサイバーエージェント音声認識類家利直FireflyeSportsBLUE PROTOCOLCEDEC2024シーマンaiboSIE大澤博隆SFプロトタイピングRunwayRunway Gen-3 Alphaチャットボット自動運転車ワークショップ市場分析Epic GamesAIロボ「迷キュー」に挑戦AWSAdobe MAX村井源クラウド斎藤由多加AlphaZeroPreferred NetworksTransformerGPT-2rinnaAIりんなカメラ環世界中島秀之PaLMGitHub CopilotLLaMA哲学Apple Vision Proハリウッド理化学研究所Gen-1YouTubeSFテキスト画像生成AI松尾豊人事データマイニングControlNet現代アートDARPAドローンシムシティゲームエンジンImagenZorkバイアスASBSぱいどんAI美空ひばり手塚眞バンダイナムコ研究所スパーシャルAIELYZANEDOFSM-DNNMindAgentLEFT 4 DEAD通しプレイ論文OpenAI Five本間翔太馬淵浩希Cygames岡島学Audio2Faceピクサー九州大学プラチナエッグイーサリアム効果音ボエダ・ゴティエビッグデータ中嶋謙互Amadeus Codeデータ分析自動翻訳MILENVIDIA ACEナラティブNVIDIA RivaNianticOmniverse ReplicatorWCCFレコメンドシステムNVIDIA DRIVE SimWORLD CLUB Champion FootballNVIDIA Isaac Simセガ人狼知能柏田知大軍事田邊雅彦Google I/Oトレカ慶應義塾大学Max CooperGPTDisneyPhotoshop言霊の迷宮PyTorch京都芸術大学ChatGPT4モンテカルロ木探索眞鍋和子バンダイナムコスタジオコミコパヒストリアAI Frog Interactive新清士田中章愛銭起揚ComfyUI齊藤陽介コナミデジタルエンタテインメント成沢理恵お知らせMagic Leap OneTencentサッカーバスケットボールTikTokSuno AItext-to-imageサルでもわかる人工知能text-to-3DVAEDreamFusionTEZUKA2023リップシンキングRNNUbisoft La Forge知識表現ウォッチドッグス レギオンVTuberIGDA立教大学秋期GTC2022大阪公立大学フォートナイトKLabどうぶつしょうぎRobloxジェイ・コウガミ音楽ストリーミングMIT野々下裕子Movie GenQosmoマシンラーニング5GMuZeroRival Peakがんばれ森川君2号pixivオムロン サイニックエックスGPTsセキュリティ対話エンジンポケモン3Dスキャン橋本敦史リトル・コンピュータ・ピープルCodexシーマン人工知能研究所コンピューティショナル・フォトグラフィーゴブレット・ゴブラーズ絵画Open AI3D Gaussian SplattingMicrosoft DesignerイラストシミュレーションSoul Machines柿沼太一完全情報ゲームバーチャルキャラクター坂本洋典宮本道人釜屋憲彦LLaMA 2ウェイポイントパス検索Hugging Face対談藤澤仁生物学XRGTC 2022xAI画像認識SiemensストライキStyleCLIPDeNAVoyager長谷洋平GDC 2024クラウドコンピューティングmasumi toyotaIBM宮路洋一OpenSeaGDC 2022SNSTextWorldEarth-2BingMagentaソフトバンク音声生成AIELYZA PencilScenarioSIGGRAPH2023AIピカソGTC2021AI素材.comCycleGANテンセントAndreessen HorowitzQA Tech NightNetHack下田純也桑野範久キャラクターモーション音源分離NBAフェイクニュースユニバーサルミュージックRPG法律Web3SIGGRAPH 2022レベルデザインDreamerV3AIボイスアクターUnreal Engine南カリフォルニア大学NVIDIA CanvasGPUALife人工生命オルタナティヴ・マシンサム・アルトマンサウンドスケープLaMDATRPGマジック:ザ・ギャザリングAI Dungeon介護BitSummitVeoゲーム背景IEEEアパレル不気味の谷ナビゲーションメッシュデザイン写真高橋ミレイ深層強化学習松原仁松井俊浩武田英明フルコトELYZA DIGESTApple IntelligenceWWDCWWDC 2024建築西成活裕ハイブリッドアーキテクチャAI野々村真Apex LegendsELIZA群衆マネジメントライブポートレイトNinjaコンピュータRPGライブビジネスWonder StudioAdobe Max 2023GPT-4-turboアップルタウン物語新型コロナ土木佐藤恵助KELDIC周済涛BIMBing Chat大道麻由メロディ言語清田陽司インフラBing Image Creator物語構造分析ゲームTENTUPLAYサイバネティックス慶応義塾大学MARVEL Future FightAstro人工知能史Amazon BedrockAssistant with Bard渡邉謙吾タイムラプスEgo4DAI哲学マップThe Arcadeここ掘れ!プッカバスキア星新一X.AISearch Generative Experienceくまうた日経イノベーション・ラボStyleGAN-XLX Corp.Dynalang濱田直希敵対的強化学習StyleGAN3TwitterVLE-CE大柳裕⼠階層型強化学習GOSU Data LabGANimatorXホールディングス加納基晴WANNGOSU Voice AssistantVoLux-GANMagiAI Actソニー・インタラクティブエンタテインメント竹内将SenpAI.GGProjected GANEU研究開発事例MobalyticsSelf-Distilled StyleGANSDXLArs Electronica赤羽進亮ニューラルレンダリングRTFKTAI規制遊戯王AWS SagemakerPLATONIKE欧州委員会UDI(Universal Duel Interface)映像セリア・ホデント形態素解析frame.ioClone X欧州議会第一工科大学UXAWS LambdaFoodly村上隆欧州理事会佐竹空良誤字検出MusicLM小林篤史認知科学中川友紀子Digital MarkAudioLMゲームデザインSentencePieceアールティSnapchatMusicCaps荻野宏実LUMINOUS ENGINEクリエイターコミュニティAudioCraft伊藤黎Luminous ProductionsBlenderBot 3バーチャルペットビヘイビアブランチパターン・ランゲージ竹村也哉Meta AINVIDIA NeMo ServiceMubertWPPちょまどマーク・ザッカーバーグヴァネッサ・ローザMubert RenderGeneral Computer Control(GCC)GOAPWACULVanessa A RosaGen-2CradleAdobe MAX 2021陶芸Runway AI Film FestivalSpiral.AIPlay.htPreVizItakoLLM-7b音声AI静岡大学AIライティングLiDARCharacter-LLM明治大学Omniverse AvatarAIのべりすとPolycam復旦大学北原鉄朗FPSQuillBotdeforumChat-Haruhi-Suzumiya中村栄太マルコフ決定過程NVIDIA MegatronCopysmith涼宮ハルヒ日本大学NVIDIA MerlinJasperハーベストEmu VideoヤマハNVIDIA MetropolisForGames前澤陽パラメータ設計ゲームマーケットペリドット増田聡バランス調整岡野翔太Dream Track採用協調フィルタリング郡山喜彦Music AI ToolsSakana AIテキサス大学ジェフリー・ヒントンLyria科学史Google I/O 2023Yahoo!知恵袋AIサイエンティストAlphaDogfight TrialsAI Messenger VoicebotインタラクティブプロンプトAITerraエージェントシミュレーションOpenAI Codex武蔵野美術大学AI OverviewStarCraft IIHyperStyleBingAI石渡正人電通Future of Life InstituteRendering with Style手塚プロダクションAICO2Intel林海象BitSummit DriftLAIKADisneyリサーチヴィトゲンシュタイン古川善規RotomationGauGAN論理哲学論考Lightroom大規模再構成モデルOmega CrafterGauGAN2CanvaLRMSPACE INVADIANSドラゴンクエストライバルズ画像言語表現モデルObjaverse西島大介不確定ゲームSIGGRAPH ASIA 2021PromptBaseBOOTHMVImgNet吉田伸一郎Dota 2ディズニーリサーチpixivFANBOXOne-2-3-45SIGGRAPH2024Mitsuba2バンダイナムコネクサス虎の穴3DガウシアンスプラッティングMotion-I2VソーシャルゲームEmbeddingワイツマン科学研究所ユーザーレビューFantiaワンショット3D生成技術ByteDanceGTC2020CG衣装mimicとらのあなToonify3DNVIDIA MAXINEVRファッションBaidu集英社FGDC生成対向ネットワーク淡路滋ビデオ会議ArtflowERNIE-ViLG少年ジャンプ+Future Game Development Conference拡散モデルグリムノーツEponym古文書ComicCopilot佐々木瞬Diffusionゴティエ・ボエダ音声クローニング凸版印刷Gautier Boeda階層的クラスタリングGopherAI-OCRゲームマスターうめ画像判定Inowrld AI小沢高広Julius鑑定ラベル付けMODAniqueドリコムTPRGOxia PalusGhostwriter中村太一ai andバーチャル・ヒューマン・エージェントtoio SDK for UnityArt RecognitionSkyrimエグゼリオSaaSクーガー実況パワフルサッカースカイリムCopilotインサイト石井敦NHC 2021桃太郎電鉄RPGツクールMZカスタマーサポート茂谷保伯池田利夫桃鉄ChatGPT_APIMZserial experiments lainComfyUI-AdvancedLivePortraitGDMC新刊案内パワサカダンジョンズ&ドラゴンズAI lainGUIマーベル・シネマティック・ユニバースOracle RPGPCGMITメディアラボMCU岩倉宏介深津貴之PCGRLアベンジャーズPPOxVASynthDungeons&DragonsVideo to Videoマジック・リープDigital DomainMachine Learning Project CanvasLaser-NVビートルズiPhone 16MagendaMasquerade2.0国立情報学研究所ザ・ビートルズ: Get BackOpenAI o1ノンファンジブルトークンDDSPフェイシャルキャプチャー石川冬樹MERFDemucsAIスマートリンクスパコンAlibaba音楽編集ソフトシャープ里井大輝KaggleスーパーコンピュータVQRFAdobe Auditionウェアラブル山田暉松岡 聡nvdiffreciZotopeCE-LLMAssassin’s Creed OriginsAI会話ジェネレーターTSUBAME 1.0NeRFMeshingRX10Communication Edge-LLMSea of ThievesTSUBAME 2.0LERFMoisesLINEヤフーGEMS COMPANYmonoAI technologyLSTMABCIマスタリングAIペットモリカトロンAIソリューション富岳レベルファイブYahoo!ニュース初音ミクOculusコード生成AISociety 5.0リアム・ギャラガーAI Comic Factory転移学習テストAlphaCode夏の電脳甲子園グライムスKaKa CreationAI comic GeneratorBaldur's Gate 3Codeforces座談会BoomyVOICEVOXComicsMaker.aiCandy Crush Saga自己増強型AIジョン・レジェンドGenie AILlamaGen.aiSIGGRAPH ASIA 2020COLMAPザ・ウィークエンドSIGGRAPH Asia 2023GAZAIADOPNVIDIA GET3DドレイクC·ASEFlame PlannerデバッギングBigGANGANverse3DFLARE動画ゲーム生成モデルMaterialGANダンスDOOMグランツーリスモSPORTAI絵師エッジワークスMagicAnimateGameNGenReBeLグランツーリスモ・ソフィーUGC日本音楽作家団体協議会Animate AnyoneVirtuals ProtocolGTソフィーPGCFCAインテリジェントコンピュータ研究所スーパーマリオブラザーズVolvoFIAグランツーリスモチャンピオンシップVoiceboxアリババMarioVGGNovelAIさくらインターネットDreaMoving社員インタビューRival PrakDGX A100NovelAI DiffusionVISCUIT松原卓二ぷよぷよScratchArt Transfer 2ユービーアイソフトWebcam VTuberモーションデータスクラッチArt Selfie 2星新一賞ビスケットMusical Canvas北尾まどかHALOポーズ推定TCGプログラミング教育The Forever Labyrinth将棋メタルギアソリッドVメッシュ生成Refik AnadolFSMメルセデス・ベンツQRコードVALL-EAlexander RebenMagic Leap囲碁Deepdub.aiRhizomatiksナップサック問題Live NationEpyllionデンソーAUDIOGENMolmo汎用言語モデルWeb3.0マシュー・ボールデンソーウェーブEvoke MusicPixMoAIOpsムーアの法則原昌宏AutoFoleyQwen2 72BSpotifyスマートコントラクト日本機械学会Colourlab.AiDepth ProReplica Studioロボティクス・メカトロニクス講演会ディズニーamuseChitrakarAdobe MAX 2022トヨタ自動車Largo.aiVARIETAS巡回セールスマン問題かんばん方式CinelyticAI面接官ジョルダン曲線メディアAdobe ResearchTaskadeキリンホールディングス政治Galacticaプロット生成Pika.art空間コンピューティングクラウドゲーミングAI Filmmaking AssistantDream Screen和田洋一リアリティ番組映像解析FastGANSynthIDStadiaジョンソン裕子4コママンガAI ScreenwriterFirefly Video ModelMILEsNightCafe東芝デジタルソリューションズ芥川賞Stable Video 4Dインタラクティブ・ストリーミングLuis RuizSATLYS 映像解析AI文学AI受託開発事例インタラクティブ・メディア恋愛田中志弥PFN 3D ScanElevenLabsタップルPlayable!3D東京工業大学HeyGenAbema TVPlayable!MobileLudo博報堂After EffectsNECAdobe MAX 2024ラップPFN 4D Scan絵本木村屋SneaksSIGGRAPH 2019ArtEmisZ世代DreamUp出版GPT StoreIllustratorAIラッパーシステムDeviantArtAmmaar Reshi生成AIチェッカーMeta Quest 3Waifu DiffusionStoriesユーザーローカルXR-ObjectsGROVERプラスリンクス ~キミと繋がる想い~元素法典StoryBird九段理江PeridotFAIRSTCNovel AIVersed東京都同情塔Orionチート検出Style Transfer ConversationProlificDreamer防犯オンラインカジノRCPUnity Sentis4Dオブジェクト生成モデルO2RealFlowRinna Character PlatformUnity MuseAlign Your GaussiansScam DetectioniPhoneCALACaleb WardAYGLive Threat DetectionDeep Fluids宮田龍MAV3D乗換NAVITIMEMeInGameAmelia清河幸子ファーウェイAIGraphブレイン・コンピュータ・インタフェース西中美和4D Gaussian SplattingBCIGateboxアフォーダンス安野貴博4D-GSLearning from VideoANIMAKPaLM-SayCan斧田小夜Glaze予期知能逢妻ヒカリWebGlazeセコムNightShadeユクスキュルバーチャル警備システムCode as PoliciesSpawningカント損保ジャパンCaPHave I Been Trained?CM3leonFortnite上原利之Stable DoodleUnreal Editor For FortniteドラゴンクエストエージェントアーキテクチャアッパーグラウンドコリジョンチェックT2I-AdapterPAIROCTOPATH TRAVELER西木康智VolumetricsOCTOPATH TRAVELER 大陸の覇者山口情報芸術センター[YCAM]AIワールドジェネレーターアルスエレクトロニカ2019品質保証YCAM日本マネジメント総合研究所Rosebud AI GamemakerStyleRigAutodeskアンラーニング・ランゲージLayer逆転オセロニアBentley Systemsカイル・マクドナルドLily Hughes-RobinsonCharisma.aiワールドシミュレーターローレン・リー・マッカーシーColossal Cave Adventure奥村エルネスト純いただきストリートH100鎖国[Walled Garden]​​プロジェクトAdventureGPT調査齋藤精一大森田不可止COBOLSIGGRAPH ASIA 2022リリー・ヒューズ=ロビンソンMeta Quest高橋智隆DGX H100VToonifyBabyAGIIPロボユニザナックDGX SuperPODControlVAEGPT-3.5 Turbo泉幸典仁井谷正充変分オートエンコーダーカーリング強いAIロボコレ2019Instant NeRFフォトグラメトリウィンブルドン弱いAIartonomous回帰型ニューラルネットワークbitGANsDeepJoin戦術分析ぎゅわんぶらあ自己中心派Azure Machine LearningAzure OpenAI Serviceパフォーマンス測定Lumiere意思決定モデル脱出ゲームDeepLIoTUNetHybrid Reward Architectureコミュニティ管理DeepL WriteProFitXImageFXウロチョロスSuper PhoenixWatsonxMusicFXProject MalmoオンラインゲームAthleticaTextFX気候変動コーチングProject Paidiaシンギュラリティ北見工業大学KeyframerProject Lookoutマックス・プランク気象研究所レイ・カーツワイル北見カーリングホールWatch Forビョルン・スティーブンスヴァーナー・ヴィンジ画像解析Gemini 1.5気象モデルRunway ResearchじりつくんAI StudioLEFT ALIVE気象シミュレーションMake-A-VideoNTT SportictVertex AI長谷川誠ジミ・ヘンドリックス環境問題PhenakiAIカメラChat with RTXBaby Xカート・コバーンエコロジーDreamixSTADIUM TUBESlackロバート・ダウニー・Jr.エイミー・ワインハウスSDGsText-to-ImageモデルPixelllot S3Slack AIPokémon Battle Scopeダフト・パンクメモリスタAIスマートコーチポケットモンスターGlenn MarshallkanaeruThe Age of A.I.Story2Hallucination音声変換Latitude占いレコメンデーションJukeboxDreambooth行動ロジック生成AIVeap Japanヤン・ルカンConvaiEAPneoAIPerfusionNTTドコモSIFT福井千春DreamIconニューラル物理学EmemeDCGAN医療mign毛髪GenieMOBADANNCEメンタルケアstudiffuse荒牧英治汎用AIエージェントハーバード大学Edgar Handy中ザワヒデキAIファッションウィーク研修デューク大学大屋雄裕インフルエンサー中川裕志Grok-1mynet.aiローグライクゲームAdreeseen HorowitzMixture-of-Experts東京理科大学NVIDIA Avatar Cloud EngineMoE人工音声NeurIPS 2021産業技術総合研究所Replica StudiosClaude 3リザバーコンピューティングSmart NPCsClaude 3 Haikuプレイ動画ヒップホップ対話型AIモデルRoblox StudioClaude 3 SonnetソニーマーケティングPromethean AIClaude 3 Opusサイレント映画もじぱnote森永乳業環境音暗号通貨note AIアシスタントMusiioC2PAFUZZLEKetchupEndelゲーミフィケーションAlterationAI NewsTomo Kihara粒子群最適化法Art SelfiePlayfool進化差分法オープンワールドArt TransferSonar遊び群知能下川大樹AIFAPet PortraitsSonar+D​​tsukurunウィル・ライト高津芳希P2EBlob Opera地方創生大石真史クリムトDolby Atmos吉田直樹BEiTStyleGAN-NADASonar Music Festival素材DETRライゾマティクスSIMASporeクリティックネットワーク真鍋大度OpenAI JapanデノイズUnity for Industryアクターネットワーク花井裕也Voice Engine画像処理DMLabRitchie HawtinCommand R+SentropyGLIDEControl SuiteErica SynthOracle Cloud InfrastructureCPUDiscordAvatarCLIPAtari 100kUfuk Barış MutluGoogle WorkspaceSynthetic DataAtari 200MJapanese InstructBLIP AlphaUdioCALMYann LeCun日本新聞協会立命館大学プログラミング鈴木雅大AIいらすとや京都精華大学ソースコード生成コンセプトアートAI PicassoTacticAIGMAIシチズンデベロッパーSonanticColie WertzEmposyNPMPGitHubCohereリドリー・スコットAIタレントFOOHウィザードリィMCN-AI連携モデル絵コンテAIタレントエージェンシーGPT-4oUrzas.aiストーリーボードmodi.aiProject Astra大阪大学Google I/O 2024西川善司並木幸介KikiBlenderBitSummit Let’s Go!!Gemma 2サムライスピリッツ森寅嘉Zoetic AIゼビウスSIGGRAPH 2021ペット感情認識ストリートファイター半導体Digital Dream LabsPaLM APIデジタルレプリカ音声加工Topaz Video Enhance AICozmoMakerSuiteGOT7マルタ大学DLSSタカラトミーSkebsynthesia田中達大山野辺一記NetEaseLOVOTDreambooth-Stable-DiffusionHumanRFInworld AI大里飛鳥DynamixyzMOFLINActors-HQMove AIRomiGoogle EarthSAG-AFTRAICRA2024U-NetミクシィGEPPETTO AIWGA13フェイズ構造ユニロボットStable Diffusion web UIチャーリー・ブルッカー大規模基盤モデルADVユニボPoint-EToroboXLandGato岡野原大輔東京ロボティクスAI model自己教師あり学習インピーダンス制御DEATH STRANDINGAI ModelsIn-Context Learning(ICL)深層予測学習Eric Johnson汎用強化学習AIZMO.AILoRA日立製作所MOBBY’Sファインチューニング早稲田大学Oculus Questコジマプロダクションロンドン芸術大学モビーディックグランツーリスモ尾形哲也生体情報デシマエンジンGoogle Brainダイビング量子コンピュータAIRECSound Controlアウトドアqubit汎用ロボットSYNTH SUPERAIスキャニングIBM Quantum System 2オムロンサイニックエックス照明Maxim PeterKarl Sims自動採寸北野宏明ViLaInJoshua RomoffArtnome3DLOOKダリオ・ヒルPDDLハイパースケープICONATESizerジェン・スン・フアンニューサウスウェールズ大学山崎陽斗ワコールHuggingFaceClaude Sammut立木創太スニーカーStable Audioオックスフォード大学浜中雅俊UNSTREET宗教Lars Kunzeミライ小町Newelse仏教杉浦孔明テスラ福井健策CheckGoodsコカ・コーラ田向権GameGAN二次流通食品VASA-1パックマンTesla Bot中古市場Coca‑Cola Y3000 Zero SugarVoxCeleb2Tesla AI DayWikipediaDupe KillerCopilot Copyright CommitmentAniTalkerソサエティ5.0Sphere偽ブランドテラバース上海大学SIGGRAPH 2020バズグラフXaver 1000配信京都大学ニュースタンテキ養蜂立福寛東芝Beewiseソニー・ピクチャーズ アニメーション音声解析DIB-R倉田宜典フィンテック感情分析Luma投資Fosters+Partners周 済涛Dream Machine韻律射影MILIZEZaha Hadid ArchitectsステートマシンNTT韻律転移三菱UFJ信託銀行ディープニューラルネットワークPerplexity

CGへの扉 Vol.28:定番手法の他分野応用、自然言語処理AI由来の画像処理AI

2021.7.16アート

CGへの扉 Vol.28:定番手法の他分野応用、自然言語処理AI由来の画像処理AI

そもそも「応用」とは何か?

あるテクノロジーを対象に「応用すべき」とか「応用の余地がある」などと言いますが、実際のところ「応用」とは何を示すのでしょう。もちろん目も覚めるような今までに無かった新テクノロジーは魅力的ですが、世の中のテクノロジーすべてがそのような新規性の塊ではありません。実用化されているさまざまなテクノロジーは「応用」の賜物であり、原理や知識を現実的な事柄、または他分野の事柄にあてはめて利用することを一般的に「応用」と呼んでいます。

○○シェアやサブスクリプション(定期購買)といった、最近の流行りで新しいと思えるサービスも、実は他分野からすれば古くからあったサービス形態かもしれません。例えば一般の仕事場に設置し、100円入れると1個好きな時に自由にお菓子を持っていける「オフィスグリコ」も「富山の薬売り」のビジネスモデルを模倣したものです。

富山の薬売りは家庭用常備薬のつまった箱を個人の家に置いていき、その時点では費用はかからず、次に来た時に使った薬の分だけの費用を徴収するという仕組みです。もちろん、人工知能研究の多くのブレイクスルーも、脳の原理や仕組みを参考にコンピュータ上のアルゴリズムにあてはめ、それらが成果となって、現在のAI研究、AI実装が広がっています。

CGへの扉 Vol.22:言葉から画像を生成、DALL-Eはクリエイティブなのか?」でも取り上げた OpenAI社の GPT-3 も、その前身となる GPT-2 は自然言語処理のモデルとして文章生成に長けた用途で注目を浴び、画像生成に応用したことで、さらに大きな注目を集めました。GPT-2 の画像応用例のひとつであるImageGPTでは画像の半分を用意すれば、残りの半分を AI が補ってくれるというわかりやすい応用例が示されたことも話題性のひとつでした。

ソースコード共有サービス GitHub が大量のソースコードから学習し、プログラミング中のソースコードに適切なコメント文とソースコードの最初の部分を書き始めると、続きの適切なソースコードを補完してくれるサービス “GitHub Copilot” を発表しました。Copilotの内部実装や学習モデルがどうなっているのかは不明ですが、Copilotの開発には GPT-2,3 の OpenAI社が関係しており、ソースコード用途に特化した、GPT-2,3の応用例とも言える、仕組みやアプローチも似通ったものではないかと予想されます。

CLIPDraw:事前学習の必要がない、文章から画像を描く仕組み

文章から画像生成 CLIPDrawの描画例

論文:https://arxiv.org/pdf/2106.14843.pdf
ソースコード:https://colab.research.google.com/github/kvfrans/clipdraw/blob/main/clipdraw.ipynb
論文の筆頭著者 Kevin Frans氏による解説:https://kvfrans.com/clipdraw-exploring-text-to-drawing-synthesis/

論文の筆頭著者 Kevin Frans氏によるストロークの繰り返しの説明動画

CLIPDrawは、クロスコンパス社、米国マサチューセッツ工科大学、東京工業大学、東京大学の共同研究チームによる、事前学習を必要とせずに文章から絵を描くAI活用のアルゴリズムです。人間は言葉による豊かな風景描写、状況説明に長けており、文章だけで構成される小説を読んで、そこで描かれている風景をとても具体的に想像したり、また逆に一度見ただけの風景や状況を言葉で人に伝えることができたりします。言葉から描画したり、描画したものを言葉で説明したり、まったく同じ、完璧な再現は無理かもしれませんが、言葉と描くものとが人間の理解する仕組みの中で、重要な役目を果たしているのは確かです。

CLIPDraw は OpenAI社から公開されているCLIPをベースとしています。CLIPでは事前の学習なしで、写真画像の説明として適切なものを単語1つまたは数語の言葉からパラメータ評価することができました。CLIPDrawでは勾配降下法を用い、最初はまったくランダムな描画から始まり、ストローク(描画の軌跡)を変化させつつ描いた画像をCLIPで評価し、評価が高いものに合わせるよう描く線のパラメータを微調整します。その描画と評価を数百回繰り返すという反復的な方法を用い、文章に書かれた内容を理解したかのような絵を描いていくことができます。

CLIPDrawで文章から描画を繰り返し調整していく流れ

CLIPDrawではさらに、形や雰囲気といった描き方に加えて「スタイル」という要素もあわせ持っています。例えば指定の言葉の中に「3Dレンダリング」などの言葉を含めると、CGで作られたワイヤーフレーム画像のような、それっぽい画像が生成されるそうです。

CLIPDrawで描かれた様々な説明文による猫。一番右は「3Dワイヤーフレームモデルの猫」

正直200回から500回も繰り返して最適化された描画も、確かに猫や馬、飛行機などとギリギリ読み取れるくらいの絵で、子どもの落書き程度にしか見えません。けれども子供の落書きも数か月、数年の成長で驚くほど精彩で正確なものに、時には芸術性が評価されるようなものにまで進化することを考えると、AIが描画の腕を磨く過程は、これから見逃せないものになるのかもしれません。

CLIPDrawを使い、さまざまな言葉を与えてAIに描かせることで、人間でさえも表現が難しい、AIが導き出した「幸福」や「不幸」といった表現しづらい概念を、どう絵で表現できるかにも興味が湧いてくることでしょう。

BEiTの登場。画像処理版のBERT

1枚の画像に複数のオブジェクトが写っている場合も、分離して示すことができる

論文:https://arxiv.org/pdf/2106.08254.pdf

BEiT(Bidirectional Encoder representation from Image Transformers)は Microsoft Researchの研究で、自然言語処理で注目を浴びているBERT(Bidirectional Encoder Representations from Transformers)の考え方を画像に応用したものです。

BERTの特徴である、自己教師あり事前学習モデルの利点を、画像処理にも活かしたのが BEiT です。機械学習の学習データとして用いられる「教師ありデータ」とは、人間が目視と手動で判別ラベルをつけたデータのことで、この種のデータを膨大に事前学習して機械学習の精度を高めます。しかしこの手法の場合人間が判別したラベルに間違いが含まれる場合があることと、正確なデータを膨大とも言える必要な量を用意することが困難なため、AIの実用においておおきな課題になっていました。

BERTを既存研究と比較した時のブレイクスルーは、自己教師学習を可能にした点です。これは言葉通り、自分自身を教師として学ぶことができる仕組みです。例えば、ある単語の次に出現する頻度の高い単語を学習するには、大量の文章データから事前にAI自身が文章の中から単語が欠けた問題と正しい文章を参照した正答を用意し、人の手を借りずとも、大量に学習していける点にあります。

これと同じ考えで、画像処理においてもわざと画像の一部を欠けさせたり、画像の解像度を落とした問題を作り、元画像を正答とすることで、画像処理においても自己教師あり事前学習モデルを実現させることができると考えられます。ところが定型文や言い回しがある程度決まっている文章とは異なり、画像の場合は一部が欠けていても、その穴を埋める画像は無限に存在することが考えられます。

BEiTが行なったアプローチは MIM(Masked Image Modeling)と呼ばれる事前学習の方法です。これは学習対象となる画像を画素ごとに16×16ピクセルサイズのグリッド分割したものと、画像の特徴点を数字(Visual Token)で表現するTokenizerと数字(Visual Token)から画像に戻すDecoderを組み合わせます。画像の一部がランダムに欠けたものから元のVisual Tokenが得られるよう学習を繰り返すことで画像処理においても自己教師あり事前学習モデルを実現しています。ちなみに論文によるとVisual Tokenの生成手法は、OpenAIのDALL-E で使われている手法が応用しているもよう。

Facebook DETR 自然言語処理の手法を応用した物体検出

Facebook DETRによって検知された物体。100%の精度で象とシマウマが検出されている

論文:https://arxiv.org/pdf/2005.12872.pdf
Facebook AI の紹介ページ:https://ai.facebook.com/blog/end-to-end-object-detection-with-transformers/
ソースコード:https://github.com/facebookresearch/detr
解説動画:https://www.youtube.com/watch?v=T35ba_VXkMY

Facebook のAI研究チームが発表した2020年5月に発表した物体検出モデルDETRも、自然言語処理の方法を応用したものです。DETRは従来手法よりも高速化された手法で、ある物体の近くには、一緒にある物体が存在する可能性が高いといった文脈を理解して物体検知するのも特徴です。自然言語処理(NLP:Natural Language Processing)の世界のブレイクスルーであった Transformer モデルを物体検出に応用した事例です。

従来型の手法に比べ、Transformerの利点の一つに並列処理が可能な点があります。けれども画像検出にまつわる処理も逐次型のため、この Transformer の利点が活かしにくい分野ではありました。従来型の画像検出の手順としては、画像から物体を検出し、その後に何が写っているのかを分類し段階的に判別する必要がありました。

DETRでは画像から物体を場所と大きさを検知するとともに、画像に写っている物体同士の関係性を利用し、つながりのあるデータ群だと考えることによって Transformer の並列処理の利点を享受できるようになりました。例えばある写真に猫が写っているとすると、もうひとつ同じくらいの物体が存在すれば、それがもう一匹の猫である可能性が高く、猫よりも大きな物体が存在すれば、それは飼い主である人間が写っている可能性が高いといった写真ならではの関係性です。

DERTの推論の流れ

まずは元となる画像を CNN(Convolutional Neural Network) に入力します。これによって特徴マップが生成されます。そこで生成された特徴マップを Transformer encoder-decoder に入力します。そうすると画像に写っているオブジェクトの個数、位置、サイズといった情報が得られます。得られた結果から “no object” となる物体として認識されなかったものを除外すると、画像全体の物体検出が完了します。

これからのAIの応用と成熟

元任天堂のゲーム開発者、横井軍平氏の著書『横井軍平ゲーム館』には「枯れた技術の水平思考」という考え方について書かれています。これは、すでに広く使われ、メリットやデメリットが明らかになっている技術をさまざまな分野に応用することで、今までになかったような使い道を生み出し、安価で安定した最大限の成果を得るという考え方です。決して古い技術を誉めたたえようという意味ではありません。

エンジニア気質が強い人や、研究志向の人であれば、常に最新技術を追い求め、独自性やオリジナリティを重視する状況もあるかもしれません。けれども今回紹介したテクノロジーや、人工知能の世界で話題になるテクノロジーは、何も目新しいものばかりではなく、旧来からあるテクノロジーを応用し、圧倒的な物量で驚くべき応用と成果を導き出していることが見受けられます。

また既存技術の組み合わせによって、あらたな応用例や現実的な用途に役立つ道筋を見出しているものも注目されています。そう考えると、これから話題になるであろう人工知能を応用するためのヒントは、そこここに転がっているのだと考えられるかもしれません。

本連載の今後の予定:「CGへの扉」では、単なるAIの話題とは少し異なり、CG/VFX, アートの文脈から話題を切り取り紹介していきます。映像制作の現場におけるAI活用や、AIで価値が高まった先進的なツール、これからの可能性を感じさせるような話題、テクノロジーの話題にご期待ください。何か取り上げて欲しいテーマやご希望などがございましたら、ぜひ編集部までお知らせください。

CGへの扉

Vol.27:眼に追いつけ追い越せ? カメラは機械学習により進化

Vol.26:アートを加速させるAIの役割 #GTC2021 レポート

Vol.25:変幻自在の顔も実は人工知能

Vol.24:自然現象もすべて人工知能で再現する時代

Vol.23:AIで人の眼に進化するカメラ

Vol.22:言葉から画像を生成、DALL-Eはクリエイティブなのか?

Vol.21:人工知能+3DCGの最新論文をまとめて紹介 #SIGGRAPHAsia2020

Vol.20:Adobeと人工知能の将来を見極める #AdobeMAX2020

Vol.19:コミュニケーションツールの新境地「NVIDIA MAXINE」

Vol.18:SIGGRAPH2020レポート 映像制作の現場で活躍する人工知能

Vol.17:描画を進化させるTensorFlow Graphicsの真価

Vol.16:バーチャル開催SIGGRAPH論文を先取り

≫≫すべてのバックナンバーはこちらから

Contributor:安藤幸央

RELATED ARTICLE関連記事

CGへの扉 Vol.62:AIによるフェイク画像さえも新しい表現方法に

2024.5.20アート

CGへの扉 Vol.62:AIによるフェイク画像さえも新しい表現方法に

CGへの扉 Vol.33:AIの必然性 #SIGGRAPHAsia2021 レポート

2021.12.24アート

CGへの扉 Vol.33:AIの必然性 #SIGGRAPHAsia2021 レホ...

【JSAI2020】AI美空ひばりとAI手塚治虫が社会へ投げかけた未来像

2020.6.30アート

【JSAI2020】AI美空ひばりとAI手塚治虫が社会へ投げかけた未来像

RANKING注目の記事はこちら