モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。

TAG LIST
CGCGへの扉安藤幸央機械学習月刊エンタメAIニュースディープラーニング河合律子生成AI吉本幸記OpenAIGAN音楽NVIDIAGoogle強化学習三宅陽一郎ChatGPTニューラルネットワークStable Diffusionグーグル森川幸人シナリオDeepMindQA大規模言語モデル人工知能学会GPT-3自然言語処理マイクロソフトFacebook大内孝子AIと倫理映画著作権アート倫理モリカトロンキャラクターAI敵対的生成ネットワークルールベースLLMSIGGRAPHゲームプレイAIスクウェア・エニックスモリカトロンAIラボインタビュー画像生成NPCNFTプロシージャルMidjourneyデバッグMinecraftDALL-E2StyleGAN遺伝的アルゴリズム画像生成AIロボットファッション音楽生成AI自動生成VFXAdobeテストプレイメタAIアニメーションテキスト画像生成深層学習CEDEC2019ディープフェイクデジタルツインメタバースVR小説ボードゲームDALL-ECLIPビヘイビア・ツリーマンガCEDEC2021CEDEC2020ゲームAI不完全情報ゲームナビゲーションAI畳み込みニューラルネットワークtoioGDC 2021JSAI2022バーチャルヒューマン作曲MicrosoftNVIDIA OmniverseGDC 2019マルチエージェントCEDEC2022MetaマインクラフトAIアート3DCGStability AIメタデジタルヒューマン懐ゲーから辿るゲームAI技術史ジェネレーティブAIスポーツエージェントプロンプト栗原聡手塚治虫汎用人工知能CNNNeRFDALL-E 3BERTロボティクスUnityOmniverseJSAI2023鴫原盛之教育HTN階層型タスクネットワークソニーGPT-4マルチモーダルJSAI2020GTC20233DTensorFlowインタビューブロックチェーンイベントレポート対話型エージェントAmazonメディアアートDQN水野勇太アバターUbisoftGenvid TechnologiesガイスターStyleGAN2ARELSIGTC2022SIGGRAPH ASIANetflixJSAI2021東京大学はこだて未来大学Bard研究シムピープルMCS-AI動的連携モデルRed RamモーションキャプチャーTEZUKA2020CEDEC2023テキスト生成インディーゲームElectronic Arts音声合成マーケティングメタデータGDC Summerイーロン・マスクStable Diffusion XLCMMicrosoft Azureアストロノーカキャリア模倣学習動画生成AIeスポーツスタンフォード大学アーケードゲームテニスサイバーエージェントトレーディングカード音声認識類家利直eSportsBLUE PROTOCOLシーマンaibo合成音声チャットボットブラック・ジャックEpic GamesAIロボ「迷キュー」に挑戦AWS徳井直生クラウド斎藤由多加AlphaZeroTransformerGPT-2rinnaAIりんなカメラ環世界中島秀之PaLM哲学ベリサーブPlayable!GPT-3.5ハリウッド理化学研究所Gen-1SoraSFテキスト画像生成AI松尾豊データマイニング現代アートDARPAドローンシムシティゲームエンジンImagenZorkバイアスマーダーミステリーASBSぱいどんアドベンチャーゲームAI美空ひばりAGI手塚眞バンダイナムコ研究所スパーシャルAIELYZANEDOFSM-DNNLEFT 4 DEAD通しプレイ論文OpenAI Five本間翔太馬淵浩希Cygames森山和道Audio2Faceピクサープラチナエッグイーサリアム効果音ボエダ・ゴティエビッグデータ中嶋謙互Amadeus Codeデータ分析MILENVIDIA ACEナラティブNVIDIA RivaOmniverse ReplicatorWCCFレコメンドシステムNVIDIA DRIVE SimWORLD CLUB Champion FootballNVIDIA Isaac Simセガ柏田知大軍事田邊雅彦トレカMax CooperGPTDisneyFireflyPyTorchChatGPT4眞鍋和子バンダイナムコスタジオヒストリアAI Frog Interactive新清士SIE大澤博隆SFプロトタイピング齊藤陽介お知らせMagic Leap OneTencentモリカトロン開発者インタビュー宮本茂則バスケットボールGeminiTikToktext-to-imageサルでもわかる人工知能text-to-3DVAEDreamFusionTEZUKA2023リップシンキングRNNUbisoft La Forge自動運転車ワークショップ知識表現ウォッチドッグス レギオンVTuberIGDA立教大学秋期GTC2022市場分析フォートナイトどうぶつしょうぎRobloxジェイ・コウガミ音楽ストリーミングMIT野々下裕子Adobe MAXマシンラーニング村井源5GMuZeroRival Peakpixivオムロン サイニックエックスGPTs電気通信大学対話エンジン稲葉通将ポケモン3Dスキャン橋本敦史リトル・コンピュータ・ピープルCodexシーマン人工知能研究所コンピューティショナル・フォトグラフィーPreferred Networksゴブレット・ゴブラーズ絵画Open AI3D Gaussian SplattingMicrosoft DesignerアップルイラストシミュレーションSoul Machines柿沼太一完全情報ゲームバーチャルキャラクター坂本洋典釜屋憲彦GitHub CopilotウェイポイントLLaMAパス検索対談藤澤仁生物学GTC 2022xAIApple Vision Pro画像認識SiemensストライキStyleCLIPDeNA長谷洋平クラウドコンピューティングmasumi toyotaIBM宮路洋一OpenSeaGDC 2022SNSTextWorldEarth-2BingMagentaYouTube音声生成AIELYZA PencilScenarioSIGGRAPH2023AIピカソGTC2021AI素材.comCycleGANテンセントAndreessen HorowitzAIQVE ONENetHackキャラクターモーションControlNet音源分離NBAフェイクニュースユニバーサルミュージックRPG法律Web3SIGGRAPH 2022世界モデルレベルデザインDreamerV3AIボイスアクターUnreal Engine南カリフォルニア大学NVIDIA CanvasGPUALife人工生命オルタナティヴ・マシンサウンドスケープLaMDATRPGマジック:ザ・ギャザリングAI Dungeonゲーム背景アパレル不気味の谷ナビゲーションメッシュデザイン高橋ミレイ深層強化学習松原仁松井俊浩武田英明フルコトELYZA DIGEST建築広告西成活裕ハイブリッドアーキテクチャApex LegendsELIZA群衆マネジメントライブポートレイトNinjaコンピュータRPGライブビジネスWonder StudioAdobe Max 2023アップルタウン物語新型コロナ土木MindAgentKELDIC周済涛BIMBing Chatメロディ言語清田陽司インフラBing Image CreatorゲームTENTUPLAYサイバネティックスMARVEL Future FightAstro人工知能史Amazon BedrockAssistant with BardタイムラプスEgo4DAI哲学マップThe Arcadeバスキア星新一X.AISearch Generative Experience日経イノベーション・ラボStyleGAN-XLX Corp.Dynalang敵対的強化学習StyleGAN3TwitterVLE-CE階層型強化学習GOSU Data LabGANimatorXホールディングスWANNGOSU Voice AssistantVoLux-GANMagiAI Act竹内将SenpAI.GGProjected GANEUMobalyticsSelf-Distilled StyleGANSDXLArs ElectronicaニューラルレンダリングRTFKTAI規制岡島学AWS SagemakerPLATONIKE欧州委員会映像セリア・ホデント形態素解析frame.ioClone X欧州議会UXAWS LambdaFoodly村上隆欧州理事会誤字検出MusicLM認知科学中川友紀子Digital MarkAudioLMゲームデザインSentencePieceアールティSnapchatMusicCapsLUMINOUS ENGINEクリエイターコミュニティAudioCraftLuminous ProductionsBlenderBot 3バーチャルペットパターン・ランゲージ竹村也哉Meta AINVIDIA NeMo ServiceMubertちょまどマーク・ザッカーバーグヴァネッサ・ローザMubert RenderGOAPWACULVanessa A RosaGen-2Adobe MAX 2021陶芸Runway AI Film Festival自動翻訳Play.htPreViz音声AIAIライティングLiDARCharacter-LLMOmniverse AvatarAIのべりすとPolycam復旦大学FPSQuillBotdeforumChat-Haruhi-Suzumiyaマルコフ決定過程NVIDIA MegatronCopysmith涼宮ハルヒNVIDIA MerlinJasperハーベストEmu VideoNVIDIA MetropolisForGamesNianticパラメータ設計ゲームマーケットペリドットバランス調整岡野翔太Dream Track協調フィルタリング郡山喜彦Music AI Tools人狼知能テキサス大学ジェフリー・ヒントンLyriaGoogle I/O 2023Yahoo!知恵袋AlphaDogfight TrialsAI Messenger VoicebotGoogle I/OインタラクティブプロンプトAIエージェントシミュレーションOpenAI Codex武蔵野美術大学慶應義塾大学StarCraft IIHyperStyleBingAI石渡正人Future of Life InstituteRendering with Style手塚プロダクションIntel林海象LAIKADisneyリサーチヴィトゲンシュタインPhotoshop古川善規RotomationGauGAN論理哲学論考Lightroom大規模再構成モデルGauGAN2京都芸術大学CanvaLRMドラゴンクエストライバルズ画像言語表現モデルObjaverse不確定ゲームSIGGRAPH ASIA 2021PromptBaseBOOTHMVImgNetDota 2モンテカルロ木探索ディズニーリサーチpixivFANBOXOne-2-3-45Mitsuba2バンダイナムコネクサス虎の穴3DガウシアンスプラッティングソーシャルゲームEmbeddingワイツマン科学研究所ユーザーレビューFantiaワンショット3D生成技術GTC2020CG衣装mimicとらのあな高橋力斗NVIDIA MAXINEVRファッションBaidu集英社FGDC淡路滋ビデオ会議ArtflowERNIE-ViLG少年ジャンプ+Future Game Development ConferenceグリムノーツEponym古文書ComicCopilot佐々木瞬ゴティエ・ボエダ音声クローニング凸版印刷コミコパGautier Boeda階層的クラスタリングGopherAI-OCRゲームマスター画像判定Inowrld AIJulius鑑定ラベル付けMODAniqueTPRGOxia PalusGhostwriter中村太一バーチャル・ヒューマン・エージェントtoio SDK for UnityArt RecognitionSkyrimエグゼリオクーガー田中章愛実況パワフルサッカースカイリムCopilot石井敦銭起揚NHC 2021桃太郎電鉄RPGツクールMZComfyUI茂谷保伯池田利夫桃鉄ChatGPT_APIMZserial experiments lainGDMC新刊案内パワサカダンジョンズ&ドラゴンズAI lainマーベル・シネマティック・ユニバースコナミデジタルエンタテインメントOracle RPGPCG成沢理恵MITメディアラボMCU岩倉宏介深津貴之PCGRLアベンジャーズPPOxVASynthDungeons&Dragonsマジック・リープDigital DomainMachine Learning Project CanvasLaser-NVビートルズMagendaMasquerade2.0国立情報学研究所ザ・ビートルズ: Get BackノンファンジブルトークンDDSPフェイシャルキャプチャー石川冬樹MERFDemucsサッカースパコンAlibaba音楽編集ソフト里井大輝KaggleスーパーコンピュータVQRFAdobe Audition山田暉松岡 聡nvdiffreciZotopeAssassin’s Creed OriginsAI会話ジェネレーターTSUBAME 1.0NeRFMeshingRX10Sea of ThievesTSUBAME 2.0LERFMoisesGEMS COMPANYmonoAI technologyLSTMABCIマスタリングモリカトロンAIソリューション富岳レベルファイブ初音ミクOculusコード生成AISociety 5.0リアム・ギャラガーSuno AI転移学習テストAlphaCode夏の電脳甲子園グライムスKaKa CreationBaldur's Gate 3Codeforces座談会BoomyVOICEVOXCandy Crush Saga自己増強型AIジョン・レジェンドGenie AISIGGRAPH ASIA 2020COLMAPザ・ウィークエンドSIGGRAPH Asia 2023ADOPNVIDIA GET3DドレイクC·ASEデバッギングBigGANGANverse3DFLAREMaterialGANダンスグランツーリスモSPORTAI絵師エッジワークスMagicAnimateReBeLグランツーリスモ・ソフィーUGC日本音楽作家団体協議会Animate AnyoneGTソフィーPGCFCAインテリジェントコンピュータ研究所VolvoFIAグランツーリスモチャンピオンシップVoiceboxアリババNovelAIさくらインターネットDreaMovingRival PrakDGX A100NovelAI DiffusionVISCUITぷよぷよScratchユービーアイソフトWebcam VTuberモーションデータスクラッチ星新一賞大阪公立大学ビスケット北尾まどかHALOポーズ推定TCGプログラミング教育将棋メタルギアソリッドVメッシュ生成KLabFSMメルセデス・ベンツQRコードVALL-EMagic Leap囲碁Deepdub.aiナップサック問題Live NationEpyllionデンソーAUDIOGEN汎用言語モデルWeb3.0マシュー・ボールデンソーウェーブEvoke MusicAIOpsムーアの法則原昌宏AutoFoleySpotifyスマートコントラクト日本機械学会Colourlab.AiReplica Studioロボティクス・メカトロニクス講演会ディズニーamuseChitrakarQosmoAdobe MAX 2022トヨタ自動車Largo.ai巡回セールスマン問題かんばん方式Cinelyticジョルダン曲線メディアAdobe ResearchTaskade政治Galacticaプロット生成Pika.artクラウドゲーミングがんばれ森川君2号AI Filmmaking Assistant和田洋一リアリティ番組映像解析FastGANStadiaジョンソン裕子セキュリティ4コママンガAI ScreenwriterMILEsNightCafe東芝デジタルソリューションズ芥川賞インタラクティブ・ストリーミングLuis RuizSATLYS 映像解析AI文学インタラクティブ・メディア恋愛PFN 3D ScanElevenLabsタップル東京工業大学HeyGenAbema TVLudo博報堂After EffectsNECラップPFN 4D Scan絵本木村屋SIGGRAPH 2019ArtEmisZ世代DreamUp出版GPT StoreAIラッパーシステムDeviantArtAmmaar Reshi生成AIチェッカーWaifu DiffusionStoriesユーザーローカルGROVERプラスリンクス ~キミと繋がる想い~元素法典StoryBird九段理江FAIRSTCNovel AIVersed東京都同情塔チート検出Style Transfer ConversationProlificDreamerオンラインカジノRCPUnity Sentis4Dオブジェクト生成モデルRealFlowRinna Character PlatformUnity MuseAlign Your GaussiansiPhoneCALACaleb WardAYGDeep Fluids宮田龍MAV3DMeInGameAmelia清河幸子ファーウェイAIGraphブレイン・コンピュータ・インタフェース西中美和4D Gaussian SplattingBCIGateboxアフォーダンス安野貴博4D-GSLearning from VideoANIMAKPaLM-SayCan斧田小夜Glaze予期知能逢妻ヒカリ宮本道人WebGlazeセコムLLaMA 2NightShadeユクスキュルバーチャル警備システムCode as PoliciesSpawningカント損保ジャパンCaPHugging FaceHave I Been Trained?CM3leonFortnite上原利之Stable DoodleUnreal Editor For FortniteドラゴンクエストエージェントアーキテクチャアッパーグラウンドコリジョンチェックT2I-AdapterXRPAIROCTOPATH TRAVELER西木康智VolumetricsOCTOPATH TRAVELER 大陸の覇者山口情報芸術センター[YCAM]AIワールドジェネレーターアルスエレクトロニカ2019品質保証YCAM日本マネジメント総合研究所Rosebud AI GamemakerStyleRigAutodeskアンラーニング・ランゲージVoyagerLayer逆転オセロニアBentley Systemsカイル・マクドナルドLily Hughes-RobinsonCharisma.aiワールドシミュレーターローレン・リー・マッカーシーColossal Cave AdventureGDC 2024奥村エルネスト純いただきストリートH100鎖国[Walled Garden]​​プロジェクトAdventureGPT調査齋藤精一大森田不可止COBOLSIGGRAPH ASIA 2022リリー・ヒューズ=ロビンソンMeta Quest高橋智隆DGX H100VToonifyBabyAGIIPロボユニザナックDGX SuperPODControlVAEGPT-3.5 Turbo泉幸典仁井谷正充変分オートエンコーダーカーリング強いAIロボコレ2019Instant NeRFフォトグラメトリウィンブルドン弱いAIartonomous回帰型ニューラルネットワークbitGANsDeepJoin戦術分析ぎゅわんぶらあ自己中心派Azure Machine LearningAzure OpenAI Serviceパフォーマンス測定Lumiere意思決定モデル脱出ゲームDeepLIoTUNetHybrid Reward Architectureコミュニティ管理DeepL WriteProFitXImageFXウロチョロスSuper PhoenixWatsonxMusicFXProject MalmoオンラインゲームAthleticaTextFX気候変動コーチングProject Paidiaシンギュラリティ北見工業大学KeyframerProject Lookoutマックス・プランク気象研究所レイ・カーツワイル北見カーリングホールAppleWatch Forビョルン・スティーブンスヴァーナー・ヴィンジ画像解析Gemini 1.5気象モデルRunway ResearchじりつくんAI StudioLEFT ALIVE気象シミュレーションMake-A-VideoNTT SportictVertex AI長谷川誠ジミ・ヘンドリックス環境問題PhenakiAIカメラChat with RTXBaby Xカート・コバーンエコロジーDreamixSTADIUM TUBESlackロバート・ダウニー・Jr.エイミー・ワインハウスSDGsText-to-ImageモデルPixelllot S3Slack AIソフトバンクPokémon Battle Scopeダフト・パンクメモリスタAIスマートコーチポケットモンスターGlenn MarshallkanaeruThe Age of A.I.Story2Hallucination音声変換Latitude占いレコメンデーションJukeboxDreambooth行動ロジック生成AIVeap Japanヤン・ルカンConvaiEAPneoAIPerfusionNTTドコモSIFT福井千春DreamIconニューラル物理学EmemeDCGAN医療mign毛髪GenieMOBADANNCEメンタルケアstudiffuse荒牧英治汎用AIエージェント人事ハーバード大学Edgar Handy中ザワヒデキAIファッションウィーク研修デューク大学大屋雄裕インフルエンサーQA Tech Night中川裕志Grok-1mynet.aiローグライクゲーム松木晋祐Adreeseen HorowitzMixture-of-Experts東京理科大学下田純也NVIDIA Avatar Cloud EngineMoE人工音声NeurIPS 2021産業技術総合研究所桑野範久Replica StudiosClaude 3リザバーコンピューティングSmart NPCsClaude 3 Haikuプレイ動画ヒップホップ対話型AIモデルRoblox StudioClaude 3 SonnetソニーマーケティングPromethean AIClaude 3 Opusサイレント映画もじぱnote森永乳業環境音暗号通貨note AIアシスタントMusiioC2PAFUZZLEKetchupEndelゲーミフィケーションAlterationAI NewsTomo Kihara粒子群最適化法Art SelfiePlayfool進化差分法オープンワールドArt TransferSonar遊び群知能下川大樹AIFAPet PortraitsSonar+D​​tsukurunウィル・ライト高津芳希P2EBlob Opera地方創生大石真史クリムトDolby Atmos吉田直樹BEiTStyleGAN-NADASonar Music Festival素材DETRライゾマティクスSporeクリティックネットワーク真鍋大度デノイズUnity for Industryアクターネットワーク花井裕也画像処理DMLabRitchie HawtinSentropyGLIDEControl SuiteErica SynthCPUDiscordAvatarCLIPAtari 100kUfuk Barış MutluSynthetic DataAtari 200MJapanese InstructBLIP AlphaCALMYann LeCun日本新聞協会プログラミングサム・アルトマン鈴木雅大AIいらすとやソースコード生成コンセプトアートAI PicassoGMAIシチズンデベロッパーSonanticColie WertzEmposyGitHubCohereリドリー・スコットAIタレントウィザードリィMCN-AI連携モデル絵コンテAIタレントエージェンシーUrzas.aiストーリーボードmodi.ai介護大阪大学BitSummit西川善司並木幸介KikiBlenderBitSummit Let’s Go!!サムライスピリッツ森寅嘉Zoetic AIゼビウスSIGGRAPH 2021ペットストリートファイター半導体Digital Dream LabsPaLM APIデジタルレプリカTopaz Video Enhance AICozmoMakerSuiteGOT7DLSSタカラトミーSkebsynthesia山野辺一記NetEaseLOVOTDreambooth-Stable-DiffusionHumanRF大里飛鳥DynamixyzMOFLINActors-HQRomiGoogle EarthSAG-AFTRAU-NetミクシィGEPPETTO AIWGA13フェイズ構造ユニロボットStable Diffusion web UIチャーリー・ブルッカーADVユニボPoint-EXLandGato岡野原大輔AI model自己教師あり学習DEATH STRANDINGAI ModelsIn-Context Learning(ICL)Eric Johnson汎用強化学習AIZMO.AILoRAMOBBY’SファインチューニングOculus Questコジマプロダクションロンドン芸術大学モビーディックグランツーリスモ生体情報デシマエンジンGoogle Brainダイビング量子コンピュータSound Controlアウトドアqubit写真SYNTH SUPERAIスキャニングIBM Quantum System 2照明Maxim PeterKarl Sims自動採寸北野宏明Joshua RomoffArtnome3DLOOKダリオ・ヒルハイパースケープICONATESizerジェン・スン・フアン山崎陽斗ワコールHuggingFace立木創太スニーカーStable Audio浜中雅俊UNSTREET宗教ミライ小町Newelse仏教テスラ福井健策CheckGoodsコカ・コーラGameGAN二次流通食品パックマンTesla Bot中古市場Coca‑Cola Y3000 Zero SugarTesla AI DayWikipediaDupe KillerCopilot Copyright Commitmentソサエティ5.0Sphere偽ブランドテラバースSIGGRAPH 2020バズグラフXaver 1000配信京都大学ニュースタンテキ養蜂立福寛東芝Beewiseソニー・ピクチャーズ アニメーション音声解析DIB-R倉田宜典フィンテック感情分析投資Fosters+Partners周 済涛韻律射影MILIZEZaha Hadid Architectsステートマシン韻律転移三菱UFJ信託銀行ディープニューラルネットワーク

CGへの扉 Vol.60:AIは世界を認識したのか? Soraが描き出す物理世界

2024.3.25アート

CGへの扉 Vol.60:AIは世界を認識したのか? Soraが描き出す物理世界

シミュレーション仮説

哲学者ニック・ボストロム氏の提唱する「シミュレーション仮説」をご存知でしょうか? これは、私たちが生きているこの世界が人間ではない高度な知的存在がつくった、ある種の計算機によるシミュレーションであるという仮説です。一見突拍子もない考えではありますが、単純に否定できない面もあります。例えば人間もコンピュータによって人工生命をシミュレーションしたり、気候変動や薬の効果など、さまざまな現象をシミュレーションしています。

オープンワールドのゲームのように、世の中のすべての事象がシミュレーションされているのかもしれないと想像すると「シミュレーション仮説」も、もしかしたらありえるかもしれないと、その存在をイメージすることができます。つまりは、映画『マトリックス』で描かれている世界のように、AIによって作られた仮想的なシミュレーションの世界で、人間は脳の働きによって現実世界があると思い込んでいる、もしかしたら実在しないコンピュータによって模倣された意識だけかもしれないということです。

さて昨今のAIの革新スピードを考えると、AIがはたして意思を持つかどうかという要素に議論の余地がありつつも、AIが限りなく意思を持っているかのように振る舞うシミュレーションが実現するかもしれません。人工知能に関する世界的権威レイ・カーツワイル氏をはじめとする多くの研究者が、コンピューターテクノロジーの進化の過程から予想し、2045年には「技術的特異点」を迎えると論じています。現在のAI周辺の進化はめざましく、予想以上に早い時期に、さまざまな用途に対応できるAGI(汎用人工知能)が登場するとも言われています。

「技術的特異点」は、AIが人間の知能を超える時点を示します。その段階になるとAIは自己改良を重ねることで無限の成長が可能になり、自己増殖したり「自我」を持つ可能性も考えられます。この技術的特異点を超え、人間を超えるAIが現実化すると、AIが人間の理解を超えた判断や行動を取り始める可能性があるため、人類にとっては大きな脅威をもたらすと考えられています。

OpenAI Sora の登場

公式URL:https://openai.com/sora
論文:Sora: A Review on Background, Technology, Limitations, and Opportunities of Large Vision Models

ChatGPTで世界を騒がせたOpenAIが2024年2月に、Sora を発表しました。Soraはテキストによる指示から表現力豊かな動画を生成するAIモデルです。テキストから動画を生成するソリューションはこれまでも数多く存在しました。Soraがそれらと比較して一線を画しているのは「world simulator(世界シミュレータ)」と呼ばれる物理世界を模倣した仮想世界を構築する概念のもとに映像が生成されることです。

機械学習のもととなった過去に撮影されたり生成された映像をもとに、視覚的にそれらしい映像をどこかで見たような素材のつぎはぎで生成するのではなく、現実世界での重力や加速、摩擦、水や風などの自然物の影響などを加味した上で、映像が生成されるのがSoraの大きな特徴です。実際には、破壊や液体の振る舞いなど、まだまだ物理的にありえない映像が生み出されてしまう場面はありますが、それらが是正されるのも時間の問題だと思われます。

生成AIで作られた画像や動画は、テキストによる指示を実現するべく生成されますが、Soraでは、被写体や背景、そこに存在する物体等が現実世界でどのように存在し、どう振る舞うかを考慮した上で映像を生成していると説明されています。また、従来の生成AIによる動画生成はフレーム間の変化に違和感があり、静止画をつないだような感覚のものが多くみられましたが、Soraでは生成された映像内での映像スタイルやキャラクタ表現に一貫性を持たせることで、映像として破綻が無いよう工夫されています。こういった工夫により現実感のある映像が生み出される一方、バスケットコートが爆発するといった一般的には起こり得ないような映像を生成させようとした場合、AIモデルは必死で爆発が無かった、もとの状態のバスケットコートを復元する流れで映像を補正する傾向が見られます。

Soraの映像生成のアプローチはまだ明らかになってない部分もあり、今後の解説が待たれます。ただ、どうやら映像制作のプロセスに物理計算がふくまれているのではなく、映像制作用の巨大AIモデルの登場によって、内部的に物理的な属性、三次元空間における物体の属性を持ち始めたのではないかと考えられています。つまりは、言語用のAIモデルと同様に、予想した以上の素晴らしい回答が得られる時もあれば、ハルシネーションと呼ばれる嘘や間違いがふくまれる場合もあるということです。

「抄訳:暖かく光るネオンとアニメーションの看板で埋め尽くされた東京の通りを歩くスタイリッシュな女性。黒いレザージャケット、赤いロングドレス、黒いブーツを身につけ、黒い財布を持っている。サングラスに赤い口紅。彼女は自信に満ち、さりげなく歩いている。通りは湿っていて反射し、カラフルな照明の鏡のような効果を生み出している」

これはSoraによって生成された動画の1シーンと、その生成のために与えたテキストプロンプトの一部(※Soraの論文より引用)です。

Soraによって作成された映像は、映画制作やゲーム映像制作を置き換えるとまでは言わないまでも、ストーリーボードの検討や、映画製作の一部分を担ったり、従来手間と時間がかかっていた映像制作要素における試行錯誤の回数と時間を節約する用途に活躍することでしょう。また教育コンテンツや広告などのマーケティングに至るまで、映像制作に望むと望まざるに関わらず、コストがかけられてきたさまざまな業界に影響を与えることが予想されます。コンセプトアートから想像しつつ映像制作するスピードも格段に早くなり、用途によってはコンセプトアートの必要性が無くなる工程もあるかもしれません。もちろん潤沢な予算と時間をかけた映像制作は今後も一定数残ると考えられますが、さまざまな分野でAIによる映像制作の活用が指数的に増加する可能性を秘めています。

さらにSoraによって映像の制作スピードと試行錯誤の回数やバリエーションを容易に増加させることによる新たな表現方法の創出も期待されます。巨大なセットを用意する、ロケ地に行って撮影する、膨大な手間をかけたCG/VFXを製作するといった手間を飛び越えて、監督や映像作家たちがイメージする映像を素早く何度でも生成し、試行錯誤を繰り返すことができるのです。

さらに活用範囲が増えるにつれ、映像生成の学習用として安全で偏りのないビデオ映像をどう確保するのか? あまりにもリアルな動画が生成されるために、フェイク動画によって混乱が起きるのをどう防ぐのか? プラス面の可能性とマイナス面の可能性両方の取り扱いが課題となってくるのは確実です。その影響かどうかは定かではありませんが、米国大統領戦が近い現在、選挙活動へのフェイク動画の影響を考え、Soraそのものは、まだ一般利用が公開されておらず、一部のアーティストや映像製作者に限って提供されているそうです。またSora一般公開の際には、C2PA(Coalition for Content Provenance and Authenticity)によるデジタルデータの来歴を暗号化して付記する仕組みを採用し、どんなツールでいつどこで誰が作ったデータなのか確認できるよう配慮が進んでいます。

物理現象に対する人間の感覚の鋭さ

このCG映像 “Carla’s Island” は、1980年代、初めてCGで表現された波のアニメーション映像です。制作したのは当時ローレンス・リバモア国立研究所のCGグループを率いていたネルソン・マックス氏らによるものです。当時は、こういった自然物の映像制作の難しさを克服した驚きとともに、新たなるCG表現の可能性に期待が寄せられ、大きな話題にもなりました。けれどもこの40年以上前のCG映像を見て、本物の波だと思う人は皆無で、表現の稚拙さにがっかりするかもしれません。現在、波に限らず、自然物に関するCG/VFX表現は、CGツールの物理表現技術の進化にともない、圧倒的なリアルさ、現実感を表現できるようになりました。マーベルシリーズを始めとするCG/VFX盛りだくさんの映像作品、海や水がテーマになった映画やドラマ、CM映像などで、実写と見分けがつかないほどのCG/VFXによる水の表現が活用されていますが、それでも違和感を覚えることがあります。

私たちは、日々の生活の中で摩擦や重力、水の動きといった無数の物理現象に囲まれて生活しています。これらの現象は私たちの感覚に深く根ざしており、無意識のうちに自然界のルールや立ち振る舞いを識別できるようになっています。CG/VFX、ゲーム映像など、現実と見間違うほどのリアリズムを生み出すことが可能になりました。しかし、これらの技術がいくら進化しても、人間の感覚を完全にだますことは困難で、物理法則に基づいた細かな動きや挙動に関して、人間は非常に敏感です。

例えば水の動きひとつとっても、それらは極めて複雑です。水面のゆらぎ、波紋の広がり方、滴の落ち方、水の流れる様子など、細部にわたって無数の要素が絡み合っています。膨大な時間と手間をかければ、こういった水の物理現象を限りなく本物に近いところまでシミュレーションして再現することは可能です。そういった表現は手間や時間のコストに見合うかどうかが微妙であり、どこかでシミュレーション計算が省略されます。またどんなに精細に時間をかけて映像制作したとしても本物の繊細さ、仔細さにはかないません。CGで再現された水は、視覚的には本物と見分けがつかないほどになりますが人間が日常的に経験している水の動きと、わずかに異なる挙動を無意識のうちに察知し、何かが「違う」と感じることがあります。

摩擦や重力の効果も同様です。私たちは、物がどのように動くか、落ちるか、滑るかを本能的に理解しており、Soraでそれらの物理現象がどれだけ正確に再現できるのか、現実と比べて違和感がないかが、これからの生成AIにおける評価対象になると考えられます。今後、技術がさらに進化し、より細かな物理現象の再現が可能になるにつれ、生成された映像と人間が持つ感覚との「現実感」のギャップを埋めることがクリエイターや技術者にとっての大きな目標となるでしょう。

想像性は果たして文章による指示の結果だけで事足りるのか?

映像制作に限らず、文章も絵画も、創作にまつわる工程はアーティストによって人それぞれです。頭の中に完成イメージがすでに出来上がっていて、それを頭の中からアウトプットするだけのタイプの製作者から、ラフな完成イメージを手を動かして試作することから、新たなイメージを得て完成形に近づけていく、「手を動かす」ことで自分の目と頭で反芻し、そこで得られた情報や感覚をさらなる創作につなげるタイプのアーティストもいます。

また本人は手を動かさずとも、才能のある人材を束ねて的確に指示すること素晴らしい作品を生み出す、プロデューサータイプのアーティストもいるでしょう。生成AIでは、テキストプロンプトで指示を与えるものがほとんどです。Soraのように画像とテキストプロンプトを組み合わせて雰囲気やスタイルを伝えるものもありますが、AIモデルの関係で基本はテキストです。つまりは、言葉で指示して何かを生み出すだけが、作品作りのスタイルではないはずなのに、未だテキストで表現できる範疇に制限されているということです。

人間は身体を持ち、物質的な体験や経験、感情、経験、対人関係といった人間特有の時間の過ごし方から、さまざまな表現や想像力を発揮して新しいものを考え、生み出していきます。一方、どんなアート作品も、過去の作品の焼き直しでしかないという考え方もありますが、まだまだ人間にしか生み出せない表現はあるのでは?と考える一方で、それらは全てAIに凌駕されていくという考えも捨てられません。どちらにしろ、何かを生み出したり、作ることそのものを楽しみとして人類がクリエイティビティを追い求め、それを楽しむことはこれからも変わらず、生成AIの進化や研究が加速していることそのものも、実は人類のクリエイティビティなのではないかと考えています。

本連載の今後の予定:「CGへの扉」では、単なるAIの話題とは少し異なり、CG/VFX, アートの文脈から話題を切り取り紹介していきます。映像制作の現場におけるAI活用や、AIで価値が高まった先進的なツール、これからの可能性を感じさせるような話題、テクノロジーの話題にご期待ください。なにか取り上げて欲しいテーマやご希望などがございましたら、ぜひ編集部までお知らせください。

CGへの扉

Vol.59:生活に浸透するAI、身の回りの「弱い」AI

Vol.58:生成AIによる映画産業の業務の置き換えはどこまで可能か?

Vol.57:AIを活用したCG論文紹介 #SIGGRAPHAsia2023 より

Vol.56:ハリウッド映画の自動生成も間近か? AI動画の可能性

Vol.55:AdobeMAX2023開催。生成系AI全盛のSneaks

Vol.54:SIGGRAPH 2023基調講演における注目のAIトピック

Vol.53:CGの祭典SIGGRAPH50周年にみるAIの台頭

Vol.52:制作の現場に進出しつつあるAI

Vol.51:広告産業の事例が教えてくれる創造性を加速させるAIの活用法

Vol.50:脅威論がある一方で公式化する動きも。生成系AIに対する各界の反応

Vol.49:AI時代の勝者NVIDIA #GTC2023 レポート

Vol.48:頭の中を映像化

Vol.47:Gen-1登場。映像が映像を作る時代に

≫≫すべてのバックナンバーはこちらから

Contributor:安藤幸央

RELATED ARTICLE関連記事

CGへの扉 Vol.46:AIを活用したCG論文紹介 #SIGGRAPHAsia2022 より

2023.1.16アート

CGへの扉 Vol.46:AIを活用したCG論文紹介 #SIGGRAPHAsia...

CGへの扉 Vol.28:定番手法の他分野応用、自然言語処理AI由来の画像処理AI

2021.7.16アート

CGへの扉 Vol.28:定番手法の他分野応用、自然言語処理AI由来の画像処理A...

CGへの扉 Vol.42:現代の呪文promptが生み出すAIとの新しい関係性

2022.9.15アート

CGへの扉 Vol.42:現代の呪文promptが生み出すAIとの新しい関係性

RANKING注目の記事はこちら