モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。

TAG LIST: CG CGへの扉安藤幸央生成AI 月刊エンタメAIニュース機械学習河合律子ディープラーニング吉本幸記 OpenAI GAN 音楽 NVIDIA ChatGPT Google 強化学習三宅陽一郎森川幸人グーグル Stable Diffusion ニューラルネットワーク大規模言語モデル LLM シナリオ DeepMind 人工知能学会モリカトロンマイクロソフト QA AIと倫理 GPT-3 自然言語処理 Facebook 大内孝子倫理映画著作権ルールベースアートゲームプレイAI キャラクターAI スクウェア・エニックス敵対的生成ネットワーク SIGGRAPH モリカトロンAIラボインタビュー NPC 画像生成 NFT Minecraft ロボット DALL-E2 音楽生成AI プロシージャル Midjourney デバッグファッション StyleGAN 自動生成ディープフェイク遺伝的アルゴリズム画像生成AI ゲームAI VFX Adobe テストプレイメタAI アニメーションテキスト画像生成深層学習 CEDEC2019 Microsoft デジタルツインメタバース VR 小説ボードゲーム DALL-E CLIP toio ビヘイビア・ツリーマンガ CEDEC2021 CEDEC2020 作曲不完全情報ゲームロボティクスナビゲーションAI マインクラフト畳み込みニューラルネットワークスポーツエージェント GDC 2021 GPT-4 手塚治虫マルチモーダル汎用人工知能 JSAI2022 バーチャルヒューマン NVIDIA Omniverse GDC 2019 動画生成AI マルチエージェント CEDEC2022 Meta AIアート 3DCG Stability AI メタデジタルヒューマン懐ゲーから辿るゲームAI技術史教育ジェネレーティブAI はこだて未来大学プロンプト Red Ram 栗原聡 CNN NeRF DALL-E 3 BERT Microsoft Azure Unity Omniverse JSAI2023 ELSI 鴫原盛之 HTN 階層型タスクネットワークソニー東京大学 JSAI2020 GTC2023 3D マーケティング TensorFlow インタビューブロックチェーン CM イベントレポートアストロノーカ模倣学習対話型エージェント Amazon トレーディングカードメディアアート DQN 高橋力斗合成音声水野勇太アバターブラック・ジャック Ubisoft Genvid Technologies ガイスター StyleGAN2 電気通信大学稲葉通将 AR アップル GTC2022 GPT-3.5 Sora SIGGRAPH ASIA Netflix JSAI2021 Bard 研究シムピープル世界モデル MCS-AI動的連携モデルマーダーミステリーモーションキャプチャーアドベンチャーゲーム TEZUKA2020 CEDEC2023 AGI テキスト生成インディーゲーム Electronic Arts 音声合成広告 JSAI2024 メタデータ GDC Summer イーロン・マスク Stable Diffusion XL 森山和道キャリア eスポーツスタンフォード大学アーケードゲームテニスサイバーエージェント音声認識類家利直 eSports BLUE PROTOCOL シーマン aibo SIE 大澤博隆 SFプロトタイピングモリカトロン開発者インタビュー宮本茂則チャットボット Gemini ワークショップ Epic Games AIロボ「迷キュー」に挑戦 AWS 徳井直生村井源クラウド斎藤由多加 AlphaZero Transformer GPT-2 rinna AIりんなカメラ環世界中島秀之 PaLM GitHub Copilot 哲学ベリサーブ Playable!ハリウッド理化学研究所 Gen-1 SF テキスト画像生成AI 松尾豊 AIQVE ONE データマイニング現代アート DARPA ドローンシムシティゲームエンジン Imagen Zork バイアス ASBS ぱいどん AI美空ひばり手塚眞バンダイナムコ研究所スパーシャルAI ELYZA NEDO FSM-DNN MindAgent LEFT 4 DEAD 通しプレイ論文 OpenAI Five 本間翔太馬淵浩希 Cygames Audio2Face ピクサープラチナエッグイーサリアム効果音ボエダ・ゴティエビッグデータ中嶋謙互 Amadeus Code データ分析 MILE NVIDIA ACE ナラティブ NVIDIA Riva Omniverse Replicator WCCF レコメンドシステム NVIDIA DRIVE Sim WORLD CLUB Champion Football NVIDIA Isaac Sim セガ柏田知大軍事田邊雅彦 Google I/O トレカ慶應義塾大学 Max Cooper GPT Disney Firefly PyTorch 京都芸術大学 ChatGPT4 モンテカルロ木探索眞鍋和子バンダイナムコスタジオヒストリア AI Frog Interactive 新清士田中章愛銭起揚齊藤陽介コナミデジタルエンタテインメント成沢理恵お知らせ Magic Leap One Tencent サッカーバスケットボール TikTok Suno AI text-to-image サルでもわかる人工知能 text-to-3D VAE DreamFusion TEZUKA2023 リップシンキング RNN Ubisoft La Forge 自動運転車知識表現ウォッチドッグスレギオン VTuber IGDA 立教大学秋期GTC2022 市場分析フォートナイト KLab どうぶつしょうぎ Roblox ジェイ・コウガミ音楽ストリーミング MIT 野々下裕子 Adobe MAX マシンラーニング 5G MuZero Rival Peak がんばれ森川君2号 pixiv オムロンサイニックエックス GPTs 対話エンジンポケモン 3Dスキャン橋本敦史リトル・コンピュータ・ピープル Codex シーマン人工知能研究所コンピューティショナル・フォトグラフィー Preferred Networks ゴブレット・ゴブラーズ絵画 Open AI 3D Gaussian Splatting Microsoft Designer イラストシミュレーション Soul Machines 柿沼太一完全情報ゲームバーチャルキャラクター坂本洋典宮本道人釜屋憲彦ウェイポイント LLaMA パス検索 Hugging Face 対談藤澤仁生物学 GTC 2022 xAI Apple Vision Pro 画像認識 Siemens ストライキ StyleCLIP DeNA Voyager 長谷洋平 GDC 2024 クラウドコンピューティング masumi toyota IBM 宮路洋一 OpenSea GDC 2022 SNS TextWorld Earth-2 Apple Bing Magenta ソフトバンク YouTube 音声生成AI ELYZA Pencil Scenario SIGGRAPH2023 AIピカソ GTC2021 AI素材.com CycleGAN テンセント Andreessen Horowitz QA Tech Night 松木晋祐 NetHack 下田純也桑野範久キャラクターモーション ControlNet 音源分離 NBA フェイクニュースユニバーサルミュージック RPG 法律 Web3 SIGGRAPH 2022 レベルデザイン DreamerV3 AIボイスアクター Unreal Engine 南カリフォルニア大学 NVIDIA Canvas GPU ALife 人工生命オルタナティヴ・マシンサム・アルトマンサウンドスケープ LaMDA TRPG マジック：ザ・ギャザリング AI Dungeon 介護ゲーム背景アパレル不気味の谷ナビゲーションメッシュデザイン写真高橋ミレイ深層強化学習松原仁松井俊浩武田英明フルコト ELYZA DIGEST WWDC WWDC 2024 建築西成活裕ハイブリッドアーキテクチャ AI野々村真 Apex Legends ELIZA 群衆マネジメントライブポートレイト Ninja コンピュータRPG ライブビジネス Wonder Studio Adobe Max 2023 GPT-4-turbo アップルタウン物語新型コロナ土木佐藤恵助 KELDIC 周済涛 BIM Bing Chat 大道麻由メロディ言語清田陽司インフラ Bing Image Creator 物語構造分析ゲーム TENTUPLAY サイバネティックス慶応義塾大学 MARVEL Future Fight Astro 人工知能史 Amazon Bedrock Assistant with Bard 渡邉謙吾タイムラプス Ego4D AI哲学マップ The Arcade ここ掘れ！プッカバスキア星新一 X.AI Search Generative Experience くまうた日経イノベーション・ラボ StyleGAN-XL X Corp.Dynalang 濱田直希敵対的強化学習 StyleGAN3 Twitter VLE-CE 大柳裕⼠階層型強化学習 GOSU Data Lab GANimator Xホールディングス加納基晴 WANN GOSU Voice Assistant VoLux-GAN Magi AI Act ソニー・インタラクティブエンタテインメント竹内将 SenpAI.GG Projected GAN EU 研究開発事例 Mobalytics Self-Distilled StyleGAN SDXL Ars Electronica 赤羽進亮ニューラルレンダリング RTFKT AI規制遊戯王岡島学 AWS Sagemaker PLATO NIKE 欧州委員会 UDI（Universal Duel Interface）映像セリア・ホデント形態素解析 frame.io Clone X 欧州議会第一工科大学 UX AWS Lambda Foodly 村上隆欧州理事会佐竹空良誤字検出 MusicLM 小林篤史認知科学中川友紀子 Digital Mark AudioLM 九州大学ゲームデザイン SentencePiece アールティ Snapchat MusicCaps 荻野宏実 LUMINOUS ENGINE クリエイターコミュニティ AudioCraft 伊藤黎 Luminous Productions BlenderBot 3 バーチャルペットビヘイビアブランチパターン・ランゲージ竹村也哉 Meta AI NVIDIA NeMo Service Mubert WPP ちょまどマーク・ザッカーバーグヴァネッサ・ローザ Mubert Render General Computer Control（GCC）GOAP WACUL Vanessa A Rosa Gen-2 Cradle Adobe MAX 2021 陶芸 Runway AI Film Festival 自動翻訳 Play.ht PreViz 音声AI AIライティング LiDAR Character-LLM Omniverse Avatar AIのべりすと Polycam 復旦大学 FPS QuillBot deforum Chat-Haruhi-Suzumiya マルコフ決定過程 NVIDIA Megatron Copysmith 涼宮ハルヒ NVIDIA Merlin Jasper ハーベスト Emu Video NVIDIA Metropolis ForGames Niantic パラメータ設計ゲームマーケットペリドットバランス調整岡野翔太 Dream Track 協調フィルタリング郡山喜彦 Music AI Tools 人狼知能テキサス大学ジェフリー・ヒントン Lyria Google I/O 2023 Yahoo!知恵袋 AlphaDogfight Trials AI Messenger Voicebot インタラクティブプロンプトAI エージェントシミュレーション OpenAI Codex 武蔵野美術大学 StarCraft II HyperStyle BingAI 石渡正人 Future of Life Institute Rendering with Style 手塚プロダクション Intel 林海象 LAIKA Disneyリサーチヴィトゲンシュタイン Photoshop 古川善規 Rotomation GauGAN 論理哲学論考 Lightroom 大規模再構成モデル GauGAN2 Canva LRM ドラゴンクエストライバルズ画像言語表現モデル Objaverse 不確定ゲーム SIGGRAPH ASIA 2021 PromptBase BOOTH MVImgNet Dota 2 ディズニーリサーチ pixivFANBOX One-2-3-45 Mitsuba2 バンダイナムコネクサス虎の穴 3Dガウシアンスプラッティングソーシャルゲーム Embedding ワイツマン科学研究所ユーザーレビュー Fantia ワンショット3D生成技術 GTC2020 CG衣装 mimic とらのあな NVIDIA MAXINE VRファッション Baidu 集英社 FGDC 淡路滋ビデオ会議 Artflow ERNIE-ViLG 少年ジャンプ＋Future Game Development Conference グリムノーツ Eponym 古文書 ComicCopilot 佐々木瞬ゴティエ・ボエダ音声クローニング凸版印刷コミコパ Gautier Boeda 階層的クラスタリング Gopher AI-OCR ゲームマスター画像判定 Inowrld AI Julius 鑑定ラベル付け MOD Anique TPRG Oxia Palus Ghostwriter 中村太一バーチャル・ヒューマン・エージェント toio SDK for Unity Art Recognition Skyrim エグゼリオクーガー実況パワフルサッカースカイリム Copilot 石井敦 NHC 2021 桃太郎電鉄 RPGツクールMZ ComfyUI 茂谷保伯池田利夫桃鉄 ChatGPT_APIMZ serial experiments lain GDMC 新刊案内パワサカダンジョンズ&ドラゴンズ AI lain マーベル・シネマティック・ユニバース Oracle RPG PCG MITメディアラボ MCU 岩倉宏介深津貴之 PCGRL アベンジャーズ PPO xVASynth Dungeons&Dragons マジック・リープ Digital Domain Machine Learning Project Canvas Laser-NV ビートルズ Magenda Masquerade2.0 国立情報学研究所ザ・ビートルズ: Get Back ノンファンジブルトークン DDSP フェイシャルキャプチャー石川冬樹 MERF Demucs スパコン Alibaba 音楽編集ソフト里井大輝 Kaggle スーパーコンピュータ VQRF Adobe Audition 山田暉松岡聡 nvdiffrec iZotope Assassin’s Creed Origins AI会話ジェネレーター TSUBAME 1.0 NeRFMeshing RX10 Sea of Thieves TSUBAME 2.0 LERF Moises GEMS COMPANY monoAI technology LSTM ABCI マスタリングモリカトロンAIソリューション富岳レベルファイブ初音ミク Oculus コード生成AI Society 5.0 リアム・ギャラガー転移学習テスト AlphaCode 夏の電脳甲子園グライムス KaKa Creation Baldur's Gate 3 Codeforces 座談会 Boomy VOICEVOX Candy Crush Saga 自己増強型AI ジョン・レジェンド Genie AI SIGGRAPH ASIA 2020 COLMAP ザ・ウィークエンド SIGGRAPH Asia 2023 ADOP NVIDIA GET3D ドレイク C·ASE デバッギング BigGAN GANverse3D FLARE MaterialGAN ダンスグランツーリスモSPORT AI絵師エッジワークス MagicAnimate ReBeL グランツーリスモ・ソフィー UGC 日本音楽作家団体協議会 Animate Anyone GTソフィー PGC FCA インテリジェントコンピュータ研究所 Volvo FIAグランツーリスモチャンピオンシップ Voicebox アリババ NovelAI さくらインターネット DreaMoving Rival Prak DGX A100 NovelAI Diffusion VISCUIT ぷよぷよ Scratch ユービーアイソフト Webcam VTuber モーションデータスクラッチ星新一賞大阪公立大学ビスケット北尾まどか HALO ポーズ推定 TCG プログラミング教育将棋メタルギアソリッドV メッシュ生成 FSM メルセデス・ベンツ QRコード VALL-E Magic Leap 囲碁 Deepdub.ai ナップサック問題 Live Nation Epyllion デンソー AUDIOGEN 汎用言語モデル Web3.0 マシュー・ボールデンソーウェーブ Evoke Music AIOps ムーアの法則原昌宏 AutoFoley Spotify スマートコントラクト日本機械学会 Colourlab.Ai Replica Studio ロボティクス・メカトロニクス講演会ディズニー amuse Chitrakar Qosmo Adobe MAX 2022 トヨタ自動車 Largo.ai 巡回セールスマン問題かんばん方式 Cinelytic ジョルダン曲線メディア Adobe Research Taskade 政治 Galactica プロット生成 Pika.art クラウドゲーミング AI Filmmaking Assistant 和田洋一リアリティ番組映像解析 FastGAN Stadia ジョンソン裕子セキュリティ 4コママンガ AI Screenwriter MILEs NightCafe 東芝デジタルソリューションズ芥川賞インタラクティブ・ストリーミング Luis Ruiz SATLYS 映像解析AI 文学インタラクティブ・メディア恋愛 PFN 3D Scan ElevenLabs タップル東京工業大学 HeyGen Abema TV Ludo 博報堂 After Effects NEC ラップ PFN 4D Scan 絵本木村屋 SIGGRAPH 2019 ArtEmis Z世代 DreamUp 出版 GPT Store AIラッパーシステム DeviantArt Ammaar Reshi 生成AIチェッカー Waifu Diffusion Stories ユーザーローカル GROVER プラスリンクス～キミと繋がる想い～元素法典 StoryBird 九段理江 FAIR STC Novel AI Versed 東京都同情塔チート検出 Style Transfer Conversation ProlificDreamer オンラインカジノ RCP Unity Sentis 4Dオブジェクト生成モデル RealFlow Rinna Character Platform Unity Muse Align Your Gaussians iPhone CALA Caleb Ward AYG Deep Fluids 宮田龍 MAV3D MeInGame Amelia 清河幸子ファーウェイ AIGraph ブレイン・コンピュータ・インタフェース西中美和 4D Gaussian Splatting BCI Gatebox アフォーダンス安野貴博 4D-GS Learning from Video ANIMAK PaLM-SayCan 斧田小夜 Glaze 予期知能逢妻ヒカリ WebGlaze セコム LLaMA 2 NightShade ユクスキュルバーチャル警備システム Code as Policies Spawning カント損保ジャパン CaP Have I Been Trained?CM3leon Fortnite 上原利之 Stable Doodle Unreal Editor For Fortnite ドラゴンクエストエージェントアーキテクチャアッパーグラウンドコリジョンチェック T2I-Adapter XR PAIR OCTOPATH TRAVELER 西木康智 Volumetrics OCTOPATH TRAVELER 大陸の覇者山口情報芸術センター［YCAM］AIワールドジェネレーターアルスエレクトロニカ2019 品質保証 YCAM 日本マネジメント総合研究所 Rosebud AI Gamemaker StyleRig Autodesk アンラーニング・ランゲージ Layer 逆転オセロニア Bentley Systems カイル・マクドナルド Lily Hughes-Robinson Charisma.ai ワールドシミュレーターローレン・リー・マッカーシー Colossal Cave Adventure 奥村エルネスト純いただきストリート H100 鎖国［Walled Garden］プロジェクト AdventureGPT 調査齋藤精一大森田不可止 COBOL SIGGRAPH ASIA 2022 リリー・ヒューズ＝ロビンソン Meta Quest 高橋智隆 DGX H100 VToonify BabyAGI IP ロボユニザナック DGX SuperPOD ControlVAE GPT-3.5 Turbo 泉幸典仁井谷正充変分オートエンコーダーカーリング強いAI ロボコレ2019 Instant NeRF フォトグラメトリウィンブルドン弱いAI artonomous 回帰型ニューラルネットワーク bitGANs DeepJoin 戦術分析ぎゅわんぶらあ自己中心派 Azure Machine Learning Azure OpenAI Service パフォーマンス測定 Lumiere 意思決定モデル脱出ゲーム DeepL IoT UNet Hybrid Reward Architecture コミュニティ管理 DeepL Write ProFitX ImageFX ウロチョロス Super Phoenix Watsonx MusicFX Project Malmo オンラインゲーム Athletica TextFX 気候変動コーチング Project Paidia シンギュラリティ北見工業大学 Keyframer Project Lookout マックス・プランク気象研究所レイ・カーツワイル北見カーリングホール Watch For ビョルン・スティーブンスヴァーナー・ヴィンジ画像解析 Gemini 1.5 気象モデル Runway Research じりつくん AI Studio LEFT ALIVE 気象シミュレーション Make-A-Video NTT Sportict Vertex AI 長谷川誠ジミ・ヘンドリックス環境問題 Phenaki AIカメラ Chat with RTX Baby X カート・コバーンエコロジー Dreamix STADIUM TUBE Slack ロバート・ダウニー・Jr.エイミー・ワインハウス SDGs Text-to-Imageモデル Pixelllot S3 Slack AI Pokémon Battle Scope ダフト・パンクメモリスタ AIスマートコーチポケットモンスター Glenn Marshall kanaeru The Age of A.I.Story2Hallucination 音声変換 Latitude 占いレコメンデーション Jukebox Dreambooth 行動ロジック生成AI Veap Japan ヤン・ルカン Convai EAP neoAI Perfusion NTTドコモ SIFT 福井千春 DreamIcon ニューラル物理学 Ememe DCGAN 医療 mign 毛髪 Genie MOBA DANNCE メンタルケア studiffuse 荒牧英治汎用AIエージェント人事ハーバード大学 Edgar Handy 中ザワヒデキ AIファッションウィーク研修デューク大学大屋雄裕インフルエンサー中川裕志 Grok-1 mynet.ai ローグライクゲーム Adreeseen Horowitz Mixture-of-Experts 東京理科大学 NVIDIA Avatar Cloud Engine MoE 人工音声 NeurIPS 2021 産業技術総合研究所 Replica Studios Claude 3 リザバーコンピューティング Smart NPCs Claude 3 Haiku プレイ動画ヒップホップ対話型AIモデル Roblox Studio Claude 3 Sonnet 詩ソニーマーケティング Promethean AI Claude 3 Opus サイレント映画もじぱ note 森永乳業環境音暗号通貨 note AIアシスタント Musiio C2PA FUZZLE Ketchup Endel ゲーミフィケーション Alteration AI News Tomo Kihara 粒子群最適化法 Art Selfie Playfool 進化差分法オープンワールド Art Transfer Sonar 遊び群知能下川大樹 AIFA Pet Portraits Sonar+D tsukurun ウィル・ライト高津芳希 P2E Blob Opera 地方創生大石真史クリムト Dolby Atmos 吉田直樹 BEiT StyleGAN-NADA Sonar Music Festival 素材 DETR ライゾマティクス SIMA Spore クリティックネットワーク真鍋大度 OpenAI Japan デノイズ Unity for Industry アクターネットワーク花井裕也 Voice Engine 画像処理 DMLab Ritchie Hawtin Command R+Sentropy GLIDE Control Suite Erica Synth Oracle Cloud Infrastructure CPU Discord AvatarCLIP Atari 100k Ufuk Barış Mutlu Google Workspace Synthetic Data Atari 200M Japanese InstructBLIP Alpha Udio CALM Yann LeCun 日本新聞協会立命館大学プログラミング鈴木雅大 AIいらすとや京都精華大学ソースコード生成コンセプトアート AI Picasso TacticAI GMAI シチズンデベロッパー Sonantic Colie Wertz Emposy NPMP GitHub Cohere リドリー・スコット AIタレント FOOH ウィザードリィ MCN-AI連携モデル絵コンテ AIタレントエージェンシー GPT-4o Urzas.ai ストーリーボード modi.ai Project Astra 大阪大学 BitSummit Google I/O 2024 西川善司並木幸介 Kiki Blender BitSummit Let’s Go!!Gemma 2 サムライスピリッツ森寅嘉 Zoetic AI Veo ゼビウス SIGGRAPH 2021 ペット感情認識ストリートファイター半導体 Digital Dream Labs PaLM API デジタルレプリカ音声加工 Topaz Video Enhance AI Cozmo MakerSuite GOT7 マルタ大学 DLSS タカラトミー Skeb synthesia 田中達大山野辺一記 NetEase LOVOT Dreambooth-Stable-Diffusion HumanRF Inworld AI 大里飛鳥 Dynamixyz MOFLIN Actors-HQ Move AI Romi Google Earth SAG-AFTRA ICRA2024 U-Net ミクシィ GEPPETTO AI WGA IEEE 13フェイズ構造ユニロボット Stable Diffusion web UI チャーリー・ブルッカー大規模基盤モデル ADV ユニボ Point-E Torobo XLand Gato 岡野原大輔東京ロボティクス AI model 自己教師あり学習インピーダンス制御 DEATH STRANDING AI Models In-Context Learning（ICL）深層予測学習 Eric Johnson 汎用強化学習AI ZMO.AI LoRA 日立製作所 MOBBY’S ファインチューニング早稲田大学 Oculus Quest コジマプロダクションロンドン芸術大学モビーディックグランツーリスモ尾形哲也生体情報デシマエンジン Google Brain ダイビング量子コンピュータ AIREC Sound Control アウトドア qubit 汎用ロボット SYNTH SUPER AIスキャニング IBM Quantum System 2 オムロンサイニックエックス照明 Maxim Peter Karl Sims 自動採寸北野宏明 ViLaIn Joshua Romoff Artnome 3DLOOK ダリオ・ヒル PDDL ハイパースケープ ICONATE Sizer ジェン・スン・フアンニューサウスウェールズ大学山崎陽斗ワコール HuggingFace Claude Sammut 立木創太スニーカー Stable Audio オックスフォード大学浜中雅俊 UNSTREET 宗教 Lars Kunze ミライ小町 Newelse 仏教杉浦孔明テスラ福井健策 CheckGoods コカ・コーラ田向権 GameGAN 二次流通食品 VASA-1 パックマン Tesla Bot 中古市場 Coca‑Cola Y3000 Zero Sugar VoxCeleb2 Tesla AI Day Wikipedia Dupe Killer Copilot Copyright Commitment AniTalker ソサエティ5.0 Sphere 偽ブランドテラバース上海大学 SIGGRAPH 2020 バズグラフ Xaver 1000 配信京都大学 Apple Intelligence ニュースタンテキ養蜂立福寛東芝 Beewise ソニー・ピクチャーズアニメーション音声解析 DIB-R 倉田宜典フィンテック感情分析 Luma 投資 Fosters+Partners 周済涛 Dream Machine 韻律射影 MILIZE Zaha Hadid Architects ステートマシン NTT 韻律転移三菱UFJ信託銀行ディープニューラルネットワーク Perplexity

【ICRA2024】大規模基盤モデルとロボットの連携による新たな可能性

2024.5.28先端技術

ロボティクスの国際会議「ICRA2024」、横浜で開催

2024年 5月13日～17日の5日間にわたって、米国電気電子学会（IEEE）が主催する「International Conference on Robotics and Automation（ロボット工学とオートメーションに関する国際会議、略称：ICRA ）」がパシフィコ横浜で開催されました。日本でICRAが開催されたのは３回目、2009年の神戸での開催以来、15年ぶりです。

ICRA（読み方はアイクラ。イクラ派もいます）は、ロボット分野では影響力の大きいいわゆるトップカンファレンスの一つとして知られており、最先端のさまざまな研究が発表されます。今回の論文採択率は45％だったそうです。

現地参加費はIEEEのメンバーは 215,000円、メンバー以外は263,800円。1日参加費は80,000円。加えて、ワークショップ参加費は別途必要となります。円安とはいえ、かなりの金額です。最初見たとき、何かの間違いかと思って桁数を数えてしまいました。その結果でしょうか、日本での開催にもかかわらず、特にカンファレンス会場では海外勢の姿ばかりが目立ちました。

展示会場は大盛況

一方、展示会場では100を超える世界各国のロボット関連企業スポンサーのブースが立ち並び、下手な展示会よりも活況でした。特に目立ったのは中国勢を中心としたヒューマノイド（人型ロボット）の出展です。すごい盛り上がりで通路がまったく通れなくなっていたブースもありました。

通常の展示会ならば運営や向かいのブースから怒られるところですが、学会は基本的に運営ルールが全体的にゆるいのが一般的です。多くのロボットが入れ替わり立ち替わり通路をウロウロしており、非常に楽しい空間になっていました。

展示会場ではスポンサー展示だけではなく、「ICRA-EXPO」と呼ばれる日替わりの実物デモゾーン、ポスター発表、そして11を超えるロボット競技会も行われていました。ロボットは「動いてなんぼ」なので、これは当然と言えます。

また会場が横浜ということで、3月末に横浜でのイベントを終了したばかりの「動くガンダム」の頭部とハンドも展示されており、その前では海外からの参加者たちも思い思いに写真を撮っていました。

ロボットをより柔軟かつロバストに

さて、本題に入ります。いま、少なからぬ人たちがロボットに汎用性、すなわちこれまでにない理解力や環境適応力を持たせるために「大規模基盤モデル」が使えるのではないか、と考えています。単に「ChatGPTをコミュニケーションロボットに使って、色んなやりとりをさせよう」といった話だけではありません。大規模基盤モデルは大量のデータを、Transformerアーキテクチャーの大規模なニューラルネットワークに学習させることで、専門家たちも驚くほどの大きな成果を上げました。「言語の確率モデル」という範囲にとどまらず、言語を通してまるで世界の常識のようなものまで表現されているようです。

ロボットの世界とAIの世界との間には距離があると思っている読者もいらっしゃるかもしれませんが、たとえば、今は「ChatGPT」で世界的に知られるOpenAI社が、2018年ごろは強化学習を使ってロボットハンドでさまざまなものを扱うことができるようにする研究を行なっていました。ですが途中で行き詰まったのか、いったん大規模言語モデルの開発に舵を切って今に至っているという経緯があります。彼らが最近になって再びロボットに手を出しはじめているのは原点回帰と言えます。いったんロボットの難しさを知った上で戻ってきているわけで、成り行きが大いに注目されます。

では、どんなことが期待されているのでしょうか。手法は多少異なっていても目指すところはほぼ同じで、ロボットが自然言語による曖昧な指示の意図を理解し、プログラミングレスで未知環境でも自在に行動でき、未知の物体も適切に扱えるようにしようというものです。さらに、世界の物理的な振る舞いを反映する世界モデルと、さまざまなロボットにも転移学習させることが可能な大規模な行動データセットを整理して提供しよう、あれこれ頑張ればロボットがもっと賢くなるはずだという考え方です。

ロボットの動作の生成にも大規模基盤モデルが期待されています。いまや生成AIは動画も作れるようになりました。つまり、このエージェントは、こういう環境ではこう動くだろうということが、ある程度の範囲ならば辻褄を合わせたかたちで予測されて生成できるようになったことを意味しています。それと同じようなことが、さらにマルチモーダルかつ多様なデータを食わせれば、ロボットの動作生成においても可能なのではないか。そう考えられているわけです。つまりロボット動作基盤モデルの可能性です。

学習に必要なデータについては、実機からの収集に留まらず、人間による遠隔操作などで、ある程度集めた実データをもとに、シミュレーターを使って水増しして作ればいいという考え方もあります。動作データセットを作るためのロボットシステムなども考案されています。

LLMとの連携に向いたロボット

会場に出展されていたロボットにも機械学習の応用研究に適用できることをアピールしているものが多数ありました。たとえば早稲田大学発のスタートアップ・東京ロボティクスのToroboは「LLMとの連携に向いている」とCEOの坂本義弘氏は語りました。Toroboの特徴は全軸にトルクセンサがあり、インピーダンス制御によって柔らかく動かせる体を持っている点です。表面は硬いのですが、一般的なロボットが行なっている位置制御と違って対象にぶつかっても柔らかく制御できるのです。片腕を持って動かすと全身がふわっと動きますし、首をぐるぐると動かすこともできます。

ロボットがもっと役に立つ作業を行うためには必ず何かと接触しなければなりませんが、この接触が難しいのです。生成AIでロボットの動作が作れるようになったとしても、実環境と世界モデルのあいだには必ずギャップがあり、間違った場所にロボットがリーチすると、ロボットが壊れてしまう可能性もあります。そのときに体を柔らかく制御できるインピーダンス制御であれば環境になじむことができるので、ロボットは壊れません。だから今後のAIとの連携に向いている、というわけです。

なおToroboは人よりも少し大きなサイズですが、現在、もっと軽く高速化したモデルを開発中とのことです。なお同社は物流アプリケーションも展開しているので、そのデータも反映させていきたいと考えているということでした。これまで同社は国内のムーンショットプロジェクトなどにロボットを販売してきましたが、今後は海外のビッグテックにも売っていきたいと考えているそうです。

ICRA2024の会場では、他にもいかにもライバルっぽいロボットも出展されていました。今後の切磋琢磨が楽しみです。

AI研究者の見方とロボット研究者の見方

さて話を戻しますが、ここで一気にロボットの性能に革命が起きる可能性もなくはありません。多くの人が、そう期待しています。ただ一方で、AIの研究者たちとは違って、ロボットの研究者たちは必ずしも楽観はしていない…、そんな空気も感じました。

先程の話の繰り返しですが、シミュレーターでうまくいったからといって物理世界でうまくいくとは限りません。CGでそれっぽい動きを作ることはできても、実世界とは必ずズレがあります。重力や慣性、接触による摩擦やノイズのある環境では、シミュレーターのとおりには動きません。

ロボット研究者たちはこれまでも、こういった物理的な問題にずっと苦しんできました。そのため、単にあれこれ思い描くだけではなく、物理的な動作を伴うロボットの制御に関しては「そんなに簡単ではないだろう」と思っているようです。ですがそれでも、今度こそは革命的なことが起こるのではないかと多くの人が期待している。そんな状況です。

ロボットに汎用性が必要とされている理由

汎用性がなぜそこまで必要なのでしょうか。単純に言えば、世界が複雑だからです。ロボット適用を目指す領域はさまざまです。ロボットにはアカデミアの他、産業用ロボットの世界とサービスロボットの世界があって、それぞれ評価基準が大きく異なりますが、いずれの領域においても、ロボットが柔軟かつロバストな存在になることが求められています。

産業用の世界では基本的には決まりきった動きをするわけですが、いまだにロボットが苦手な作業対象があります。また、最近は「変種変量」生産に対応する必要があり、そのためにいちいち再プログラミングするのは現実的に困難であるため、自動化しきれない部分が残っています。

人に対してサービスを提供することもあるサービスロボットの世界での適応能力の必要性は言うまでもありません。ロボットのセンサーの機能や移動経路計画のスキルはだいぶ向上してきましたが、工場や倉庫と違って、きれいに整理整頓されていない場所でロボットを動かして作業させることは今もとても困難です。また、接する人もさまざまです。

「掃除だけ」とか、「物をAからBへ運ぶだけ」といった作業にとどまらず、サービス領域でロボットがさらに活躍できるようにするためには、ある程度の汎用性が必要です。

モデルは不完全だと考える深層予測学習のパワー

しばらく前から深層予測学習を提案しているのが日立製作所と早稲田大学理工学術院の尾形哲也教授らです。ロボットは学習内容から未来の状況を予測しながら行動することで、未知の環境に適応します。ICRA 2024ではドアを開けて通ったり、洗濯物を取り込むといったデモを披露していました。

デモだけ見れば「なんだそんなことか」と思うでしょう。何が難しいのでしょうか。ドアにはいろんな種類があり、開け方が違います。洗濯物は毎回かたちが異なり、常にふらふらと変形しています。つまり「どこをどう見るべきか、どこをつまんでどんな力をかければいいか」は、毎回異なるのです。それを自律でやらせようという試みです。

深層予測学習では、事前にすべての状態に対応する予測モデルを作ることは不可能だと考えて、最初から「モデルは不完全だ」と考えます。そして現在の状況とモデル予測誤差を最小化しようとするアルゴリズムを採用しました。学習には、ロボットの片目からの入力画像と、間接角、手先の触覚のデータが全て使われています。いわゆるマルチモーダル学習です。

ネットワークはロボットがどこを見ているかを示す注意機構を予測学習の枠組みで学習させることができます。どういうことかというと、全体としてはロボットのセンサー値が予測結果として出力されるのですが、「タスク成功のためにはどこを見るべきか」という情報は、学習の過程で自動的に学習されるのです。

ロボットは誤差を最小化するために動作を調整し続け、不定形な物体に対しても重要な部分だけ見ることになります。教示データはデモンストレーションデータだけです。まさにEnd-to-Endで、いちいちつかむべき場所などを教える必要はありません。この考え方により、照明条件などが変動するなかでもロバストにタスクを成功させられるようになったそうです。もっとも、会場のデモでもうまくいったり行かなかったりでしたが、今後に期待したいところです。

向かいのブースではJSTムーンショット目標３で進められているAIRECという汎用ロボットを目指す研究のデモとして、台拭きや卵料理も行われていました。

将来は人と一緒に料理するロボットも？

オムロンが2018年に設立した研究子会社・オムロンサイニックエックスからは、今回のICRA2024に６件の論文が採択されたというリリースが出ていました。「人と機械の融和」を目指す彼らが掲げている技術テーマの一つが、AIとロボティクスの活用です。

具体例の一つとしては、調理の手順やコツを人間から学べるロボットの開発等を進めています。たとえばレシピサイトを見ると、色々な食材の写真や調理手順が掲載されていますが、そのような調理レシピを画像から自動生成し、ロボットが実行可能なかたちに変換する仕組み（タスクプランニング）などを研究開発しています。将来は人と一緒にロボットが調理をしてくれる世界を目指すものです。より一般的には「現状を認識しながら人の指示に従えるロボット」ということになります。

今回発表された「ViLaIn（Vision-Language Interpreter for Robot Task Planning）」というフレームワークは、大規模言語モデルと従来の記号的プランナーをつなぐためのものです。大規模言語モデルは言語による指示をロボットのプランに変換することが可能です。ただし、ロボットが実行可能な出力を出してくれるとは限りません。そこで、論理的に正しいプランを得るために古典的プランニングと大規模言語モデル、それぞれの長所を組み合わせようという考え方です。

大規模言語モデルと視覚言語モデルを使って、言語指示とシーン観察から従来型のプランナー向けの問題の記述を生成します。問題は「PDDL（Planning Domain Definition Launguage）」という形式で記述されます。次に生成された記述に基づいて有効なプランを見つけるために記号プランナーを走らせます。評価指標を考案し、実験を行った結果、99％以上の精度で正しい問題を生成し、58%以上の精度で有効な計画を生成できたとのことです。

他にも、柔らかい体を持つロボットを深層強化学習で制御する研究などを行なっています。ロボット業界では古典的なペグインホールという「穴にものを入れる」タスクがあるのですが、それをフニャフニャの手首のロボットと、ロボット自身のセンサーのみを使って記憶ベースのエージェントを学習させたところ、うまくできるようになったとのことです。

こういった研究が実用へと繋がるかは分かりませんが、今回、ICRAに６本の論文が通過していることからも、オムロンサイニックエックスが今の世界的研究トレンドにのっとった研究を行っていることは確かなようです。

汎用サービスロボットへの長い道のり

筆者が参加したフォーラムのテーマは「Foundation Models and Architectures for Service Robots in the Future Home（未来の家のサービスロボットのための基盤モデルとアーキテクチャ）」でした。GPSR（General Purpose Service Robot）と言われる汎用サービスロボットや家庭用サービスロボットを開発するための試みと、汎用ロボットを目指す競技会の一つ「ロボカップ@ホーム」への最近の技術的影響が議論されました。

コンピュータビジョンの進歩やディープラーニングによって、ロボットによる物体検出や人物追跡、話者認識などは大幅に楽になっています。ですが機械学習は必ずしも万能ではありません。基本的に大きなデータセットが必要だからです。そのデータ量を減らす手法が必要とされています。オーストラリア・ニューサウスウェールズ大学教授の Claude Sammut氏は、そのための方法として、強化学習を行う前に、その制約条件を得るための定性的なモデルの獲得が必要だと述べました。

オックスフォード大学教授のLars Kunze氏は「ロボットを説明可能、安全、信頼できるものにする」と題して講演しました。ロボットが実際のオフィスや家庭に入るためには、ロボット自体が何を知っているのかを外に説明する必要があります。フランス・ブレスト国立工科大学教授のCédric Buche氏は最初にデータプライバシーの問題について強調しました。

パネルディスカッションではサービスロボットが家庭に普及しない理由、そもそもどんなサービスが期待されているのか、規制の課題など、色々なテーマに関する議論が行われました。会場からは例えば「家庭用にロボットを開発することを想定した場合、特定のタスクをいくつか選んでフォーカスしたほうがいいのか、あるいはもっと漠然とした用途に対応したり会話の相手をしてあげるロボットを開発したほうがいいのか、どちらのほうがメリットがあると思うか？」といった質問が寄せられました。これは技術の話だけではありませんので、なかなか正解は出ない問題ですが、「人間と直接比較されるようなタスクをロボットにやらせることは得策ではないだろう」という話が出ていました。

基盤モデルの活用についても議題に上がりました。パネリストの一人だった慶應義塾大学教授の杉浦孔明氏は「対話における自然言語処理や状況認識など多くの課題が今はLLMひとつでカバーできるようになり、サービスロボットの開発は以前より明らかに簡単になった」とコメントしました。

実際に会場でも行われていたのですが、確かに、最初の指示を理解するタスク、いわゆる自然言語処理タスクや、状況そのものの理解に関しては、以前よりも大幅に楽になったようです。でもロボット競技大会では、今でも出場者たちはさまざまなオブジェクトの大きさを巻尺で測ったりしています。以前より楽にはなったとは言っても、いわゆるゼロショットで何でもできる汎用ロボットへの道は、まだ遠いのです。「常識」を提供する世界モデルや、さまざまなロボットに適用可能な汎用的なスキルセットのようなものが必要です。

また先程のオムロンサイニックエックスのところでも出た話ですが、従来の形式的手法と大規模言語モデルの間の対応関係を見つけて利用することが重要だ、という話も出ました。このあたりが妥当な意見なのでしょう。

脳型情報処理の研究者であり、Hibikino-Musashiというチームで「ロボカップ＠ホーム」の常連である九州工業大学教授の田向権氏は、環境における記憶のモデリングを使った処理や、小さなニューラルネットワークモデルで時系列データを扱って、ロボカップの課題を解く研究について紹介しました。ロボカップの課題とは、たとえば朝食の配膳準備をしたり、未知のレストランでサーブをするといったものです。行動プランナーには大規模言語モデルを使っているのですが、今でもこれらはとても難しい課題だと田向氏は語りました。今はまだ「大規模基盤モデルを使えば全部終了」というわけにはいきそうにありません。ですが挑戦は続きます。

九州工業大学の田向権氏の発表から。音声認識のほか、指示意図の理解、ロボットの行動プランを立てるためにLLMが使われています

急接近するロボットとAIの未来は

歴史を振り返ると、もともとロボットと人工知能は、互いに両輪のように発展してきた分野です。しかし両者のあいだはいつしか大きな距離ができていたことも、また事実です。ですがここに来て両者が急激に接近しようとしてる気配があります。

モデル学習のために実世界のマルチモーダル・データを収集するためにはロボットが必要ですし、実世界に物理的に直接影響を与えようと思ったらロボットを使うのがもっとも単純です。ロボットのほうも、今まではずっと人間により制御されてきましたが、今後は本当に自らのセンシングによる知覚、完全自律での判断と知覚情報の変換、そしてアクションを行えるようになるのかもしれません。

大規模言語モデルが急にブレイクして一般の人でもわかるくらい進展したように、ロボットが自在に動かせるようになったら、大きな変化が社会にもたらされる可能性があります。どれだけうまくいくのか現状では不透明ですが期待したいと思っています。

Writer：森山和道