モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。

TAG LIST
CGCGへの扉安藤幸央機械学習ディープラーニング月刊エンタメAIニュース河合律子GANOpenAI吉本幸記音楽NVIDIA生成系AI強化学習ニューラルネットワーク三宅陽一郎GoogleStable DiffusionグーグルQAシナリオDeepMind人工知能学会GPT-3森川幸人自然言語処理ChatGPTFacebook大内孝子マイクロソフト大規模言語モデル映画キャラクターAI敵対的生成ネットワークルールベースAIと倫理アートゲームプレイAIスクウェア・エニックスモリカトロンAIラボインタビュー倫理SIGGRAPH著作権モリカトロンデバッグ画像生成NFTDALL-E2StyleGANプロシージャルLLM遺伝的アルゴリズムNPC自動生成テストプレイメタAI画像生成AIテキスト画像生成ロボット深層学習ファッションCEDEC2019ディープフェイクVFXAdobeMidjourneyデジタルツインボードゲームDALL-ECLIPビヘイビア・ツリーマンガCEDEC2021CEDEC2020ゲームAIメタバース不完全情報ゲームVRナビゲーションAI畳み込みニューラルネットワークGDC 2021JSAI2022作曲NVIDIA OmniverseGDC 2019マルチエージェントCEDEC2022MinecraftAIアート小説アニメーションStability AIメタ懐ゲーから辿るゲームAI技術史toioジェネレーティブAI音楽生成AIスポーツ栗原聡手塚治虫CNNバーチャルヒューマンBERTMicrosoftUnityMetaOmniverse3DCGJSAI2023鴫原盛之HTN階層型タスクネットワークソニーGPT-4汎用人工知能JSAI2020GTC2023NeRFTensorFlowインタビューイベントレポート対話型エージェントAmazonロボティクスDQN水野勇太アバターUbisoftGenvid TechnologiesガイスターStyleGAN2デジタルヒューマンGTC2022教育JSAI2021はこだて未来大学研究エージェントシムピープルMCS-AI動的連携モデルプロンプトモーションキャプチャーTEZUKA2020CEDEC2023マルチモーダルElectronic Arts3DマーケティングメタデータGDC SummerブロックチェーンCMMicrosoft Azureアストロノーカキャリア模倣学習eスポーツスタンフォード大学アーケードゲームテニスサイバーエージェントトレーディングカード音声認識メディアアート類家利直eSportsBLUE PROTOCOLシーマンaibo合成音声チャットボットブラック・ジャックAWS徳井直生斎藤由多加AlphaZeroTransformerARGPT-2rinnaAIりんなカメラELSI環世界中島秀之PaLM哲学ベリサーブPlayable!GPT-3.5理化学研究所Gen-1SIGGRAPH ASIASFNetflixデータマイニング東京大学Bard現代アートDARPAドローンシムシティImagenZorkバイアスASBSぱいどんアドベンチャーゲームAI美空ひばりテキスト生成手塚眞バンダイナムコ研究所スパーシャルAINEDOFSM-DNNLEFT 4 DEADイーロン・マスク通しプレイOpenAI FiveStable Diffusion XL本間翔太馬淵浩希Cygames森山和道Audio2Faceピクサープラチナエッグイーサリアムボエダ・ゴティエビッグデータ中嶋謙互Amadeus Codeデータ分析MILEナラティブNVIDIA RivaOmniverse ReplicatorWCCFレコメンドシステムNVIDIA DRIVE SimWORLD CLUB Champion FootballNVIDIA Isaac Simセガ柏田知大軍事田邊雅彦トレカMax CooperGPTFireflyPyTorchChatGPT4眞鍋和子バンダイナムコスタジオ大澤博隆SFプロトタイピング齊藤陽介マインクラフトお知らせMagic Leap OneTencentモリカトロン開発者インタビュー宮本茂則バスケットボールサルでもわかる人工知能text-to-3DVAEDreamFusionTEZUKA2023リップシンキングRNNUbisoft La Forge自動運転車ワークショップ知識表現ウォッチドッグス レギオンVTuberIGDA立教大学秋期GTC2022市場分析どうぶつしょうぎEpic GamesRobloxジェイ・コウガミ音楽ストリーミングMITAIロボ「迷キュー」に挑戦野々下裕子Adobe MAXマシンラーニング村井源5GMuZeroRival Peakpixivオムロン サイニックエックスクラウド電気通信大学対話エンジン稲葉通将3Dスキャン橋本敦史リトル・コンピュータ・ピープルCodexシーマン人工知能研究所コンピューティショナル・フォトグラフィーPreferred Networksゴブレット・ゴブラーズ絵画Microsoft DesignerイラストシミュレーションSoul Machines柿沼太一完全情報ゲーム坂本洋典釜屋憲彦ウェイポイントLLaMAパス検索対談藤澤仁生物学GTC 2022画像認識ハリウッドSiemensストライキStyleCLIPDeNA長谷洋平クラウドコンピューティングmasumi toyotaIBM宮路洋一OpenSeaGDC 2022SNSTextWorldEarth-2BingMagentaYouTube音声生成AIELYZA PencilScenarioSIGGRAPH2023テキスト画像生成AI松尾豊AIピカソGTC2021AI素材.comCycleGANテンセントAIQVE ONENetHackキャラクターモーションControlNetNBAフェイクニュースユニバーサルミュージックRPG法律SIGGRAPH 2022世界モデルレベルデザインゲームエンジンDreamerV3AIボイスアクター南カリフォルニア大学NVIDIA CanvasGPUALife人工生命オルタナティヴ・マシンサウンドスケープLaMDATRPGマジック:ザ・ギャザリングAI DungeonRed Ramマーダーミステリーゲーム背景不気味の谷ナビゲーションメッシュインディーゲーム高橋ミレイ深層強化学習松原仁松井俊浩武田英明ELYZAフルコトELYZA DIGEST建築音声合成広告西成活裕ハイブリッドアーキテクチャApex LegendsELIZA群衆マネジメントライブポートレイトNinjaコンピュータRPGライブビジネスWonder StudioAdobe Max 2023アップルタウン物語新型コロナ土木MindAgentKELDIC周済涛BIMBing Chatメロディ言語清田陽司インフラBing Image CreatorゲームTENTUPLAYサイバネティックスDALL-E 3MARVEL Future FightAstro人工知能史Amazon BedrockAssistant with BardタイムラプスEgo4DAI哲学マップThe Arcadeバスキア星新一X.AISearch Generative Experience日経イノベーション・ラボStyleGAN-XLX Corp.Dynalang敵対的強化学習StyleGAN3TwitterVLE-CE階層型強化学習GOSU Data LabGANimatorXホールディングス論文WANNGOSU Voice AssistantVoLux-GANMagiAI Act竹内将SenpAI.GGProjected GANEUMobalyticsSelf-Distilled StyleGANSDXLArs ElectronicaニューラルレンダリングRTFKTAI規制岡島学AWS SagemakerPLATONIKE欧州委員会映像セリア・ホデント形態素解析frame.ioClone X欧州議会UXAWS LambdaFoodly村上隆欧州理事会誤字検出MusicLM認知科学中川友紀子Digital MarkAudioLMゲームデザインSentencePieceアールティSnapchatMusicCapsLUMINOUS ENGINEクリエイターコミュニティAudioCraftLuminous ProductionsBlenderBot 3バーチャルペット効果音パターン・ランゲージ竹村也哉Meta AINVIDIA NeMo ServiceMubertちょまどマーク・ザッカーバーグヴァネッサ・ローザMubert RenderGOAPWACULVanessa A RosaGen-2Adobe MAX 2021陶芸Runway AI Film Festival自動翻訳Play.htPreViz音声AINVIDIA ACEAIライティングLiDARCharacter-LLMOmniverse AvatarAIのべりすとPolycam復旦大学FPSQuillBotdeforumChat-Haruhi-Suzumiyaマルコフ決定過程NVIDIA MegatronCopysmith動画生成AI涼宮ハルヒNVIDIA MerlinJasperハーベストEmu VideoNVIDIA MetropolisForGamesNianticパラメータ設計ゲームマーケットペリドットバランス調整岡野翔太Dream Track協調フィルタリング郡山喜彦Music AI Tools人狼知能テキサス大学ジェフリー・ヒントンLyriaGoogle I/O 2023Yahoo!知恵袋AlphaDogfight TrialsAI Messenger VoicebotGoogle I/OインタラクティブプロンプトAIエージェントシミュレーションOpenAI Codex武蔵野美術大学慶應義塾大学StarCraft IIHyperStyleBingAI石渡正人Future of Life InstituteRendering with Style手塚プロダクションIntelDisney林海象LAIKADisneyリサーチヴィトゲンシュタインPhotoshop古川善規RotomationGauGAN論理哲学論考Lightroom大規模再構成モデルGauGAN2京都芸術大学CanvaLRMドラゴンクエストライバルズ画像言語表現モデルObjaverse不確定ゲームSIGGRAPH ASIA 2021PromptBaseBOOTHMVImgNetDota 2モンテカルロ木探索ディズニーリサーチpixivFANBOXOne-2-3-45Mitsuba2バンダイナムコネクサス虎の穴3DガウシアンスプラッティングソーシャルゲームEmbeddingワイツマン科学研究所ユーザーレビューFantiaワンショット3D生成技術GTC2020CG衣装mimicとらのあな高橋力斗NVIDIA MAXINEVRファッションBaidu集英社淡路滋ビデオ会議ArtflowERNIE-ViLG少年ジャンプ+グリムノーツEponym古文書ComicCopilotゴティエ・ボエダ音声クローニング凸版印刷コミコパGautier Boeda階層的クラスタリングGopherAI-OCRゲームマスター画像判定Inowrld AIJuliusSIE鑑定ラベル付けMODTPRGOxia PalusGhostwriterバーチャル・ヒューマン・エージェントtoio SDK for UnityArt RecognitionSkyrimクーガー田中章愛実況パワフルサッカースカイリム石井敦銭起揚NHC 2021桃太郎電鉄RPGツクールMZ茂谷保伯池田利夫桃鉄ChatGPT_APIMZGDMC新刊案内パワサカダンジョンズ&ドラゴンズマーベル・シネマティック・ユニバースコナミデジタルエンタテインメントOracle RPG成沢理恵MITメディアラボMCU岩倉宏介深津貴之アベンジャーズPPOxVASynthマジック・リープDigital DomainMachine Learning Project CanvasLaser-NVMagendaMasquerade2.0国立情報学研究所ノンファンジブルトークンDDSPフェイシャルキャプチャー石川冬樹MERFサッカースパコンAlibaba里井大輝KaggleスーパーコンピュータVQRF山田暉松岡 聡nvdiffrecAssassin’s Creed OriginsAI会話ジェネレーターTSUBAME 1.0NeRFMeshingSea of ThievesTSUBAME 2.0LERFGEMS COMPANYmonoAI technologyLSTMABCIマスタリングモリカトロンAIソリューション富岳TikTok初音ミクOculusコード生成AISociety 5.0リアム・ギャラガー転移学習テストAlphaCode夏の電脳甲子園グライムスBaldur's Gate 3Codeforces座談会BoomyCandy Crush Saga自己増強型AItext-to-imageジョン・レジェンドSIGGRAPH ASIA 2020COLMAPザ・ウィークエンドADOPNVIDIA GET3DドレイクデバッギングBigGANGANverse3DMaterialGANグランツーリスモSPORTAI絵師エッジワークスReBeLグランツーリスモ・ソフィーUGC日本音楽作家団体協議会GTソフィーPGCFCAVolvoFIAグランツーリスモチャンピオンシップVoiceboxNovelAIさくらインターネットRival PrakDGX A100NovelAI DiffusionぷよぷよユービーアイソフトWebcam VTuberモーションデータ星新一賞大阪公立大学北尾まどかHALOポーズ推定TCG将棋メタルギアソリッドVフォートナイトメッシュ生成KLabFSMメルセデス・ベンツQRコードMagic Leap囲碁ナップサック問題Live NationEpyllionデンソー汎用言語モデルWeb3.0マシュー・ボールデンソーウェーブAIOpsムーアの法則原昌宏Spotifyスマートコントラクト日本機械学会Replica Studioロボティクス・メカトロニクス講演会amuseChitrakarQosmoAdobe MAX 2022トヨタ自動車巡回セールスマン問題かんばん方式ジョルダン曲線メディアAdobe Research政治Galacticaプロット生成クラウドゲーミングがんばれ森川君2号和田洋一リアリティ番組映像解析FastGANStadiaジョンソン裕子セキュリティ4コママンガMILEsNightCafe東芝デジタルソリューションズインタラクティブ・ストリーミングLuis RuizSATLYS 映像解析AIインタラクティブ・メディアポケモンPFN 3D ScanElevenLabs東京工業大学HeyGenLudo博報堂After EffectsラップPFN 4D Scan絵本SIGGRAPH 2019ArtEmisZ世代DreamUp出版AIラッパーシステムDeviantArtAmmaar ReshiWaifu DiffusionStoriesGROVERプラスリンクス ~キミと繋がる想い~元素法典StoryBirdFAIRSTCNovel AIVersedチート検出Style Transfer ConversationOpen AIProlificDreamerオンラインカジノRCPUnity SentisアップルRealFlowRinna Character PlatformUnity MuseiPhoneCALACaleb WardDeep Fluids宮田龍MeInGameAmelia清河幸子AIGraphブレイン・コンピュータ・インタフェースバーチャルキャラクター西中美和BCIGateboxアフォーダンス安野貴博Learning from VideoANIMAKPaLM-SayCan斧田小夜予期知能逢妻ヒカリ宮本道人セコムGitHub CopilotLLaMA 2ユクスキュルバーチャル警備システムCode as Policiesカント損保ジャパンCaPHugging FaceCM3leon上原利之Stable DoodleドラゴンクエストエージェントアーキテクチャアッパーグラウンドコリジョンチェックT2I-AdapterPAIROCTOPATH TRAVELERxAI西木康智OCTOPATH TRAVELER 大陸の覇者山口情報芸術センター[YCAM]アルスエレクトロニカ2019品質保証YCAM日本マネジメント総合研究所StyleRigAutodeskアンラーニング・ランゲージVoyager逆転オセロニアBentley Systemsカイル・マクドナルドLily Hughes-Robinsonワールドシミュレーターローレン・リー・マッカーシーColossal Cave Adventure奥村エルネスト純いただきストリートH100鎖国[Walled Garden]​​プロジェクトAdventureGPT齋藤精一大森田不可止COBOLSIGGRAPH ASIA 2022リリー・ヒューズ=ロビンソン高橋智隆DGX H100VToonifyBabyAGIロボユニザナックDGX SuperPODControlVAEGPT-3.5 Turbo泉幸典仁井谷正充変分オートエンコーダーカーリングロボコレ2019Instant NeRFフォトグラメトリウィンブルドンartonomous回帰型ニューラルネットワークbitGANsDeepJoin戦術分析ぎゅわんぶらあ自己中心派Azure Machine LearningAzure OpenAI Serviceパフォーマンス測定意思決定モデル脱出ゲームDeepLIoTHybrid Reward Architectureコミュニティ管理DeepL WriteProFitXウロチョロスSuper PhoenixWatsonxProject MalmoオンラインゲームAthletica気候変動コーチングProject Paidiaシンギュラリティ北見工業大学Project Lookoutマックス・プランク気象研究所レイ・カーツワイル北見カーリングホールWatch Forビョルン・スティーブンスヴァーナー・ヴィンジ画像解析気象モデルRunway ResearchじりつくんLEFT ALIVE気象シミュレーションMake-A-VideoNTT Sportict長谷川誠ジミ・ヘンドリックス環境問題PhenakiAIカメラBaby Xカート・コバーンエコロジーDreamixSTADIUM TUBEロバート・ダウニー・Jr.エイミー・ワインハウスSDGsText-to-ImageモデルPixelllot S3ソフトバンクダフト・パンクメモリスタAIスマートコーチGlenn MarshallThe Age of A.I.Story2Hallucination音声変換LatitudeレコメンデーションJukeboxDreamboothVeap Japanヤン・ルカンEAPneoAIPerfusionSIFT福井千春DreamIconニューラル物理学DCGAN医療mign毛髪MOBADANNCEメンタルケアstudiffuse荒牧英治人事ハーバード大学Edgar HandyAndreessen Horowitz中ザワヒデキ研修デューク大学大屋雄裕QA Tech Night中川裕志mynet.aiローグライクゲーム松木晋祐Adreeseen Horowitz東京理科大学下田純也NVIDIA Avatar Cloud Engine人工音声NeurIPS 2021産業技術総合研究所桑野範久Replica StudiosリザバーコンピューティングSmart NPCsプレイ動画ヒップホップ対話型AIモデルRoblox StudioソニーマーケティングPromethean AIサイレント映画もじぱnote音源分離環境音暗号通貨note AIアシスタントMusiioFUZZLEKetchupEndelAlterationAI News粒子群最適化法Art Selfie進化差分法オープンワールドArt TransferSonar群知能下川大樹AIFAPet PortraitsSonar+Dウィル・ライト高津芳希P2EBlob OperaWeb3大石真史クリムトDolby AtmosBEiTStyleGAN-NADASonar Music FestivalDETRライゾマティクスSporeUnreal Engineクリティックネットワーク真鍋大度デノイズUnity for Industryアクターネットワーク花井裕也画像処理DMLabRitchie HawtinSentropyGLIDEControl SuiteErica SynthCPUDiscordAvatarCLIPAtari 100kUfuk Barış MutluSynthetic DataAtari 200MJapanese InstructBLIP AlphaCALMYann LeCun日本新聞協会プログラミングサム・アルトマン鈴木雅大AIいらすとやソースコード生成コンセプトアートAI PicassoGMAIシチズンデベロッパーSonanticColie WertzEmposyGitHubCohereリドリー・スコットAIタレントウィザードリィMCN-AI連携モデル絵コンテAIタレントエージェンシーUrzas.aiストーリーボードmodi.ai介護大阪大学BitSummit西川善司並木幸介KikiBlenderBitSummit Let’s Go!!サムライスピリッツ森寅嘉Zoetic AIゼビウスSIGGRAPH 2021ペットストリートファイター半導体Digital Dream LabsPaLM APIデジタルレプリカTopaz Video Enhance AICozmoMakerSuiteGOT7DLSSタカラトミーSkebsynthesia山野辺一記NetEaseLOVOTDreambooth-Stable-DiffusionHumanRF大里飛鳥DynamixyzMOFLINActors-HQRomiGoogle EarthSAG-AFTRAU-NetミクシィGEPPETTO AIWGA13フェイズ構造ユニロボットStable Diffusion web UIチャーリー・ブルッカーADVユニボPoint-EXLandGatoアパレル岡野原大輔AGIAI model自己教師あり学習DEATH STRANDINGAI ModelsIn-Context Learning(ICL)Eric Johnson汎用強化学習AIZMO.AILoRAデザインMOBBY’SファインチューニングOculus Questコジマプロダクションロンドン芸術大学モビーディックグランツーリスモ生体情報デシマエンジンGoogle Brainダイビング量子コンピュータSound Controlアウトドアqubit写真SYNTH SUPERAIスキャニングIBM Quantum System 2照明Maxim PeterKarl Sims自動採寸北野宏明Joshua RomoffArtnome3DLOOKダリオ・ヒルハイパースケープICONATESizerジェン・スン・フアン山崎陽斗ワコールHuggingFace立木創太スニーカーStable Audio浜中雅俊UNSTREET宗教ミライ小町Newelse仏教テスラ福井健策CheckGoodsコカ・コーラGameGAN二次流通食品パックマンTesla Bot中古市場Coca‑Cola Y3000 Zero SugarTesla AI DayWikipediaDupe KillerCopilot Copyright Commitmentソサエティ5.0Sphere偽ブランドテラバースSIGGRAPH 2020バズグラフXaver 1000配信京都大学ニュースタンテキ養蜂立福寛東芝Beewiseソニー・ピクチャーズ アニメーション音声解析DIB-R倉田宜典フィンテック感情分析投資Fosters+Partners周 済涛韻律射影MILIZEZaha Hadid Architectsステートマシン韻律転移三菱UFJ信託銀行ディープニューラルネットワーク

生物が“音の棲み分け”をする環境を、ALife研究者が再現する理由

2020.3.18サイエンス

生物が“音の棲み分け”をする環境を、ALife研究者が再現する理由

「ANH」はその場の音環境にリアルタイムに適応し、自然環境のような豊かなサウンドスケープを生成する音響自動生成マシン。ALife研究者によるスタートアップ、オルタナティヴ・マシン社によって開発が進められ、2019年12月に開催された音楽とデジタルアートの祭典MUTEK.JP 2019で試作機「ANH-00」が初公開されました。その特徴のひとつはサウンドの生成時に遺伝的アルゴリズム(GA)を使っていることです。本稿ではANHの開発に携わる青木竜太氏(ディレクター)と升森敦士氏(ソフトウェア設計・開発)、土井樹氏(ソフトウェア設計・開発)、ジョン・スミス氏(ハードウェア設計・開発)をモリカトロンAIラボ所長の森川幸人とともに訪ね、彼らが構想するテクノロジーと人類の未来についてお伝えします。

サウンドスケープで見える、生物の生きる環境

森川幸人氏(以下、森川):サウンドスケープを自動生成する「ANH」、これはどういうものなのですか?

青木竜太氏(以下、青木):まずANHの概要ですが、これは設置場所の環境音を収集し、その周波数帯域の空きが自然と埋まるような新たな音を自律的に生成し出力する装置です。

プロジェクトの背景には、世界中でフィールドレコーディングをしてきたバーニー・クラウスという、有名な生体音響学者の存在があります。彼は、その結果から生物の鳴き声には、時間的にも空間的にも周波数的にも重なりがないということを見つけました。生物は音を棲み分けて、共生して進化してきたのではないかという仮設を立てたのです。これを「音のニッチ仮説(The Acoustic Niche Hypothesis)」と言います。

例えば森などは広範囲に音が埋まった状態です。それを生物が作り出しているとしたならば、都市においては大幅に音が欠落していることになります。実際、レコーディングをすると上の方の帯域の音がなかったりします。これはまだ実証されたことではありませんが、人間はもともと自然に暮らしていましたから、自然にはあった周波数帯がないことが、心理的にも生理的にも何らかの影響を与えていると言われています。じゃあ、それを人工的にどう作り出すかという所で、今回のプロジェクトが始まり、ALIFE Lab.とISIDが進めるALife(人工生命)の社会応用に向けた共同研究プロジェクト「集団の形成メカニズムの分析と介入方法の実証」の一環として実施することになりました。

バーニー・クラウスによる音のニッチ仮説

森川:環境音もふくめて全部の帯域が埋まっている感じなんですか? その中で生物はちゃっかり空きを見つけて棲み分けていると。それは声を大きくするとか、特殊な波形にする、とかではなく?

升森敦士氏(以下、升森):進化よりも短いタイムスケールでも、よく聞こえないから大きな声を出すとか、ちょっと高い音にするなどして調節することもあります。それはそれであるのですが、これは長いタイムスケールの話で、他の生物の声と同じ帯域でかぶってしまわないように発声器官などを進化させて、本当に周波数帯域などを棲み分けているということです。

森川:人間が聞こえるのは20Hzから20,000Hzと言われますが、動物によって可聴域が異なりますよね。

土井樹氏(以下、土井):そうですね。例えばもっと高い周波数でやり取りしているネズミやコウモリなら、その生息環境を周波数スペクトル(横軸が時間、縦軸が周波数、色の濃さが音の強さを表す)で見ると人が聞こえない帯域で埋まっていると思われます。

森川:もっと他の生物が聞こえないような領域、より高周波を受け取るようには進化しなかったのですかね。

升森:それもあると思います。生物はどんどん人間が聞こえない領域にずれていって、空いている所でコミュニケーションするよう進化している。高周波も結構埋まっていますね。

土井:もしかしたら、何億年か前はそこが埋まっていなかったかもしれない。

青木:いわゆる「ハイパーソニック・エフェクト」と言われる可聴域を超える音がヒトの生理活動に影響をあたえる現象、これはまだ実証されたわけではありませんが、少なくとも脳が反応しているということだけは分かり始めています。すごく乱暴に言うと、人間の耳には聞こえないが脳で感じることはできて身体に良いとか、リラックス効果があると。確かではないのであえて言ってはいませんが、そういうこともふくめることによって癒やし的な効果も期待しています。

升森:つい最近の研究でも、細胞が音を聞いているというのがありましたね。おそらく表面振動があって、それによって何かしらの影響を受けるとか。入力としてそれがあって、それで自分の内部状態が変わるということだと思います。

青木:聞いているというよりは身体で感じているという。

森川:これは海の中でも起こっていることですか?

土井:起こってないとは言い切れないんじゃないかなと思います。海の方が音の伝達速度は速いですし重要な情報伝達媒体として使われているんじゃないかと思います。。

升森:クジラとかイルカとか分かれているのではないかな。

森川:クジラと船のエンジン音がバッティングするという話もありますね。

升森:ありましたね。それでコミュニケーションがうまくいかなくて、変な方向に泳いで行ってしまうと。海だと最近おもしろいのが、サンゴ礁が死滅した場所でサンゴ礁のいる環境の音を流してやると魚が帰ってくるという。音が環境として重要な要素だということですよね。

森川:海の生物が視覚だけとか嗅覚だけではなく、聴覚も利用しているというのは、おもしろいですね。

升森:森に対してもそういう効果があるかもしれない。人間は都市を作ることで環境を壊してしまった。そのため、高周波帯域などガッツリなくなってしまったけど、そこでこういうものを作ることで抜けている帯域が自然と埋まってきて、自然な周波数分布に導かれていく。サンゴ礁の話のように、鳥など生物が戻ってくると。

青木:人工的な環境で帯域の欠損がある時、そこが埋まることが何かしら生物や人間にとっていい可能性があるというのと、今言ったような生態系を取り戻す、呼び込み効果的なものがあるかもしれない。まだ分からないけど、それを研究として進めていこうということです。

遺伝的アルゴリズムによるサウンドスケープの自律生成

青木:ここでANH-00のデモを聞いていただきたいのですが、これはレコーディングして再生するのではなくて、その場の音に適用してリアルタイムにサウンドスケープを作り出しています。試作機は室内空間の使用を想定していますが、将来的には工場や都市スケールに展開していきたいと考えています。

これは試作機ですが、ボックスの中にマシンやアンプが入っていて、ぶら下がっているのがマイクとスピーカーです。MUTEKの時のように本当はもっとあった方がいいんですが、今はそこにある2台でコミュニケーションをして、徐々に音の感じが進化して変わっていきます。場の音が変われば、さらに変わっていきます。環境音が変わっていく方がおもしろい感じになりますね。

ANH-00の電源を入れて1分ほど待つと、生成された音がスピーカーから再生される。2019年12月のMUTEK.JP、BOOSTER STUDIOで行われたデモでも、高周波のノイズのような音から徐々に生物の鳴き声に似た音へ変化していった

森川:モビールのようなワイヤーの両端にスピーカーとマイク、この高さがずれているのには理由があるのですか?

ジョン・スミス氏(以下、ジョン):多少自由度があることによって、環境による個性が出るのではないかと考え、モビールのようなある程度動かせる構造を持たせました。

青木:電源供給は電球ソケットからなので、どこでも取り付け可能です。仕組みの概要としては、マイクで環境音を収音して、可聴域を超えた音もふくめて、その場の音の周波数の空きを埋める音を作り出します。このために遺伝的アルゴリム(英語ではGenetic Algorithm。以下、GA)を使っています。また、GAから生成された音のバリエーションを作るためにダイナミクスエンジン「ALife Engine」でゆらぎを作り出しています。

升森:説明の都合上、「空いている帯域を埋めるようにGAで進化を最適化する」と言うことが多いのですが、厳密に言うと違います。実際には、リアルな生物に近い形で音を出すエージェントが複数いて、それらが「同じ種の中でコミュニケーションがうまくいくように自分の音を変えていく」ことを繰り返していくことで、自然とそれぞれの種で使う音の帯域が分けられていきます。GAの評価関数としては、自分の発した音が環境を通して自分と同じ種に送られた時に、その音がうまく伝わったかどうかを見ています。

土井:例えば、僕が升森さんに話しかけた時、周囲がものすごくうるさかったら僕の声は聞こえません。そこで、もうちょっと高い声を出して話しかけると升森さんから「伝わりました」と返ってくる。「じゃあ、そのあたりで話しましょう」ということになります。次に、高い所でカンカンと音がしているような環境では、高い声で話をしても伝わりませんが、低い声で話をしてあげると伝わりました、という感じでどんどん音が変わっていきます。

森川:空いている帯域に近い声の評価が高くなるということですか?

升森:直接そうしているわけではなく、結果的にそうなるということです。空いている帯域を使うことでフィットネスが上がるというわけではありません。あくまでコミュニケーションがうまくいくかどうかです。

森川:空いている帯域に入っているかどうかを直接評価するより、そのほうが良いということですね。

升森:その方法では、どこかでトップダウンの評価が必要になってきます。今回のように複数のモジュールに分かれている場合、あくまでローカルでコミュニケーションがうまくいったかどうかという評価をしてあげるだけで、全体としてそういう周波数分布になっていくと考えました。

やはりそういう形が自然だし、僕たちがALifeの研究者ということもあるので、集団として生態系が自然に進化していくようなモデルを作りたかったのです。周波数スペクトルを与えて、それに合わせて学習するやり方は割と工学的な感じですよね。答えがここにあって、それを見つけに行く。ですが、ALife的な考え方では、お互いに行動し合って、自分で見つけていきます。

青木:ALifeの技術的哲学がまあそういう所にあると言いますか、決め打ちでトップダウンで設計するというよりも、ボトムアップに生まれてくる創発現象をどう技術的に作り出すか。創発現象をどうチューニングするか、そういう所にありますね。

森川:なるほど、おもしろいですね。うちのエンジニアなら前者を使うだろうな。「伝わる」「伝わらない」というのはどういうことで判断しているのですか?

升森:エージェントは聞こえる帯域をそれぞれ持っていて、それも進化していきます。聞こえるというか、自分がアテンションをかける聴覚領域みたいなものです。それもゲノムにコードされています。

単純な流れとしては、環境音がある中で自分の仲間のエージェントが最初に音を生成します。生成した音は環境音を通っていきます。そこからFFT(高速フーリエ変換;Fast Fourier Transform)をかけて周波数成分に分解し、相手が「自分が聞いている帯域」以外はカットします。その状態でまた逆FFTをかけて波形に戻し、返ってきた波形が最初に生成された波形とどれくらい一致しているかを相互相関関数で評価します。それがGAのフィットネスになっています。

土井:耳と口(声)の進化がパラレルに起こるというイメージです。例えば上が空いているからといって上の方で音を出していたとしても、聞く帯域を全体にしてしまうと、どれが自分の仲間の音かは分からないですよね。ですから聞く帯域も合わせて狭めていきます。その両方の進化が起こっているわけです。

森川:双方で空きスポットを探すように自ずと進化していく。どう進化していくかというのは開発者が予測できるのですか? 最終的にこの辺になるだろうとか。

升森:今回、音の生成はFMシンセサイザーをベースにして、そのパラメータをGAのゲノムでコードしていますが、どんな音が生成させるかは分かりません。

土井:音の作り方には何種類かやり方はあって、ひとつは本当にサウンドファイル、マイナス1からプラス1まで数字の列で表されるファイルをダイレクトに生成する方法です。もうひとつは何かしらのシンセサイザーを用意してそのパラメータを調整して作る方法です。前者のやり方はおもしろくなる時もありますが、結構な確率でノイズになります。今回はマシンの制約など色々あって、FMシンセを使っています。それを何個か組み合わせて、オシレータのつなぎ方というようなパラメータ部分をGAにコーディングしています。FMシンセは計算コスト的にはそう重くないにもかかわらず、複雑な音色が出せるシンセで、どんな音が出るのか結構分からない感じもあって、相性が良かったですね。

森川:マシンの制約というと、エージェントはどのくらい動いているんですか?

升森:MUTEK.JPで展示した時は1台がひとつの種みたいな扱いになっていて、そのひとつの種で同時に鳴くのが20エージェントくらい。進化させるプロセスでは100エージェントとか、それくらいです。

森川:遺伝子のビット長はどれくらいになるんですか?

升森:今回はそんなに長くはなくて、シンセサイザーの構造が全部で5個とか6個。最大でもパラメータは10行かないくらいですね。

森川:それは、リアルタイムで進化させるための計算負荷の問題ですか?

升森:今回、小型のPCで回さないといけなかったので。最初は波形レベルで生成するような、リカレントニューラルネットワーク(RNN)的なものでやってみたりしたのですが、計算が重いし、なかなか音も安定しなかったので、何とかパラメータを減らす方向でいきました。

森川:PC自体は何を?

升森:最初はRaspberry Piとかでやろうとしたのですが、さすがに全然計算が追いつかなくて。いま、Intel Compute Stickを使っています。CPUはデュアルコアで、1コアの計算速度でいうとMac Book Proと変わらないレベルのものが入っています。そのおかげで何とか計算できているという感じです。

土井:AMシンセでさえ計算が重くてやばいかもしれないと。それで、もっと軽くておもしろくなりそうなFMシンセにしました。ある意味、「喉の制約」みたいに、人工の生物の身体の制約としてFMシンセの形を使っています。理想的には、FMシンセの構造もGAで進化させていければいいのですが、今回はこれが良さそうだという構造をいくつか事前に用意してパラメータの部分だけを調整するというやり方を採っています。

升森:シンセサイザーの構造などは、僕と土井君で「これで進化して出てくる音ってどうだろうか」と想像しながら作っています。ただやはり、ボトムアップ的に創発してくるサウンドスケープは予想できない。あまりにも予想していない使い方ができてくるので、ボトムアップでモデルを組んでいる方がやはり楽しいです。ALifeの研究者はそういうことが好きな人が多いですね。

森川:楽しいという所に大きなシンパシーを感じます。僕も昔、ゲームで遺伝的アルゴリズムを使ったことがあります。モンスターの進化に使ったのですが、その時に言われたのは「ゲーム的に安定するのか」「設計者が想像する範囲内に収まるのか」と。いや、収まらないから楽しいんじゃないかって、侃々諤々でしたが。やはり予定調和的にならない、人間の予見を超えた所を見られる驚き、そこに楽しさというのがありますよね。

青木:シミュレーターでのデモでしたが、彼らが作ったものを最初に聞いた時におもしろいなと思ったのは、コオロギっぽい音になっているんです。でも、別にコオロギの音を出そうとしてやっているわけではなくて、進化させた結果そうなった。

升森:そうですね。特にこのシンセは最初はノイズみたいな音から始まるのですが、まさか僕らも進化の結果こんな音が出るとは思わなくて。本当に、生物の進化と近いかもしれないと思いました。こうした、たくさん環境音のある中で、すごくシンプルな構造で音を鳴らさなければいけない条件で進化した結果は虫もそうですよね。そういう制約の中でうまくコミュニケーションをしようとすると、自然とこういう虫の鳴き声のような音になるのがおもしろいですね。

青木:お互い、つながりたいという欲求から音を鳴らして、それがまた変わっていく。それを見ておもしろいなと。まさにALife的な発見ですよね。進化はとても時間がかかることですが、それを圧縮して、速度を速めて進化させることによって発見することができる。まさにALifeのひとつの醍醐味ですね。

Writer:大内孝子

≫≫後編に続く:3月20日(金)公開予定

RELATED ARTICLE関連記事

環境主体のリアリティを探求する:ゲームAI開発者 × 生物学専門家による座談会「生物とAI」 後編

2021.4.06サイエンス

環境主体のリアリティを探求する:ゲームAI開発者 × 生物学専門家による座談会「...

【JSAI2022】AIによってPaaS化が実現した群集マネジメントの歴史と現状

2022.7.25サイエンス

【JSAI2022】AIによってPaaS化が実現した群集マネジメントの歴史と現状

AIと人間の感性が協力して生み出す新しい価値:理研よこはまシンポジウムレポート

2019.12.10サイエンス

AIと人間の感性が協力して生み出す新しい価値:理研よこはまシンポジウムレポート

RANKING注目の記事はこちら