モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。

TAG LIST
CGCGへの扉安藤幸央機械学習ディープラーニング月刊エンタメAIニュース河合律子GANOpenAI音楽NVIDIA吉本幸記ニューラルネットワーク強化学習Google生成系AI三宅陽一郎QA人工知能学会GPT-3Stable Diffusion自然言語処理グーグルDeepMindFacebook森川幸人シナリオ大内孝子マイクロソフトChatGPT敵対的生成ネットワークルールベースアート映画キャラクターAIスクウェア・エニックスモリカトロンAIラボインタビューAIと倫理SIGGRAPHゲームプレイAI大規模言語モデル倫理デバッグNFTDALL-E2StyleGANプロシージャル遺伝的アルゴリズムモリカトロン著作権画像生成自動生成テストプレイメタAI画像生成AINPCテキスト画像生成ロボット深層学習ファッションCEDEC2019ディープフェイクVFXMidjourneyデジタルツインボードゲームDALL-ECLIPビヘイビア・ツリーCEDEC2021LLMCEDEC2020ゲームAIメタバース不完全情報ゲームVRナビゲーションAI畳み込みニューラルネットワークGDC 2021マンガJSAI2022AdobeNVIDIA OmniverseGDC 2019マルチエージェントCEDEC2022AIアート小説Stability AI懐ゲーから辿るゲームAI技術史toioジェネレーティブAIスポーツCNNBERT作曲MicrosoftUnityMinecraftアニメーションOmniverseメタJSAI2023鴫原盛之HTN階層型タスクネットワークソニー栗原聡手塚治虫汎用人工知能JSAI2020GTC2023TensorFlowインタビューバーチャルヒューマンイベントレポート対話型エージェントAmazonロボティクスDQNMeta水野勇太アバター3DCGUbisoftGenvid TechnologiesガイスターStyleGAN2デジタルヒューマンGTC2022教育音楽生成AIJSAI2021研究シムピープルMCS-AI動的連携モデルモーションキャプチャーElectronic ArtsNeRFマーケティングメタデータGDC SummerブロックチェーンCMMicrosoft Azureアストロノーカキャリア模倣学習eスポーツスタンフォード大学アーケードゲームテニスサイバーエージェントトレーディングカード音声認識メディアアートeSportsBLUE PROTOCOLシーマンaibo合成音声チャットボットAWS徳井直生斎藤由多加AlphaZeroTransformerGPT-2rinnaAIりんなカメラ環世界中島秀之PaLM哲学ベリサーブPlayable!理化学研究所SIGGRAPH ASIASFNetflix東京大学はこだて未来大学現代アートエージェントDARPAドローンシムシティImagenZorkバイアスプロンプトGPT-4ASBSアドベンチャーゲームTEZUKA2020CEDEC2023AI美空ひばりテキスト生成マルチモーダルバンダイナムコ研究所スパーシャルAI3DLEFT 4 DEADイーロン・マスク通しプレイOpenAI FiveStable Diffusion XL本間翔太CygamesAudio2Faceピクサープラチナエッグイーサリアムボエダ・ゴティエビッグデータ中嶋謙互Amadeus Codeデータ分析MILEナラティブNVIDIA RivaOmniverse ReplicatorWCCFレコメンドシステムNVIDIA DRIVE SimWORLD CLUB Champion FootballNVIDIA Isaac Simセガ柏田知大軍事田邊雅彦トレカMax CooperGPT類家利直PyTorchChatGPT4眞鍋和子バンダイナムコスタジオ大澤博隆SFプロトタイピング齊藤陽介マインクラフトお知らせMagic Leap OneTencentバスケットボールサルでもわかる人工知能text-to-3DVAEDreamFusionブラック・ジャックリップシンキングUbisoft La Forge自動運転車ワークショップ知識表現ウォッチドッグス レギオンIGDA秋期GTC2022市場分析どうぶつしょうぎEpic GamesRobloxジェイ・コウガミ音楽ストリーミングMITAIロボ「迷キュー」に挑戦野々下裕子マシンラーニング5GMuZeroRival Peakpixivクラウド対話エンジン3Dスキャンリトル・コンピュータ・ピープルCodexシーマン人工知能研究所コンピューティショナル・フォトグラフィーPreferred Networksゴブレット・ゴブラーズ絵画ARMicrosoft DesignerイラストシミュレーションSoul Machines柿沼太一完全情報ゲームELSI坂本洋典釜屋憲彦ウェイポイントパス検索対談藤澤仁生物学GTC 2022画像認識GPT-3.5ハリウッドSiemensストライキStyleCLIPDeNA長谷洋平クラウドコンピューティングmasumi toyotaIBM宮路洋一OpenSeaGDC 2022SNSGen-1TextWorldEarth-2BingMagenta音声生成AIELYZA PencilScenarioSIGGRAPH2023テキスト画像生成AI松尾豊AIピカソGTC2021AI素材.comCycleGANテンセントAIQVE ONEデータマイニングNetHackBardキャラクターモーションControlNetNBAフェイクニュースRPG法律SIGGRAPH 2022世界モデルレベルデザインAIボイスアクターNVIDIA CanvasGPUALife人工生命オルタナティヴ・マシンサウンドスケープLaMDATRPGマジック:ザ・ギャザリングAI Dungeonぱいどん手塚眞不気味の谷ナビゲーションメッシュインディーゲーム高橋ミレイ深層強化学習松原仁松井俊浩武田英明ELYZAフルコトNEDOELYZA DIGEST建築音声合成広告西成活裕Apex LegendsELIZA群衆マネジメントライブポートレイトNinjaコンピュータRPGライブビジネスWonder Studioアップルタウン物語新型コロナ土木KELDIC周済涛BIMメロディ言語清田陽司インフラゲームTENTUPLAYサイバネティックスMARVEL Future FightAstro人工知能史Amazon BedrockタイムラプスEgo4DAI哲学マップバスキア星新一X.AI日経イノベーション・ラボStyleGAN-XLX Corp.敵対的強化学習StyleGAN3Twitter階層型強化学習GOSU Data LabGANimatorXホールディングスWANNGOSU Voice AssistantVoLux-GANMagi竹内将SenpAI.GGProjected GANMobalyticsSelf-Distilled StyleGANSDXL馬淵浩希ニューラルレンダリングRTFKT岡島学AWS SagemakerPLATONIKE映像セリア・ホデント形態素解析frame.ioClone XUXAWS LambdaFoodly村上隆誤字検出森山和道認知科学中川友紀子Digital MarkゲームデザインSentencePieceアールティSnapchatLUMINOUS ENGINEクリエイターコミュニティLuminous ProductionsBlenderBot 3バーチャルペットパターン・ランゲージ竹村也哉Meta AINVIDIA NeMo Serviceちょまどマーク・ザッカーバーグヴァネッサ・ローザGOAPWACULVanessa A RosaAdobe MAX 2021陶芸自動翻訳Play.ht音声AIAIライティングLiDAROmniverse AvatarAIのべりすとPolycamFPSQuillBotdeforumマルコフ決定過程NVIDIA MegatronCopysmith動画生成AINVIDIA MerlinJasperハーベストNVIDIA MetropolisForGamesパラメータ設計ゲームマーケットバランス調整岡野翔太協調フィルタリング郡山喜彦人狼知能テキサス大学ジェフリー・ヒントンGoogle I/O 2023AlphaDogfight TrialsAI Messenger VoicebotGoogle I/OエージェントシミュレーションOpenAI Codex武蔵野美術大学StarCraft IIHyperStyleBingAIFuture of Life InstituteRendering with StyleIntelDisneyFireflyLAIKADisneyリサーチヴィトゲンシュタインPhotoshopRotomationGauGAN論理哲学論考LightroomGauGAN2京都芸術大学Canvaドラゴンクエストライバルズ画像言語表現モデル不確定ゲームSIGGRAPH ASIA 2021PromptBaseBOOTHDota 2モンテカルロ木探索ディズニーリサーチpixivFANBOXMitsuba2バンダイナムコネクサス虎の穴ソーシャルゲームEmbeddingワイツマン科学研究所ユーザーレビューFantiaGTC2020CG衣装mimicとらのあなNVIDIA MAXINEVRファッションBaidu集英社淡路滋ビデオ会議ArtflowERNIE-ViLG少年ジャンプ+グリムノーツEponym古文書ComicCopilotゴティエ・ボエダ音声クローニング凸版印刷コミコパGautier Boeda階層的クラスタリングGopherAI-OCRゲームマスター画像判定Inowrld AIJuliusSIE鑑定ラベル付けMODTPRGOxia PalusGhostwriterバーチャル・ヒューマン・エージェントtoio SDK for UnityArt RecognitionSkyrimクーガー田中章愛実況パワフルサッカースカイリム石井敦銭起揚NHC 2021桃太郎電鉄RPGツクールMZ茂谷保伯池田利夫桃鉄ChatGPT_APIMZGDMC新刊案内パワサカダンジョンズ&ドラゴンズマーベル・シネマティック・ユニバースコナミデジタルエンタテインメントOracle RPG成沢理恵MITメディアラボMCU岩倉宏介深津貴之アベンジャーズPPOxVASynthマジック・リープDigital DomainMachine Learning Project CanvasLaser-NVMagendaMasquerade2.0国立情報学研究所ノンファンジブルトークンDDSPフェイシャルキャプチャー石川冬樹MERFサッカーモリカトロン開発者インタビュースパコンAlibaba里井大輝Kaggle宮本茂則スーパーコンピュータVQRF山田暉松岡 聡nvdiffrecAssassin’s Creed OriginsAI会話ジェネレーターTSUBAME 1.0NeRFMeshingSea of ThievesTSUBAME 2.0LERFGEMS COMPANYmonoAI technologyLSTMABCIマスタリングモリカトロンAIソリューション富岳TikTok初音ミクOculusコード生成AISociety 5.0リアム・ギャラガー転移学習テストAlphaCode夏の電脳甲子園グライムスBaldur's Gate 3Codeforces座談会BoomyCandy Crush Saga自己増強型AItext-to-imageジョン・レジェンドSIGGRAPH ASIA 2020COLMAPザ・ウィークエンドADOPNVIDIA GET3DドレイクデバッギングBigGANGANverse3DTEZUKA2023MaterialGANRNNグランツーリスモSPORTAI絵師エッジワークスReBeLグランツーリスモ・ソフィーUGC日本音楽作家団体協議会GTソフィーPGCFCAVolvoFIAグランツーリスモチャンピオンシップVoiceboxNovelAIさくらインターネットRival PrakDGX A100NovelAI DiffusionVTuberぷよぷよユービーアイソフトWebcam VTuberモーションデータ立教大学星新一賞大阪公立大学北尾まどかHALOポーズ推定TCG将棋メタルギアソリッドVフォートナイトメッシュ生成KLabFSMメルセデス・ベンツQRコードMagic Leap囲碁ナップサック問題Live NationEpyllionデンソー汎用言語モデルWeb3.0マシュー・ボールデンソーウェーブAIOpsムーアの法則原昌宏Spotifyスマートコントラクト日本機械学会Replica Studioロボティクス・メカトロニクス講演会amuseChitrakarQosmoAdobe MAX 2022トヨタ自動車巡回セールスマン問題Adobe MAXかんばん方式ジョルダン曲線メディアAdobe Research村井源政治Galacticaプロット生成クラウドゲーミングがんばれ森川君2号オムロン サイニックエックス和田洋一リアリティ番組映像解析FastGANStadiaジョンソン裕子セキュリティ4コママンガMILEsNightCafe東芝デジタルソリューションズ電気通信大学インタラクティブ・ストリーミングLuis RuizSATLYS 映像解析AI稲葉通将インタラクティブ・メディアポケモン橋本敦史PFN 3D ScanElevenLabs東京工業大学HeyGenLudo博報堂After EffectsラップPFN 4D Scan絵本SIGGRAPH 2019ArtEmisZ世代DreamUp出版AIラッパーシステムDeviantArtAmmaar ReshiWaifu DiffusionStoriesGROVERプラスリンクス ~キミと繋がる想い~元素法典StoryBirdFAIRSTCNovel AIVersedチート検出Style Transfer ConversationOpen AIProlificDreamerオンラインカジノRCPUnity SentisアップルRealFlowRinna Character PlatformUnity MuseiPhoneCALACaleb WardDeep Fluids宮田龍MeInGameAmelia清河幸子AIGraphブレイン・コンピュータ・インタフェースバーチャルキャラクター西中美和BCIGateboxアフォーダンス安野貴博Learning from VideoANIMAKPaLM-SayCan斧田小夜予期知能逢妻ヒカリ宮本道人セコムGitHub CopilotLLaMA 2ユクスキュルバーチャル警備システムCode as PoliciesLLaMAカント損保ジャパンCaPHugging FaceCM3leon上原利之Stable DoodleドラゴンクエストエージェントアーキテクチャアッパーグラウンドコリジョンチェックT2I-AdapterPAIROCTOPATH TRAVELERxAI西木康智OCTOPATH TRAVELER 大陸の覇者山口情報芸術センター[YCAM]アルスエレクトロニカ2019品質保証YCAM日本マネジメント総合研究所StyleRigAutodeskアンラーニング・ランゲージVoyager逆転オセロニアBentley Systemsカイル・マクドナルドLily Hughes-Robinsonワールドシミュレーターローレン・リー・マッカーシーColossal Cave Adventure奥村エルネスト純いただきストリートH100鎖国[Walled Garden]​​プロジェクトAdventureGPT齋藤精一大森田不可止COBOLSIGGRAPH ASIA 2022リリー・ヒューズ=ロビンソン高橋智隆DGX H100VToonifyBabyAGIロボユニザナックDGX SuperPODControlVAEGPT-3.5 Turbo泉幸典仁井谷正充変分オートエンコーダーカーリングロボコレ2019Instant NeRFフォトグラメトリウィンブルドンartonomous回帰型ニューラルネットワークbitGANsDeepJoin戦術分析ぎゅわんぶらあ自己中心派Azure Machine LearningAzure OpenAI Serviceパフォーマンス測定意思決定モデル脱出ゲームDeepLIoTHybrid Reward Architectureコミュニティ管理DeepL WriteProFitXウロチョロスSuper PhoenixWatsonxProject MalmoオンラインゲームAthletica気候変動コーチングProject Paidiaシンギュラリティ北見工業大学Project Lookoutマックス・プランク気象研究所レイ・カーツワイル北見カーリングホールWatch Forビョルン・スティーブンスヴァーナー・ヴィンジ画像解析気象モデルRunway ResearchじりつくんLEFT ALIVE気象シミュレーションMake-A-VideoNTT Sportict長谷川誠ジミ・ヘンドリックス環境問題PhenakiAIカメラBaby Xカート・コバーンエコロジーDreamixSTADIUM TUBEロバート・ダウニー・Jr.エイミー・ワインハウスSDGsText-to-ImageモデルPixelllot S3ソフトバンクYouTubeダフト・パンクメモリスタAIスマートコーチGlenn MarshallThe Age of A.I.Story2Hallucination音声変換LatitudeレコメンデーションJukeboxDreamboothVeap Japanヤン・ルカンEAPneoAIPerfusionSIFT福井千春DreamIconニューラル物理学DCGAN医療mign毛髪MOBADANNCEメンタルケアstudiffuse荒牧英治人事ハーバード大学Edgar HandyAndreessen Horowitz中ザワヒデキ研修デューク大学大屋雄裕QA Tech Night中川裕志mynet.aiローグライクゲーム松木晋祐Adreeseen Horowitz東京理科大学下田純也NVIDIA Avatar Cloud Engine人工音声NeurIPS 2021産業技術総合研究所桑野範久Replica StudiosリザバーコンピューティングSmart NPCsプレイ動画ヒップホップ対話型AIモデルRoblox StudioソニーマーケティングPromethean AIサイレント映画もじぱnote音源分離環境音暗号通貨note AIアシスタントMusiioFUZZLEKetchupEndelAlterationAI Newsユニバーサルミュージック粒子群最適化法Art Selfie進化差分法オープンワールドArt TransferSonar群知能下川大樹AIFAPet PortraitsSonar+Dウィル・ライト高津芳希P2EBlob OperaWeb3大石真史クリムトDolby AtmosBEiTStyleGAN-NADASonar Music FestivalDETRゲームエンジンDreamerV3ライゾマティクスSporeUnreal Engineクリティックネットワーク真鍋大度デノイズ南カリフォルニア大学Unity for Industryアクターネットワーク花井裕也画像処理DMLabRitchie HawtinSentropyGLIDEControl SuiteErica SynthCPUDiscordAvatarCLIPAtari 100kUfuk Barış MutluSynthetic DataAtari 200MJapanese InstructBLIP AlphaCALMYann LeCun日本新聞協会プログラミングサム・アルトマン鈴木雅大AIいらすとやソースコード生成コンセプトアートAI PicassoGMAIシチズンデベロッパーSonanticColie WertzEmposyGitHubCohereリドリー・スコットAIタレントウィザードリィMCN-AI連携モデル絵コンテAIタレントエージェンシーUrzas.aiストーリーボードmodi.ai介護大阪大学BitSummit西川善司並木幸介KikiBlenderBitSummit Let’s Go!!サムライスピリッツ森寅嘉Zoetic AIRed RamゼビウスSIGGRAPH 2021ペットマーダーミステリーストリートファイター半導体Digital Dream LabsPaLM APIデジタルレプリカTopaz Video Enhance AICozmoMakerSuiteGOT7DLSSタカラトミーSkebsynthesia山野辺一記NetEaseLOVOTDreambooth-Stable-DiffusionHumanRF大里飛鳥DynamixyzMOFLINゲーム背景Actors-HQRomiGoogle EarthSAG-AFTRAU-NetミクシィGEPPETTO AIWGA13フェイズ構造ユニロボットStable Diffusion web UIチャーリー・ブルッカーADVユニボPoint-EXLandGatoアパレル岡野原大輔AGIAI model自己教師あり学習DEATH STRANDINGAI ModelsIn-Context Learning(ICL)Eric Johnson汎用強化学習AIZMO.AILoRAデザインMOBBY’SファインチューニングOculus Questコジマプロダクションロンドン芸術大学モビーディックグランツーリスモ生体情報デシマエンジンGoogle Brainダイビング量子コンピュータSound Controlアウトドアqubit写真SYNTH SUPERAIスキャニングIBM Quantum System 2照明Maxim PeterKarl Sims自動採寸北野宏明Joshua RomoffArtnome3DLOOKダリオ・ヒルハイパースケープICONATESizerジェン・スン・フアン山崎陽斗ワコールHuggingFace立木創太スニーカーStable Audio浜中雅俊UNSTREET宗教ミライ小町Newelse仏教テスラ福井健策CheckGoodsコカ・コーラGameGAN二次流通食品パックマンTesla Bot中古市場Coca‑Cola Y3000 Zero SugarTesla AI DayWikipediaDupe KillerCopilot Copyright Commitmentソサエティ5.0Sphere偽ブランドテラバースSIGGRAPH 2020バズグラフXaver 1000配信京都大学ニュースタンテキ養蜂立福寛東芝Beewiseソニー・ピクチャーズ アニメーション音声解析DIB-R倉田宜典フィンテック感情分析投資Fosters+Partners韻律射影MILIZEZaha Hadid Architects韻律転移三菱UFJ信託銀行

【CEDEC2022】自然言語処理で海外レビュー分析

2022.9.20先端技術

【CEDEC2022】自然言語処理で海外レビュー分析

CEDEC2022のセッションの中から、バンダイナムコネクサスの有井佳祐氏による「世界中のユーザーの声に迫る〜自然言語処理を用いた海外レビュー分析〜」を紹介します。レビュー分析の重要性は理解しながらも、コストや導入自体の難しさから躊躇している企業は多いでしょう。今回の発表では、バンダイナムコネクサスにおける事例として、自然言語処理による海外レビュー分析プロジェクトの概要が解説されました。

レビュー分析がなぜ必要か

チームで企画を練って自信満々で上司に提案を持っていくと上司からは「これ、売れるの?」と問いかけられ、じゃあ売れる根拠を集めようと市場調査をしても、今度は「その調査結果は本当なの? そのうち何人が買ってくれるわけ?」などと言われてしまって悶々とする。何らかの形で商品の企画に携わる人なら、そんな経験を一度はしていると思います。

データストラテジストとして今回のプロジェクトをリードした有井佳祐氏は、悶々とする原因がターゲットの解像度が不明瞭なことにあるのではないかとした上で、ターゲットの解像度を4つの視点で整理します。

  • ターゲットはどんな属性か
  • ターゲットが(そのゲームで)解決したい課題は何か
  • その課題を解決できる打ち手になっているか
  • ターゲットが何人いるか
ターゲットの解像度を上げる4つの視点

1から3までの視点は市場調査の定性調査の定番ですが、忘れてはならないのは4のターゲットが市場に何人いるのかという視点です。ターゲットの数が非常に少ないとしたら企画として成り立ちません。つまり、定性的な部分と定量的な部分を両方とも網羅する必要があるということになります。

この4つの視点を明らかにする調査手法として、自社データの分析、市場調査、レビュー分析があるとして、それぞれ長所と短所を図のように示します。

自社データの分析、市場調査、レビュー分析

たとえば自社データの分析では、時間や費用的な融通を付けやすい反面、データの質には課題が残ります。データの質が悪かったり、そもそも欲しいデータがなかったり、あるいは、あったとしても組織の壁にぶつかって入手が難しいというケースもあるでしょう。外部の調査会社に依頼する市場調査の場合、データの質は担保できますが、時間や費用がかかりますし、発注する際の設計が甘いとアウトプットがふんわりしてしまったものになるおそれがあります。

もちろん、それぞれ強みと弱みがあるので、状況に応じた最適なアプローチを採るのが落としどころになりますが、有井氏はターゲットの解像度を上げるファーストステップとしてレビュー分析が非常に有効だと考えています。そのメリットは一度環境を構築してしまえばスピーディーかつ低コストでワールドワイドで市場を見ることができるという点です。

自然言語処理とレビュー分析

そもそもレビュー分析とは、ユーザーの口コミやレビューをデータソースとし、定量的に行う分析調査です。基本的には、文章を単語に分割し、出現頻度や相関関係を分析するといった自然言語解析の手法を用います。

一方で、コンピュータで自然言語を扱う領域を自然言語処理と呼びますが、ご存知のとおり、これは最近のAI技術の進化に応じて著しく発展している分野です。この自然言語処理の技術を使って、レビュー分析を行うのが今回のチャレンジです。

さまざまなシーンで自然言語処理が使われている

まず、レビューのデータとしては「レビューの評価」と「レビューの文章」があります。評価というのは、10点とか5点といった点数であったり、GOODやBADといった評価判定です。それとレビュー本文です。何かしらコメントが書かれている文章があります。

この2つのデータから、たとえば「語られているトピック」と「そのトピックが評価にどう影響しているか」という点を調べることができます。レビューの件数が数件とか数十件なら、人間が読んで要約することもできますが、1,000件、200件と数が多くなるとそれらを全部読むわけにはいきません。そこで自然言語処理を活用します。また、話題と評価の関係を分析することで、ポジティブな評価に影響しているトピック、ネガティブな評価に影響しているトピックが分かります。特に自然言語処理を活用するメリットは、ポジティブ/ネガティブの傾向をとらえられることと、トピックとの関連付けができることにあると言えます。

自然言語処理を使ったレビュー分析のイメージ

バンダイナムコネクサスの今回の例では、海外レビューサイトにおける該当レビュー(ベンチマークとするタイトルのレビュー、および自社のタイトルのレビュー)をもとに、ターゲットの解像度を探索的に分析することを目的とし、自然言語処理によるレビュー分析を行いました。なお、海外レビューサイトのレビューということで使用言語は英語に限定しています。

背景としては、ベンチマークのタイトルや自社のタイトルのどの部分が受け入れられていて、どの部分が受けられていないのかが見えづらいという課題がありました。具体的な改善ポイントにつなげるために、まずユーザーがどんなトピックを話していて、どのトピックがポジティブ、あるいはネガティブな評価に影響を与えているのかという点を明らかにします。

分析処理から解釈まで

まず最初にデータについて見ておくと、レビューサイトのAPIから入手したデータをそれぞれ「レビュー内容」「レビューに対するスコア」「その他の情報」の3つに分けます。このデータを使って分析をしていきます。

データの概要

分析処理は大きく4つのステップに分けられます。まず前処理としてレビューの本文を1文ごとに分割し、スコアリングをしていきます。これは試行錯誤をする中で、複数の文に対し分析をするよりも、ひとつの文を区切りごとに分析をした方が精度や解釈性が高いことが明らかになったためです。

ここで言うスコアリングでは、ユーザーがつけたレビューの点数をそのまま使うのではなく、1文ごとに分解した後にそれぞれ別途スコアを付与しています。具体的には生データの分布から重みを計算し、各文のスコアの平均が元データのスコアと近似する形でスコアリングをしていきます。

分析処理のイメージ

次のステップとして、スコア別にポジティブな群なのかネガティブな群なのかをラベル付けしていきます。ここでは、3点以上はポジティブ、3点未満はネガティブという基準にしています。そのデータの分布をヒストグラムで見てチームで基準点を議論して決めました。

続いて、ポジティブ群/ネガティブ群それぞれをトピックごとにまとめていきます。これは機械学習でグルーピングしていくというイメージです。ポイントは機械学習がやってくれるのは「グルーピングをしてくれるところまで」ということです。そのため、このトピックが一体どういう意味なのかを解釈するフェーズが別途必要になります。それが最後のステップです。

まとめられたトピックを解釈する方法としてはさまざまなアプローチが考えられますが、ここで有井氏のチームが用いたのは「共起ネットワーク」と「各トピックの文章を読む」というアプローチです。

今回用いている分析アルゴリズム

機械学習でグルーピングするという部分ではトピックモデルというアルゴリズムが働いています。トピックモデルとは「文書は潜在トピックから確率的に生成される」とする考えのもと、単語の共起性に着目して各単語が潜在トピックに振り分けられる確率分布を作成します。共起性とは、たとえば「選挙」という単語が出たときに同時に「大統領」という単語も出やすくなるなど、ある単語と同時に使われやすい単語の関係を指します。

たとえば、人間がニュース記事を読む場合「選挙」や「大統領」といった言葉が記事の中に頻出していたとき、多くの場合、その記事のテーマは「政治」に関するものだと判断するはずです。トピックモデルは、このような「単語とトピック」の関係をモデル化したものだととらえることができます。このトピックモデルにもとづいてトピックをグルーピングしていきます。

解釈するという部分では、共起ネットワークによる解釈と各トピックの文章を読むことを行っています。共起ネットワークは、単語ごとの関連度を円と線で表現したものです。たとえば、この図では「アニメ」と「家族」と「子供」はかなり近いものの、「アニメ」と「冒険」は遠い関係にあることが分かります。こういった関連度を見ることでトピックを解釈することができるというわけです。

また、前述のトピックモデルは各文をトピックに振り分けるだけではなく、そのトピックに対する重要度を定量的な数字(確率)で示します。実際に各トピックの文章を読むのは、たとえば100件あったら全部読むというわけではなく、このトピックモデルによって示された関連度の高い文章トップ10を読むことで、どのようなトピックなのかを解釈していくというイメージになります。

分析結果をどう読み解くか

分析を回すとトピックごとに共起ネットワークが出力されます。この共起ネットワークを見ながら、真ん中に出てる単語(赤い丸)は重要そうだと解釈したり、その単語に関連する周りの単語からどういうトピックなのかを判断します。

次に、関連度の高い文を実際に読んでいきます。共起ネットワークと実際の文を読み合わせて解釈すると、おそらく「適度な難易度設定」というトピックが裏側に隠れているのではないかということが明らかになるわけです。同様に「バトルシステム」「アプデが多い」「チームプレイ」「戦争への追体験」などが明らかになります。

分析後の出力サンプル(説明用のもの)

同様に、ポジティブに評価されている文の中でのトピック5つ、一方でネガティブに評価されている文の中でのトピック5つと、ポジティブ/ネガティブそれぞれについても解釈していきます。これらを明らかにすることで、ポジティブに解釈されているトピックをもっと押し出そうとか、ネガティブ評価のトピックに関してはもう少し改善の余地があるかもしれない、といった議論を根拠を示しながら始めることができます。

また出力結果に対して、この結果がユーザーのどのような心理から発生したものかを考察する必要があります。そのため、有井氏は心理学や行動経済学などのフレームワーク、先行研究などを参考にするとのことです。ただし、フレームワークに固執ことが判断を誤らせる原因にもあるので、それは避ける必要があります。ドメイン知識を用いながら、なぜこういう結果になったのかを多角的にチームで議論し、「これは、このような心理が働いたからではないか」と模索する姿勢が重要です。

結果の棚卸し

ここまで、レビュー分析の流れを見てきましたが、分析のアプローチにはそれぞれメリットとデメリットがあり限界もあります。たとえば、ここで紹介したレビュー分析が対象とするデータ群は「そもそもレビューをしようという集団」によるものです。その時点でバイアスがかかっているデータだと言えます。つまり「真の対象者」にはレビューをしていない人も、当然ふくまれるということです。このようにレビューデータの活用が潜在的に持つ限界についても考慮すべきだと有井氏は言います。従ってレビュー分析のみに固執することなく、そこで得た新たな考察を次の市場調査やログ分析などにつなげていく姿勢が重要となります。

プロジェクトとしていかに進めるか

有井氏はデータ戦略部のデータストラテジストとして今回のプロジェクトをリードする立場でした。プロジェクトとして進める上で、分析担当だけではなく、ステークホルダー全員がモデル作成に関わっているという共通認識を持った上でプロジェクトを進めたいと考えていました。つまり、分析担当者が勝手に分析しているという形ではなく、企画にあたる事業部側も当事者意識を持って分析を回していく姿勢を醸成することが重要です。

ステークホルダー全員がモデル作成に関わる

今回の事例では、データストラテジストとデータアナリスト、プロダクトアナリスト、データアナリスト、データサイエンティストが連携し合って課題解決に向けた調査設計をしました。もちろん実際に分析をする中で、うまくいかないことが多々起こります。生じた問題をどうすれば解消できるかをチーム内で議論したり、もう一度事業部側にヒアリングを行うなど、アジャイル的にプロジェクトを進めていきます。この事例に関しては、具体的に次のような流れになりました。

  1. まず、分析チームからレビュー分析を提案する際、レビュー内で使われる単語の頻出度ランキングをアウトプットとして提出
  2. それに対し、事業部側から「それらの単語がレビューのスコアにどう影響どうしているのかが知りたい」というフィードバックが来る
  3. 各単語のスコアに対する影響度を算出する
  4. それに対し、事業部側から「単語だけでその解釈に至るのは危険ではないか」というフィードバックが来る
  5. そこでトピックに着目

このような形でアウトプットをもとに事業部側とコミュニケーションを重ねていくことでプロジェクトを進めていきました。

事業部側とコミュニケーションを重ねながら進めていく

レビュー分析の必要性を理解して実行に前向きであっても、誰を集めてどのように進めていけばいいのか分からないという場合が多いため、導入にあたっては体制作りやフローの整備が大きな課題になると言えるでしょう。

もちろん分析を行うにはデータストラテジスト、データアナリスト、データサイエンティストなど、データが扱えるエンジニアが必要です。しかし、それだけでは実現しません。レビュー分析という分析手法の役割や意義を紐解いて社内にエンハンスできるパッションを持ったプロジェクトマネージャーが欠かせないのだと有井氏は言います。

最後に、今後の取り組みとして有井氏はこう述べました。

今後の取り組みとして、ユーザーすらも気づいていない潜在心理を紐解き、チームで楽しくものづくりをすることを目指しています。データを解析しながらユーザーのことを想像するのは楽しく、それによってユーザーが満足してくれたらなお嬉しい。さまざまなデータがたくさんある中で、それらを十分に活用していくことに今後も続けたいと思います。(有井佳祐氏)

Writer:大内孝子

RELATED ARTICLE関連記事

多様な架空人間プレイヤーをパートナーにして学習するDeepMindの「架空協力プレイAI」とは?

2021.12.23先端技術

多様な架空人間プレイヤーをパートナーにして学習するDeepMindの「架空協力プ...

【JSAI2023】生成AIにオリジナルの芸術を生み出すことは可能なのか

2023.6.27先端技術

【JSAI2023】生成AIにオリジナルの芸術を生み出すことは可能なのか

「機械学習は人生訓」経歴紆余曲折の3人が語るAIとキャリア

2020.9.25先端技術

「機械学習は人生訓」経歴紆余曲折の3人が語るAIとキャリア

RANKING注目の記事はこちら