モリカトロン株式会社運営「エンターテインメント×AI」の最新情報をお届けするサイトです。

TAG LIST
ディープラーニングCG機械学習CGへの扉安藤幸央GAN月刊エンタメAIニュースニューラルネットワーク強化学習三宅陽一郎音楽OpenAIモリカトロンAIラボインタビュー敵対的生成ネットワーク河合律子QAスクウェア・エニックスNVIDIAシナリオFacebookキャラクターAIルールベースDeepMindデバッグCEDEC2019プロシージャル人工知能学会映画ビヘイビア・ツリーGoogleCEDEC2021CEDEC2020ゲームAISIGGRAPH遺伝的アルゴリズム不完全情報ゲームメタAIナビゲーションAI森川幸人畳み込みニューラルネットワーク自然言語処理深層学習マイクロソフトAIと倫理グーグルStyleGAN自動生成GDC 2021GPT-3GDC 2019マルチエージェントVRボードゲームロボットアートCNNVFXモリカトロンゲームプレイAIファッションHTN階層型タスクネットワークディープフェイクJSAI2020大内孝子TensorFlowMicrosoftイベントレポートテストプレイAIアート水野勇太アニメーションガイスターNPCDALL-ECLIPStyleGAN2NFTtoio吉本幸記JSAI2021スポーツシムピープル汎用人工知能GDC SummerAdobeeスポーツ対話型エージェントeSportsBLUE PROTOCOLシーマン小説UbisoftAlphaZeroカメラ環世界中島秀之懐ゲーから辿るゲームAI技術史研究DARPAドローンシムシティAI美空ひばり手塚治虫Electronic Artsメタデータブロックチェーン通しプレイOpenAI Five本間翔太CM倫理ピクサーイーサリアム作曲中嶋謙互Amadeus CodeMicrosoft AzureデジタルツインアストロノーカキャリアナラティブAmazonサイバーエージェント音声認識ロボティクスPyTorchDQN眞鍋和子バンダイナムコスタジオUnity齊藤陽介マインクラフトお知らせアバターサルでもわかる人工知能VAEUbisoft La ForgeワークショップGenvid Technologies知識表現ウォッチドッグス レギオンIGDAどうぶつしょうぎジェイ・コウガミ音楽ストリーミングマシンラーニングクラウド斎藤由多加リトル・コンピュータ・ピープルコンピューティショナル・フォトグラフィーGPT-2完全情報ゲーム坂本洋典釜屋憲彦ウェイポイントパス検索藤澤仁生物学画像認識DeNA長谷洋平鴫原盛之masumi toyota宮路洋一TextWorldSIGGRAPH ASIAソニーGTC2021CycleGANフェイクニュースエージェントGPUALifeZork人工生命オルタナティヴ・マシンサウンドスケープMCS-AI動的連携モデルASBSマンガぱいどんTEZUKA2020ナビゲーションメッシュ松井俊浩スパーシャルAIマーケティングApex LegendsELIZANinjaコンピュータRPGアップルタウン物語KELDICメロディ言語ゲームTENTUPLAYLEFT 4 DEADMARVEL Future FightAstroタイムラプスEgo4Dバスキアバーチャルヒューマン日経イノベーション・ラボ敵対的強化学習階層型強化学習GOSU Data LabWANNGOSU Voice Assistant竹内将SenpAI.GGMobalytics馬淵浩希Cygames岡島学AWS Sagemaker映像セリア・ホデント形態素解析UXAWS Lambda誤字検出認知科学BERTゲームデザインSentencePieceLUMINOUS ENGINEプラチナエッグLuminous Productionsパターン・ランゲージ竹村也哉ちょまどボエダ・ゴティエビッグデータGOAPAdobe MAX 2021メタバース模倣学習NVIDIA OmniverseOmniverse AvatarFPSNVIDIA Rivaマルコフ決定過程NVIDIA MegatronNVIDIA Merlinスタンフォード大学NVIDIA Metropolisパラメータ設計テニスOmniverse Replicatorバランス調整レコメンドシステムNVIDIA DRIVE Sim協調フィルタリングNVIDIA Isaac Sim人狼知能テキサス大学軍事AlphaDogfight TrialsAI Messenger VoicebotエージェントシミュレーションOpenAI CodexStarCraft IIHyperStyleFuture of Life InstituteRendering with StyleIntelDisneyLAIKADisneyリサーチRotomationGauGANGauGAN2ドラゴンクエストライバルズ画像言語表現モデル不確定ゲームSIGGRAPH ASIA 2021Dota 2モンテカルロ木探索ディズニーリサーチMitsuba2ソーシャルゲームEmbeddingワイツマン科学研究所GTC2020CG衣装NVIDIA MAXINEVRファッション淡路滋ビデオ会議グリムノーツゴティエ・ボエダGautier Boeda階層的クラスタリングaiboJuliusSIETPRGバーチャル・ヒューマン・エージェントtoio SDK for Unityクーガー田中章愛石井敦銭起揚茂谷保伯MinecraftGDMC成沢理恵MITメディアラボ著作権マジック・リープMagic Leap OneMagendaノンファンジブルトークンDDSPサッカー里井大輝KaggleバスケットボールAssassin’s Creed OriginsSea of ThievesGEMS COMPANYmonoAI technology初音ミクOculus転移学習テストBaldur's Gate 3Candy Crush SagaSIGGRAPH ASIA 2020デバッギングBigGANMaterialGANリップシンキングRNNReBeL自動運転車VolvoRival Prakユービーアイソフト北尾まどかHALO将棋メタルギアソリッドVFSMナップサック問題汎用言語モデルSpotifyMITReplica StudioamuseChitrakar巡回セールスマン問題ジョルダン曲線5GMuZeroクラウドゲーミングRival Peak和田洋一リアリティ番組Stadiaジョンソン裕子MILEs対話エンジンインタラクティブ・ストリーミングインタラクティブ・メディアシーマン人工知能研究所Ludoゴブレット・ゴブラーズTransformerSIGGRAPH 2019ArtEmis絵画ARGROVERFAIRAIりんなチート検出オンラインカジノアップルRealFlowiPhoneシミュレーションDeep FluidsMeInGameAIGraphブレイン・コンピュータ・インタフェースBCILearning from Video予期知能ユクスキュルカント哲学ドラゴンクエストエージェントアーキテクチャPAIROCTOPATH TRAVELER西木康智OCTOPATH TRAVELER 大陸の覇者アルスエレクトロニカ2019StyleCLIPStyleRig逆転オセロニア奥村エルネスト純いただきストリート齋藤精一大森田不可止高橋智隆ロボユニザナック泉幸典仁井谷正充ロボコレ2019ぎゅわんぶらあ自己中心派Azure Machine Learning意思決定モデル脱出ゲームHybrid Reward ArchitectureウロチョロスSuper Phoenix理化学研究所Project Malmo教育Project PaidiaProject LookoutWatch ForBingLEFT ALIVE長谷川誠ジミ・ヘンドリックスBaby Xカート・コバーンロバート・ダウニー・Jr.エイミー・ワインハウスMagentaYouTubeダフト・パンクSFGlenn MarshallThe Age of A.I.Story2HallucinationレコメンデーションJukeboxテンセントSIFTDCGANMOBADANNCE人事ハーバード大学研修デューク大学mynet.aiローグライクゲームNetHack人工音声NeurIPS 2021はこだて未来大学プレイ動画ヒップホップサイレント映画NBA環境音現代アート粒子群最適化法進化差分法群知能下川大樹ウィル・ライト高津芳希大石真史BEiTレベルデザインDETRSporeAIボイスアクターデノイズ南カリフォルニア大学画像処理NVIDIA CanvasSentropyCPUDiscordCALMプログラミングソースコード生成GMAIシチズンデベロッパーTRPGGitHubウィザードリィMCN-AI連携モデルAI Dungeon西川善司並木幸介サムライスピリッツ森寅嘉ゼビウスSIGGRAPH 2021ストリートファイター半導体Topaz Video Enhance AI栗原聡DLSS山野辺一記NetEase大里飛鳥DynamixyzモーションキャプチャーU-Net13フェイズ構造アドベンチャーゲームADVXLandAGI手塚眞DEATH STRANDING不気味の谷Eric JohnsonOculus Questコジマプロダクション生体情報デシマエンジンインディーゲーム写真高橋ミレイ照明Maxim PeterJoshua Romoffハイパースケープ山崎陽斗深層強化学習立木創太バンダイナムコ研究所ミライ小町テスラGameGANELYZAパックマンTesla BotTesla AI Dayソサエティ5.0ELYZA DIGESTSIGGRAPH 2020バズグラフニュースタンテキ東芝DIB-R倉田宜典3D音声合成韻律射影広告韻律転移

自然言語をプログラミング言語に翻訳。ソースコード生成AIの現状

2021.7.28先端技術

自然言語をプログラミング言語に翻訳。ソースコード生成AIの現状

自然言語で書かれたテキスト文を生成する近年の言語AIは、書いたのがAIなのか人間なのかを判別するのが困難なほどに高性能になりました。こうした言語AIを使って、自然言語からプログラミング言語を生成することが試みられています。この記事では、ソースコード生成AIの現状と課題を解説します。

シチズンデベロッパー拡大のために

マイクロソフトは5月25日、同社のアプリ開発プラットフォームMicrosoft Power Appsに言語AIのGPT-3を活用したソースコード生成機能を統合したことを発表しました。同言語AIは独立系の AI 研究開発企業であるOpenAIが開発したものですが、2020年9月にマイクロソフトが同AIのライセンスを取得していました。

GPT-3は、任意の英文を入力として渡すとその文の続きを出力するAIです。同AIの驚異的な性能はさまざまなアプリに応用されており、『AI Dungeon』のようなテキストアドベンチャーゲームも誕生しています。今回マイクロソフトが発表したソースコード生成機能は、プログラミング言語で実行したい内容を音声で入力すると、入力音声の内容を反映したソースコードをPower Appsで使われているプログラミング言語であるMicrosoft Power Fxで出力するようにGPT-3をファインチューニングすることで実現しました。

【関連記事】RPG内で目的を持って自律的に行動するNPCのAI:月刊エンタメAIニュース vol.11

以上の新機能を使えば、例えば「名前が “Kids” で始まる商品を探す」と音声入力すると、「Filter (‘BC Orders’ Left (‘Product Name’,4) =”Kids”)」というソースコードが出力されます。ソースコードは、ちょうど検索エンジンで複数の結果が返ってくるように複数提案されます。そうした選択肢から選ぶことになるので人間を代替する機能ではなく、労力を削減するものと言えます。

マイクロソフトのローコードアプリケーションプラットフォーム担当コーポレートバイスプレジデントのCharles Lamanna氏は、ソースコード生成機能によって「真の意味でのノーコード」になることで、コーディングに精通しているわけではない「シチズンデベロッパー」のような人々にPower Appsが利用されるようになるでしょう、と述べています。

AIとのペアプログラミングができるものも…

以上の発表から約1か月後の6月29日、マイクロソフト傘下でソフトウェア開発プラットフォームを運営するGitHubもソースコード生成機能「GitHub Copilot」を発表しました。同機能はマイクロソフトが提供するソースコードエディタであるVisual Studio Codeの拡張機能として使え、自然言語でプログラミングしたい内容をコメントとして入力すると、その内容を反映したソースコードが出力されます。ソースコードの最終的な決定権は人間のユーザにあるので、同機能はあくまでサポート役に徹しします。

驚くべきなのは、GitHub Copilotの対応プログラミング言語の多さです。Python、JavaScript、TypeScript、Ruby、さらにはGoについては高品質な出力が期待でき、そのほかの数十のプログラミング言語にも対応しています。こうした広範囲の対応はGitHubで公開されている大量のソースコードを学習データとして活用して、OpenAIが開発したソースコード生成AIである「OpenAI Codex」を訓練したことによって実現しました。

もっとも、GitHub Copilotには言語AIに特有な問題を抱えています。一般に言語AIは学習データに含まれている不適切な表現を反復あるいは増幅してしまうことがありますが、GitHub Copilotも例外ではありません。具体的にはセキュリティ的に望ましくないソースコードや、不快を与えてしまうテキスト文を出力することがあるのです。こうした欠陥に対してGitHubは継続的な改善を約束していますが、不適切な出力を撲滅するのは困難だと考えられます。不適切な出力の可能性を皆無にできないからこそ、ソースコードの最終的な決定権は人間のユーザにあるべき、とも言えます。

GitHub Copilotについて報じたビジネスメディアVenture Beatは7月8日に公開した記事は、GitHub Copilotが大規模AIモデルであるが故の問題点を指摘しています。同AIの稼働には大量の電力消費が伴うため、間接的に二酸化炭素大量排出の原因になってしまうのです。

以上のようにGitHub Copilotは画期的なAIツールであると同時にいくつかの問題も抱えていますが、長期的にはプログラミング業務の在り方を世界規模で刷新するポテンシャルを秘めています。

大規模言語AIの民主化のために

以上のMicrosoft Power Appsのソースコード生成機能とGitHub Copilotは、両方ともその技術的基盤としてOpenAIが開発した大規模言語AIであるGPT-3を活用しています。同AIは悪用を予防する目的からAPIのみが公開されており、そのアクセス権はOpenAIが管理しています。それゆえ、同AIを活用したオープンソース開発はできません。

こうした現状に対して、GPT-3に匹敵するオープンソースの言語AI「EleutherAI(エレウテールAI)」を開発するプロジェクトが進行しています。EleutherAIを特集したWIRED.JPの記事によると、同AIの訓練に使う学習データの収集に際しては、GPT-3より入念な精査を行っている、とのこと。精査の一環として、不適切な表現が含まれている可能性がある英語圏最大の掲示板サイト「Reddit」の記述は学習データから排除しています。

テック系メディアAnalytics India Magazineは7月12日、EleutherAIの最新モデルGPT-JとGPT-3の性能を比較した記事を公開しました。このふたつの言語AIのソースコード生成能力に関しては、BuzzFeed所属のデータサイエンティストMax Woolf氏がテストセットを自作して比較してみました。テストの結果、GPT-JがGPT-3を凌駕しました。GPT-Jのパラメータ数はGPT-3の約30分の1の60億しかないことを考慮すると、驚きのテスト結果です。

もっとも、以上の比較実験ではGPT-3を使っているので、ソースコード生成のためにファインチューニングしたMicrosoft Power Appsの当該機能やGitHub Copiloと比較した場合、GPT-Jがこれらの言語AIより性能が劣っている可能性があります。しかしながら、オープンソースで開発された言語AIが大手テック系企業によって開発されたそれに匹敵するという事実は、言語AIの応用範囲を大きく広げることにつながります。

ソースコード生成AIは、今後急速にソフトウェア開発現場で普及すると予想されます。こうしたAIは決して人間のソフトウェア開発者を駆逐するようなものではなく、強力にサポートしてくれるものなのです。それゆえ、これからのソフトウェア開発者には「ソースコード生成AIをうまく使いこなせる」ことが必須スキルのひとつになることでしょう。

Writer:吉本幸記、Image by Microsoft

RELATED ARTICLE関連記事

【JSAI2021】AIエージェントのインタラクション設計の諸相:AIは、他のAIや人間と協調できるのか?

2021.7.13先端技術

【JSAI2021】AIエージェントのインタラクション設計の諸相:AIは、他のA...

ゲーマーの脳波に関する研究に投資するDARPAが目指す“第三の波”

2020.2.27先端技術

ゲーマーの脳波に関する研究に投資するDARPAが目指す“第三の波”

サッカーの戦術分析にも活躍。AI活用の新たなフロンティアとしての(e)スポーツ分析

2021.5.25先端技術

サッカーの戦術分析にも活躍。AI活用の新たなフロンティアとしての(e)スポーツ分...

RANKING注目の記事はこちら