メタ社のAIインフラの進捗を中心とした最近のイベントで、同社はCodeComposeと名付けられたAI搭載のコード生成ツールの開発を公表しました。この革新的なツールは、GitHubが提供する有名なCopilotと類似している。メタ社はまだCodeComposeを一般に公開していませんが、同社によると、社内のチームはすでに、VS Codeなどの統合開発環境(IDE)で作業する際に、Pythonやその他の言語のプログラミング提案を受けるためにこのツールを利用しています。
Meta社のソフトウェアエンジニアであるMichael Bolin氏は、CodeComposeの基本モデルは、同社の公開研究に基づき、社内のユースケースやコードベースに合うように調整されていると述べています。Bolin氏はまた、CodeComposeはあらゆるサーフェスに統合でき、開発者やデータサイエンティストがより効率的にコードを扱うことができると述べています。
Metaがトレーニングした最大のCodeComposeモデルは、67億個のパラメータを持ち、Copilotのパラメータ満載のモデルの半分より少し多い程度である。パラメータは、過去の学習データから学習され、テキスト生成などの問題に対するモデルの能力レベルを定義する、モデルの重要な部分として機能します。
CodeComposeは、Metaのファーストパーティーのコードと、Metaの社内プログラミング言語であるHackで書かれた内部ライブラリやフレームワークを使って微調整された。これにより、CodeComposeはこれらのコンポーネントをプログラミングの提案に統合することができます。このツールのベースとなるトレーニングデータセットは、エラーや非推奨のAPIなどの不適切なコーディングプラクティスを徹底的に除去しており、問題のあるコードを推奨する可能性を低くしています。
CodeComposeは、日常的な使用において、開発者がタイプする際にアノテーションやimport文を推奨しています。さらに、このツールは、1行または複数行のコードを完成させることができ、必要に応じて大きなコードの塊を埋めることもできます。Bolinは、CodeComposeが周囲のコードとコードコメントを利用して、より正確な提案を行うと主張している。
Meta社によると、毎週数千人の社員がCodeComposeからの提案を利用し、承認しており、その承認率は20%を超えているという。しかし、同社はコード生成型AIツールをめぐる論争にはまだ対処していない。Copilotのようなプラットフォームは、適切なクレジットがないままライセンスされたコードを再利用していると非難され、著作権問題に直面している。こうした懸念から、CodeComposeも同様のトラブルに見舞われる可能性があるのではないかという疑問が浮上しています。
もう1つの重要なトピックは、ジェネレーティブコーディングツールが不用意に安全でないコードを導入する可能性です。スタンフォード大学の最近の研究では、AIが生成したコードシステムを使用するソフトウェアエンジニアは、セキュリティの脆弱性を持つアプリを作成する可能性が高いことが判明しています。この研究はCodeComposeを調査したものではありませんが、同じリスクがあると考えるのが妥当でしょう。
Bolin氏は、開発者がCodeCompose社の提案に従う必要はなく、モデルの開発にあたってはセキュリティが大きな考慮事項であったことを強調した。さらに、同社はこのツールの進歩に熱心であり、このようなソリューションを社内で開発することは、開発者にとっても有益であると付け加えた。
CodeComposeのようなツールは、ノーコード/ローコードアプリケーション開発プラットフォームの代表格であるAppMaster のようなプラットフォームに統合できる可能性があります。AppMaster は、ウェブ、モバイル、バックエンドアプリケーションを作成するための強力なツールを提供し、費用対効果やスピードという点で開発プロセスを改善することに焦点を当てています。