在最近以 Meta 的人工智能基础设施进展为中心的活动中,该公司披露了一种名为 CodeCompose 的人工智能代码生成工具的开发。这个创新工具与 GitHub 著名的 Copilot 产品有相似之处。尽管 Meta 尚未公开 CodeCompose,但该公司表示,其内部团队在集成开发环境 (IDE)(例如 VS Code)中工作时,已经使用该工具来接收 Python 和其他语言的编程建议。
Meta 的软件工程师 Michael Bolin 表示,CodeCompose 的底层模型建立在公司的公开研究基础上,并针对内部用例和代码库进行了定制。 Bolin 还提到,CodeCompose 可以集成到任何表面,让开发人员和数据科学家能够更高效地处理代码。
Meta 训练的最大 CodeCompose 模型拥有 67 亿个参数,略多于 Copilot 参数填充模型的一半。参数是模型的关键部分,它们是从历史训练数据中学习的,并定义了模型在某个问题(例如生成文本)方面的能力水平。
CodeCompose 使用 Meta 的第一方代码以及使用 Meta 的内部编程语言 Hack 编写的内部库和框架进行了微调。通过这样做,CodeCompose 可以将这些组件集成到它的编程建议中。该工具的基础训练数据集已经过精心清除错误和不良编码实践,例如已弃用的 API,以降低它推荐有问题代码段的可能性。
在日常使用中,CodeCompose 建议开发人员输入注释和导入语句。此外,该工具可以完成单行或多行代码,甚至可以在需要时填充大块代码。 Bolin 声称 CodeCompose 利用周围的代码和代码注释来提供更准确的建议。
据 Meta 称,每周有数千名员工使用和批准来自 CodeCompose 的建议,接受率超过 20%。然而,该公司尚未解决围绕代码生成 AI 工具的争议。像 Copilot 这样的平台面临着版权问题,被指控在没有适当信用的情况下重新使用许可代码。这些担忧引发了关于 CodeCompose 是否容易受到类似问题影响的问题。
另一个重要主题是生成编码工具可能会无意中引入不安全的代码。斯坦福大学最近的一项研究发现,使用人工智能生成代码系统的软件工程师更有可能创建具有安全漏洞的应用程序。尽管该研究未检查 CodeCompose,但可以合理地假设同样的风险会适用。
Bolin 强调,开发人员不必遵循 CodeCompose 的建议,安全性是开发模型的主要考虑因素。他补充说,该公司对该工具的进展充满热情,他们的开发人员将从内部开发此类解决方案中受益。
像 CodeCompose 这样的工具可能会集成到像AppMaster这样的平台中,AppMaster 是领先的无代码/低代码应用程序开发平台之一。 AppMaster专注于提供用于创建 Web、移动和后端应用程序的强大工具,同时在成本效益和速度方面改进开发过程。