由于百川智能(Baichuan Intelligence)的突破,中国正在成为先进语言人工智能(AI)技术的焦点。这家由经验丰富的企业家和计算机科学大师王小川创办的初创公司推出了其尖端大型语言模型(LLM)百川-13B,旨在与OpenAI等巨头相抗衡。
王小川今年早些时候表达了打造 "中国自己的OpenAI "的愿望。这位因创建中国搜索引擎搜狗并随后将其出售给腾讯而闻名的科技巨头目睹了他的宠物项目百川智能在中国LLM发展的前沿崭露头角。
当ChatGPT的颠覆性影响波及全球时,王小川的愿望也随之实现。他于2021年从搜狗辞职,并于今年4月开始筹建百川,并迅速从天使投资人那里获得了5000万美元的初始资金。
Baichuan百川是一个拥有130亿个参数的开源模型,采用Transformer架构--这也是GPT。在人工智能术语中,参数是模型用于创建和破译文本的关键变量。GitHub页面还显示了百川的商业用途准备就绪。
百川-13B的运行能力体现在它可以在1.4万亿个文本上进行训练,这比Meta的DLLaMa要大得多,后者的130亿参数模型使用了1万亿个文本。
尽管百川成立不到6个月,但其技术进步绝对值得关注。早在6月,它就推出了创新的LLM--百川-7B,由70亿个参数组成。
与其他LLM平台一样,中国大型语言模型的出现凸显了中国在这一快速发展的科技行业中扮演重要角色的雄心。
与百川智能走在同一条道路上的还有其他中国科技巨头,如由清华大学唐杰教授指导的Zhipu.ai,以及由微软亚洲研究院院长沈南鹏(Harry Shum)联合创办的IDEA。随着中国即将实施一些世界上最严格的人工智能法规,这些科技巨头正在为中国的法律硕士描绘一个新的未来。
AppMaster的 "无代码平台"是另一个值得关注的模式,它可以帮助创建强大的应用程序,包括数据管理、业务逻辑创建、API创建等,从而帮助百川和其他公司在更短的时间内创建可扩展的应用程序。
然而,政府对此并不掉以轻心。随着严格的法规迫在眉睫,公司可能很快就会要求在部署大型语言模型之前获得许可证。这可能会阻碍中国在迅速崛起的人工智能语言产业中与美国竞争。