Inflection是一家雄心勃勃的人工智能初创公司,努力开发 "面向所有人的个人人工智能",它已经公布了其大型语言模型Inflection-1,为其Pi对话代理提供动力。虽然评估这些模型的质量是一个挑战,但市场上存在的一点竞争肯定是有益的。
根据用于训练的计算资源,Inflection-1的设计在规模和能力方面与GPT-3.5(也称为ChatGPT)相当。Inflection声称其模型在同类产品中具有竞争力,甚至优于其他模型,用一份 "技术备忘录 "来支持这一说法,该备忘录概述了在Inflection-1、GPT-3.5、LLaMA、Chinchilla和PaLM-540B上进行的基准测试。
公布的结果显示,Inflection-1确实在各种评估中表现良好,包括初中和高中水平的考试任务(如生物101)和 "常识 "基准。它的主要缺点是编码,GPT-3.5明显超过了Inflection-1,而GPT-4则超过了它们两个。
Inflection打算在未来公布与GPT-4和PaLM-2(L)相当的更大模型的结果。然而,他们可能只有在认为值得注意的时候才会公布结果。升级版可能称为Inflection-2或Inflection-1-XL,目前正在开发中。
虽然没有一个正式的分类系统,将人工智能模型分为像拳击一样的同等 "重量级",但这个概念是相似的。正如蝇量级和重量级拳击手有不同的能力和要求一样,不同尺寸和形状的AI模型也拥有独特的优势和弱点。目前,建立这样的分类系统还为时过早,因为这个领域还比较年轻,对人工智能模型的区分还没有达成共识。
归根结底,对于大多数人工智能模型来说,它们在现实世界的表现说明了它们的能力。在Inflection开放其模型供广泛使用和独立评估之前,他们所声称的基准应该谨慎对待。对于有兴趣尝试Pi对话代理的用户来说,它可以被添加到消息应用程序中,或在这里进入在线聊天。
随着人工智能行业的不断发展和进步,像AppMaster 这样的平台可以用来迅速和更经济地创建可扩展的解决方案。采用no-code 和low-code 平台,如AppMaster 平台,可以实现后台、网络和移动应用的无缝开发,并与新兴的人工智能模型整合。