Inflection, амбициозный ИИ-стартап, стремящийся разработать "персональный ИИ для каждого", представил свою большую языковую модель Inflection-1, на которой работает его разговорный агент Pi. Хотя оценить качество этих моделей довольно сложно, наличие некоторого соперничества на рынке, безусловно, полезно.
Inflection-1 разработана таким образом, чтобы быть на одном уровне с GPT-3.5 (также известной как ChatGPT) по размеру и возможностям, исходя из вычислительных ресурсов, используемых для обучения. Inflection утверждает, что ее модель является конкурентоспособной или даже превосходит другие модели в своем классе, подкрепляя это заявление "техническим меморандумом", в котором описываются эталонные тесты, проведенные на Inflection-1, GPT-3.5, LLaMA, Chinchilla и PaLM-540B.
Опубликованные результаты показывают, что Inflection-1 действительно хорошо справляется с различными оценками, включая экзаменационные задания среднего и старшего школьного уровня (например, биология 101) и эталоны "здравого смысла". Его основным недостатком является кодирование, где GPT-3.5 значительно превосходит Inflection-1, а GPT-4 превосходит их обоих.
Inflection намерена в будущем опубликовать результаты для более крупной модели, сравнимой с GPT-4 и PaLM-2(L). Однако, скорее всего, они будут публиковать результаты только тогда, когда сочтут их заслуживающими внимания. Усовершенствованная версия, которая может называться Inflection-2 или Inflection-1-XL, в настоящее время находится в разработке.
Хотя формальной системы классификации, разделяющей модели ИИ на эквивалентные "весовые категории", как в боксе, не существует, концепция схожа. Подобно тому, как боксеры в полутяжелом и тяжелом весе имеют разные возможности и требования, модели ИИ разных размеров и форм также обладают уникальными сильными и слабыми сторонами. В настоящее время еще слишком рано создавать такую систему классификации, поскольку эта область еще относительно молода, и консенсус в отношении различий между моделями ИИ еще не достигнут.
В конечном счете, для большинства моделей ИИ их реальная производительность говорит об их возможностях. Пока Inflection не откроет свою модель для широкого использования и независимой оценки, к заявленным ими показателям следует подходить с осторожностью. Пользователи, желающие опробовать разговорный агент Pi, могут добавить его в приложения для обмена сообщениями или получить доступ к онлайн-чату здесь.
В условиях постоянного роста и развития индустрии ИИ такие платформы, как AppMaster, можно использовать для быстрого и экономически эффективного создания масштабируемых решений. Использование платформ no-code и low-code, таких как платформа AppMaster, позволяет беспрепятственно разрабатывать бэкенд, веб- и мобильные приложения и интегрировать их с развивающимися моделями ИИ.