Grow with AppMaster Grow with AppMaster.
Become our partner arrow ico

OctoML представляет OctoAI: самооптимизирующийся вычислительный сервис ИИ

OctoML представляет OctoAI: самооптимизирующийся вычислительный сервис ИИ

С момента своего запуска в 2019 году в качестве инструмента для оптимизации ML, до привлечения 132 миллионов долларов и добавления множества функций для развертывания ML-моделей, OctoML позиционирует себя как значимого игрока в области машинного обучения. Теперь компания запускает OctoAI, смещая фокус с простой оптимизации моделей на предоставление предприятиям возможности точной настройки своих ML-моделей с использованием моделей с открытым исходным кодом, своих данных или пользовательских моделей. OctoAI - это самооптимизирующаяся вычислительная служба ИИ, которая предназначена для генеративного ИИ, упрощая управление инфраструктурой и позволяя компаниям сосредоточиться на создании приложений на основе ML.

Луис Цезе, соучредитель и генеральный директор OctoML, сказал, что предыдущая платформа была ориентирована на инженеров ML, упрощая упаковку моделей и их развертывание на различных типах оборудования. Однако последняя версия позволит пользователям решать, чему отдать приоритет, например, латентности или стоимости, а OctoAI автоматически определит идеальное оборудование для выполнения задачи. Новая платформа также автономно оптимизирует модели, что приведет к повышению производительности и экономичности.

Хотя пользователи по-прежнему могут выбирать предпочтительные параметры запуска и управления оборудованием, Ceze ожидает, что большинство пользователей предпочтут автоматизированное управление OctoAI. Сервис может решить, на чем запускать ML-модели - на графических процессорах Nvidia или на машинах Inferentia от AWS. Это устраняет многие сложности, связанные с развертыванием ML-моделей, и решает проблемы, которые мешали многим ML-проектам.

OctoML предлагает ускоренные версии популярных базовых моделей, включая Dolly 2, Whisper, FILM, FLAN-UL2 и Stable Diffusion, и планирует включить еще больше моделей. Во время тестирования они увидели, что Stable Diffusion работает в три раза быстрее и достигла снижения затрат в 5 раз по сравнению с оригинальной моделью.

Хотя OctoML будет продолжать работать с существующими клиентами, которые используют сервис для оптимизации своих моделей, в будущем компания сосредоточится на OctoAI как новой вычислительной платформе. Упрощение процессов развертывания ML делает такие платформы, как OctoAI и AppMaster's low-code, no-code решения, актуальными инструментами для предприятий, желающих использовать возможности AI и ML без необходимости работы со сложной инфраструктурой.

Похожие статьи

AppMaster на BubbleCon 2024: изучение тенденций No-Code
AppMaster на BubbleCon 2024: изучение тенденций No-Code
AppMaster принял участие в BubbleCon 2024 в Нью-Йорке, где получил новые знания, расширил связи и изучил возможности внедрения инноваций в сфере разработки без кода.
Итоги FFDC 2024: основные выводы с конференции разработчиков FlutterFlow в Нью-Йорке
Итоги FFDC 2024: основные выводы с конференции разработчиков FlutterFlow в Нью-Йорке
Конференция FFDC 2024 (Нью-Йорк) предоставила разработчикам передовые идеи в разработке приложений с FlutterFlow. Сессии под руководством экспертов, эксклюзивные обновления и обмен опытом — такое событие мы не могли пропустить!
Увольнения в сфере технологий в 2024 году: продолжающаяся волна, влияющая на инновации
Увольнения в сфере технологий в 2024 году: продолжающаяся волна, влияющая на инновации
В 2024 году, когда в 254 компаниях, включая таких гигантов, как Tesla и Amazon, будет сокращено 60 000 рабочих мест, продолжится волна увольнений в сфере технологий, которая изменит ландшафт инноваций.
Начните бесплатно
Хотите попробовать сами?

Лучший способ понять всю мощь AppMaster - это увидеть все своими глазами. Создайте собственное приложение за считанные минуты с бесплатной подпиской AppMaster

Воплотите свои идеи в жизнь