14 июн. 2023 г.·1 мин

OctoML представляет OctoAI: самооптимизирующийся вычислительный сервис ИИ

OctoML объявляет о запуске своей новой платформы OctoAI, самооптимизирующегося вычислительного сервиса для ИИ, призванного облегчить развертывание приложений на основе ML, от оптимизации моделей до выбора оптимального оборудования, обеспечивая при этом простоту использования и фокус на генеративном ИИ.

С момента своего запуска в 2019 году в качестве инструмента для оптимизации ML, до привлечения 132 миллионов долларов и добавления множества функций для развертывания ML-моделей, OctoML позиционирует себя как значимого игрока в области машинного обучения. Теперь компания запускает OctoAI, смещая фокус с простой оптимизации моделей на предоставление предприятиям возможности точной настройки своих ML-моделей с использованием моделей с открытым исходным кодом, своих данных или пользовательских моделей. OctoAI - это самооптимизирующаяся вычислительная служба ИИ, которая предназначена для генеративного ИИ, упрощая управление инфраструктурой и позволяя компаниям сосредоточиться на создании приложений на основе ML.

Луис Цезе, соучредитель и генеральный директор OctoML, сказал, что предыдущая платформа была ориентирована на инженеров ML, упрощая упаковку моделей и их развертывание на различных типах оборудования. Однако последняя версия позволит пользователям решать, чему отдать приоритет, например, латентности или стоимости, а OctoAI автоматически определит идеальное оборудование для выполнения задачи. Новая платформа также автономно оптимизирует модели, что приведет к повышению производительности и экономичности.

Хотя пользователи по-прежнему могут выбирать предпочтительные параметры запуска и управления оборудованием, Ceze ожидает, что большинство пользователей предпочтут автоматизированное управление OctoAI. Сервис может решить, на чем запускать ML-модели - на графических процессорах Nvidia или на машинах Inferentia от AWS. Это устраняет многие сложности, связанные с развертыванием ML-моделей, и решает проблемы, которые мешали многим ML-проектам.

OctoML предлагает ускоренные версии популярных базовых моделей, включая Dolly 2, Whisper, FILM, FLAN-UL2 и Stable Diffusion, и планирует включить еще больше моделей. Во время тестирования они увидели, что Stable Diffusion работает в три раза быстрее и достигла снижения затрат в 5 раз по сравнению с оригинальной моделью.

Хотя OctoML будет продолжать работать с существующими клиентами, которые используют сервис для оптимизации своих моделей, в будущем компания сосредоточится на OctoAI как новой вычислительной платформе. Упрощение процессов развертывания ML делает такие платформы, как OctoAI и AppMaster's low-code, no-code решения, актуальными инструментами для предприятий, желающих использовать возможности AI и ML без необходимости работы со сложной инфраструктурой.

Легко начать

Создай что-то невероятное

Экспериментируйте с AppMaster с бесплатной подпиской.
Как только вы будете готовы, вы сможете выбрать подходящий платный план.

Попробовать AppMaster

Похожие новости