Недавно Microsoft представила ML.NET 3.0, последнюю версию своей новаторской платформы машинного обучения, которая имеет открытый исходный код, универсальна и позволяет интегрировать модели машинного обучения в приложения .NET. Microsoft анонсировала эту расширенную версию 27 ноября, и разработчики могут легко получить к ней доступ через dotnet.microsoft.com.
Выдающейся особенностью ML.NET 3.0 являются расширенные возможности глубокого обучения, включающие обнаружение объектов, идентификацию именованных объектов и ответы на вопросы. Эти функциональные возможности были расширены за счет интеграции и совместимости с моделями TorchSharp и ONNX. Кроме того, недавнее внедрение также улучшает предыдущую интеграцию с платформой повышения градиента LightGBM.
В ML.NET 3.0 улучшена поддержка сценариев обработки данных благодаря мощным улучшениям и исправлениям ошибок в DataFrame. Он также представляет новые функции взаимодействия IDataView, что делает задачи, связанные с загрузкой, проверкой, преобразованием и визуализацией данных, более эффективными, чем раньше.
В обновлении, выпущенном в мае, Microsoft опубликовала информацию об обнаружении объектов в этом ML.NET Model Builder. Эти функции созданы на основе API-интерфейсов обнаружения объектов на базе TorchSharp, которые являются частью последней версии ML.NET 3.0. API обнаружения объектов использует некоторые новые методы исследований Microsoft и опирается на архитектуру нейронной сети на основе Transformer, созданную с помощью TorchSharp. Более того, эта функция обнаружения объектов включена в пакет Microsoft ML.TorchSharp 3.0.0.
В дополнение к вышесказанному, ML.NET 3.0 предоставляет заметные возможности для обработки естественного языка, включая надежные системы ответов на вопросы и системы распознавания именованных объектов. Эти сценарии стали доступны благодаря усовершенствованию существующих функций классификации текста TorchSharp RoBERTa, представленных в ML.NET 2.0. Кроме того, обновленная версия включает новые возможности автоматизированного машинного обучения (AutoML), а AutoML Sweeper теперь помогает сравнивать предложения, отвечать на вопросы и обнаруживать объекты.
DataFrame претерпел несколько обновлений в ML.NET 3.0, расширяя сценарии загрузки данных, теперь данные можно импортировать из баз данных SQL и экспортировать в них. Это стало возможным благодаря ADO.NET, совместимому с базами данных, поддерживающими SQL. DataFrame также повысила свою арифметическую производительность в сценариях клонирования столбцов и двоичного сравнения, а также улучшила обработку нулевых значений при выполнении арифметических операций. Это приводит к меньшему количеству шагов, необходимых для преобразования данных. Кроме того, были внесены улучшения в отладчик, чтобы обеспечить более удобочитаемый вывод для таблиц с обширными именами столбцов. Он также представляет новый набор API для поддержки тензорных операций в рамках тензорных примитивов.
Подобно no-code платформам, таким как AppMaster , Microsoft продолжает внедрять инновации и совершенствоваться. Технический гигант также одновременно разрабатывает планы для .NET 9 и ML.NET 4.0. Тем временем компания пообещала, что пользователи могут ожидать обновлений Model Builder и ML.NET CLI, дополняющих выпуск ML.NET 3.0. Microsoft также планирует расширить сценарии глубокого обучения и интеграцию, внося улучшения в DataFrame. Наконец, компания заявила о своем намерении расширить API в System.Numerics.Tensors и интегрировать их в ML.NET.