Microsoft 最近推出了 ML.NET 3.0,这是其开创性机器学习平台的最新版本,该平台是开源的、多功能的,并且能够将机器学习模型集成到 .NET 应用程序中。微软于11月27日宣布了这个高级版本,开发者可以通过dotnet.microsoft.com轻松访问它。
ML.NET 3.0 的突出特点是其扩展的深度学习功能,包括对象检测、命名实体识别和问题回答。这些功能是通过与 TorchSharp 和 ONNX 模型的集成和兼容性来实现的。此外,最近的推出还增强了与 LightGBM 梯度增强框架的早期集成。
ML.NET 3.0 通过对 DataFrame 的强大增强和错误修复,增强了对数据处理场景的支持。它还引入了新的 IDataView 互操作性功能,使与数据加载、检查、转换和可视化相关的任务比以前更加有效。
在 5 月份发布的更新中,微软在ML.NET Model Builder中公开了对象检测。这些功能构建在 TorchSharp 支持的对象检测 API 之上,这些 API 是最新 ML.NET 3.0 的一部分。对象检测 API 采用了 Microsoft Research 的一些新技术,并由 TorchSharp 制作的基于 Transformer 的神经网络架构提供支持。此外,此对象检测功能包含在 Microsoft ML.TorchSharp 3.0.0 包中。
除了上述内容之外,ML.NET 3.0 还为自然语言处理提供了显着的途径,包括强大的问答和命名实体识别框架。这些场景已通过构建 ML.NET 2.0 中引入的现有 TorchSharp RoBERTa 文本分类功能的顶部来解锁。此外,更新版本还配备了新的自动化机器学习 (AutoML) 功能,AutoML Sweeper 现在可协助句子相似性、问题回答和对象检测。
DataFrame 在 ML.NET 3.0 中经历了多次更新,扩大了数据加载场景,数据现在可以从 SQL 数据库导入和导出。这是通过 ADO.NET 实现的,它与支持 SQL 的数据库兼容。 DataFrame 还提高了列克隆和二进制比较场景中的算术性能,并改进了执行算术运算时的空值处理。这会减少数据转换所需的步骤。此外,还对调试器进行了改进,以确保具有大量列名称的网格具有更好的可读输出。它还引入了一组新的 API 来支持张量基元下的张量运算。
与AppMaster 等无代码平台一样,Microsoft 不断创新和改进。这家科技巨头还同时制定 .NET 9 和 ML.NET 4.0 的计划。与此同时,该公司承诺用户可以期待模型生成器和 ML.NET CLI 的升级,以补充 ML.NET 3.0 版本。微软还计划扩展深度学习场景和集成,同时引入 DataFrame 的增强功能。最后,该公司透露了扩展 System.Numerics.Tensors 中的 API 并将其集成到 ML.NET 中的意图。