Microsoft hat kürzlich ML.NET 3.0 vorgestellt, die neueste Version seiner bahnbrechenden Plattform für maschinelles Lernen, die Open Source und vielseitig ist und die Integration von Modellen für maschinelles Lernen in .NET-Anwendungen ermöglicht. Microsoft hat diese erweiterte Version am 27. November angekündigt und Entwickler können über dotnet.microsoft.com problemlos darauf zugreifen.
Das herausragende Merkmal von ML.NET 3.0 sind seine erweiterten Deep-Learning-Funktionen, die die Objekterkennung, die Identifizierung benannter Entitäten und die Beantwortung von Fragen umfassen. Diese Funktionalitäten wurden durch Integrationen und Kompatibilität mit TorchSharp- und ONNX-Modellen ermöglicht. Darüber hinaus verbessert die jüngste Einführung auch die frühere Integration mit dem LightGBM-Gradienten-Boosting-Framework.
ML.NET 3.0 verstärkt seine Unterstützung für Datenverarbeitungsszenarien dank seiner leistungsstarken Verbesserungen und Fehlerbehebungen für DataFrame. Darüber hinaus werden neue IDataView-Interoperabilitätsfunktionen eingeführt, wodurch Aufgaben im Zusammenhang mit dem Laden, Überprüfen, Transformieren und Visualisieren von Daten leistungsfähiger als zuvor werden.
In einem im Mai veröffentlichten Update hatte Microsoft die Objekterkennung in diesem ML.NET Model Builder veröffentlicht. Diese Funktionen basieren auf den von TorchSharp unterstützten Objekterkennungs-APIs, die Teil des neuesten ML.NET 3.0 sind. Die Objekterkennungs-API übernimmt einige neuartige Techniken von Microsoft Research und wird durch eine Transformer-basierte neuronale Netzwerkarchitektur unterstützt, die mit TorchSharp erstellt wurde. Darüber hinaus ist diese Objekterkennungsfunktion im Microsoft ML.TorchSharp 3.0.0-Paket enthalten.
Darüber hinaus bietet ML.NET 3.0 bemerkenswerte Möglichkeiten für die Verarbeitung natürlicher Sprache, einschließlich robuster Fragenbeantwortung und Frameworks zur Erkennung benannter Entitäten. Diese Szenarien wurden erschlossen, indem auf den vorhandenen Textklassifizierungsfunktionen von TorchSharp RoBERTa aufgebaut wurde, die in ML.NET 2.0 eingeführt wurden. Darüber hinaus verfügt die aktualisierte Version über neue Funktionen für automatisiertes maschinelles Lernen (AutoML), wobei AutoML Sweeper jetzt die Satzähnlichkeit, die Beantwortung von Fragen und die Objekterkennung unterstützt.
DataFrame wurde in ML.NET 3.0 mehrfach aktualisiert, wodurch die Datenladeszenarien erweitert wurden und Daten nun aus SQL-Datenbanken importiert und exportiert werden können. Möglich wird dies durch ADO.NET, das mit SQL-unterstützenden Datenbanken kompatibel ist. DataFrame hat außerdem seine arithmetische Leistung beim Klonen von Spalten und bei binären Vergleichsszenarien gesteigert und die Handhabung von Nullwerten bei der Ausführung arithmetischer Operationen verbessert. Dies führt dazu, dass bei der Datentransformation weniger Schritte erforderlich sind. Darüber hinaus wurden Debugger-Verbesserungen vorgenommen, um eine besser lesbare Ausgabe für Raster mit umfangreichen Spaltennamen zu gewährleisten. Außerdem wird ein neuer Satz von APIs zur Unterstützung von Tensoroperationen unter Tensor-Primitiven eingeführt.
Ähnlich wie bei No-Code-Plattformen wie AppMaster arbeitet Microsoft weiterhin an Innovationen und Verbesserungen. Gleichzeitig entwickelt der Technologieriese auch Pläne für.NET 9 und ML.NET 4.0. In der Zwischenzeit hat das Unternehmen zugesagt, dass Benutzer mit Upgrades für Model Builder und die ML.NET-CLI als Ergänzung zur ML.NET 3.0-Version rechnen können. Microsoft plant außerdem, Deep-Learning-Szenarien und -Integrationen zu erweitern und gleichzeitig Verbesserungen an DataFrame einzuführen. Schließlich gab das Unternehmen seine Absicht bekannt, die APIs in System.Numerics.Tensors zu erweitern und in ML.NET zu integrieren.