Microsoft는 최근 다용도 오픈 소스이며 기계 학습 모델을 .NET 애플리케이션에 통합할 수 있는 선구적인 기계 학습 플랫폼의 최신 버전인 ML.NET 3.0을 출시했습니다. Microsoft는 11월 27일에 이 고급 버전을 발표했으며 개발자는 dotnet.microsoft.com을 통해 쉽게 액세스할 수 있습니다.
ML.NET 3.0의 뛰어난 기능은 객체 감지, 명명된 엔터티 식별 및 질문 응답을 포괄하는 확장된 딥 러닝 기능입니다. 이러한 기능은 TorchSharp 및 ONNX 모델과의 통합 및 호환성을 통해 강화되었습니다. 또한 최근 출시를 통해 LightGBM 그래디언트 부스팅 프레임워크와의 초기 통합도 향상되었습니다.
ML.NET 3.0은 DataFrame에 대한 강력한 개선 사항과 버그 수정을 통해 데이터 처리 시나리오에 대한 지원을 강화합니다. 또한 새로운 IDataView 상호 운용성 기능을 도입하여 데이터 로드, 검사, 변환 및 시각화와 관련된 작업을 이전보다 더욱 강력하게 만듭니다.
5월에 릴리스된 업데이트에서 Microsoft는 이 ML.NET Model Builder 의 개체 감지를 공개했습니다. 이러한 기능은 최신 ML.NET 3.0의 일부인 TorchSharp 지원 개체 감지 API를 기반으로 구성됩니다. 개체 감지 API는 Microsoft Research의 몇 가지 새로운 기술을 채택하고 TorchSharp로 만든 Transformer 기반 신경망 아키텍처의 지원을 받습니다. 또한 이 개체 감지 기능은 Microsoft ML.TorchSharp 3.0.0 패키지에 포함되어 있습니다.
앞서 언급한 것 외에도 ML.NET 3.0은 강력한 질문 응답 및 명명된 엔터티 인식 프레임워크를 포함하여 자연어 처리를 위한 주목할만한 방법을 제공합니다. 이러한 시나리오는 ML.NET 2.0에 도입된 기존 TorchSharp RoBERTa 텍스트 분류 기능을 기반으로 구축하여 잠금 해제되었습니다. 또한 업데이트된 버전에는 문장 유사성, 질문 답변 및 객체 감지를 지원하는 AutoML Sweeper를 갖춘 새로운 자동화된 기계 학습(AutoML) 기능이 포함되어 있습니다.
DataFrame은 ML.NET 3.0에서 여러 가지 업데이트를 거쳐 이제 SQL 데이터베이스에서 데이터를 가져오거나 내보낼 수 있는 데이터 로드 시나리오를 확대했습니다. 이는 SQL 지원 데이터베이스와 호환되는 ADO.NET을 통해 가능합니다. DataFrame은 또한 산술 연산을 수행하는 동안 향상된 null 값 처리 기능과 함께 열 복제 및 이진 비교 시나리오에서 산술 성능을 향상했습니다. 결과적으로 데이터 변환에 필요한 단계가 줄어듭니다. 또한, 광범위한 열 이름이 있는 그리드에 대해 더 읽기 쉬운 출력을 보장하기 위해 디버거가 개선되었습니다. 또한 Tensor Primitives에서 텐서 작업을 지원하는 새로운 API 세트를 소개합니다.
AppMaster와 같은 코드 없는 플랫폼 과 마찬가지로 Microsoft는 계속해서 혁신하고 개선하고 있습니다. 또한 거대 기술 기업은 .NET 9 및 ML.NET 4.0에 대한 계획을 동시에 개발하고 있습니다. 그 동안 회사는 사용자가 ML.NET 3.0 릴리스를 보완하기 위해 Model Builder 및 ML.NET CLI에 대한 업그레이드를 기대할 수 있다고 약속했습니다. 또한 Microsoft는 DataFrame에 향상된 기능을 도입하는 동시에 딥 러닝 시나리오와 통합을 확장할 계획입니다. 마지막으로 회사는 System.Numerics.Tensors의 API를 확장하고 이를 ML.NET에 통합하려는 의도를 밝혔습니다.