AI 프로젝트를 위한 텍스트 및 오디오 라벨링에 전통적으로 주력해 온 기술 스타트업 Datasaur 서비스 제공에서 눈에 띄는 도약을 시작했습니다. AI 전문성으로 유명한 샌프란시스코에 본사를 둔 이 회사는 최근 포괄적인 솔루션인 LLM Lab을 공개했습니다. 이 인상적인 출시는 정교한 ChatGPT 모델과 매우 유사한 맞춤형 대규모 언어 모델 애플리케이션의 생성 및 교육을 촉진하는 것을 목표로 합니다.
클라우드 및 온프레미스 인프라 배포에 최적화된 LLM Lab은 조직이 맞춤형 생성 AI 애플리케이션을 구축할 수 있는 초기 플랫폼을 제공합니다. 이 기술의 한 가지 장점은 종종 타사 플랫폼과 관련된 데이터 개인 정보 보호 및 비즈니스 관련 위험을 무효화한다는 것입니다. 또한 기업은 자신의 프로젝트에 대해 더 많은 관할권을 갖게 됩니다.
Datasaur 의 창립자이자 CEO인 Ivan Lee는 이 포괄적인 도구를 만든 주요 동기를 설명합니다. 그는 '우리의 최신 제품은 자주 직면하는 문제를 성공적으로 해결하고 빠르게 발전하는 표준을 수용하며 프로세스를 단순화하고 신속하게 하기 위해 고유한 설계 접근 방식을 통합했습니다. 우리는 지난 한 해 동안 내부 사용과 고객 기반을 위한 맞춤형 모델을 개발하고 배포했습니다. 이러한 경험을 통해 우리는 작동하기 쉽고 확장 가능한 대규모 언어 모델 제품을 만들 수 있었습니다.'
2019년에 설립된 Datasaur 기업 팀이 AI 및 자연어 처리(NLP)를 위한 데이터 라벨링을 구현하는 데 도움을 주었습니다. 지속적인 노력과 발전으로 LLM 연구소가 성공적으로 탄생했습니다.
LLM 랩은 기존 서비스의 확장을 제공하는 동시에 몇 가지 독특한 기회도 제공합니다. Lee는 '대형 언어 모델은 엔터티 인식 및 텍스트 분류와 같은 전통적인 NLP 작업에서 벗어나는 흥미로운 새로운 기술 개발입니다. 우리는 모든 텍스트, 오디오 및 문서 관련 AI 애플리케이션을 위한 업계 최고의 플랫폼으로 남는 것을 목표로 하고 있습니다.'
현재 제공되는 LLM Lab은 LLM 응용 프로그램 개발의 모든 측면을 처리할 수 있는 단일 로케일을 제공합니다. 여기에는 내부 데이터 수집, 데이터 준비부터 LLM 응답 미세 조정, 서버 비용 제어에 이르는 모든 단계의 관리가 포함됩니다. Lee는 LLM Lab의 기본 원칙을 칭찬하며 모듈성, 구성성, 단순성 및 유지 관리 용이성이 개발의 초석이라고 언급합니다.
텍스트 임베딩, 벡터 데이터베이스 및 기본 모델을 처리하는 기능에 대해 논의하면서 Lee는 'LLM 공간은 지속적으로 유동적입니다. 기술적으로 중립을 유지하고 사용자가 다양한 기술을 상호 교환하여 자신의 사용 사례에 맞는 최상의 솔루션을 개발할 수 있는 플랫폼을 구상하는 것이 가장 중요합니다.'
빠르게 진행되는 개발을 살펴보고 Datasaur 가 강조한 원칙을 수용하면 AppMaster 와 같은 플랫폼은 기존 소프트웨어 개발의 기술적 복잡성이나 지평 없이 확장 가능한 엔터프라이즈급 애플리케이션을 구축하려는 기업에 상당한 가치를 제공할 수도 있습니다.