AI에서 초인간 지능의 잠재적으로 예측할 수 없는 결과를 제어하기 위해 OpenAI 회사의 수석 과학자이자 공동 설립자인 Ilya Sutskever가 이끄는 고도로 전문화된 그룹을 조직하고 있습니다. 이 팀의 주요 책임은 '초지능' AI 모델을 관리하고 조종하기 위한 전략을 고안하는 것입니다. 최근 블로그 게시물에서 Sutskever는 OpenAI의 정렬 팀 책임자인 Jan Leike와 함께 인간 지능을 능가할 수 있는 능력을 갖춘 AI가 10년 내에 등장할 수 있다고 예상했습니다. 그들은 이 우수한 AI가 결국 성공하더라도 본질적으로 양성 특성을 통합하지 않을 수 있으므로 이를 제어하고 제한하는 연구 기술이 필수적이라고 주장합니다.
현재 잠재적인 초지능 AI를 효과적으로 제어하거나 안내하여 의도한 경로에서 벗어나지 않도록 하는 알려진 방법은 없습니다. 사람의 피드백을 통한 교육과 같은 기존의 AI 정렬 기술은 작업을 감독하는 사람을 기반으로 합니다. 그러나 인간 지능을 훨씬 능가하는 AI 시스템을 감독하는 것은 어려울 수 있습니다. '초지능 정렬' 분야의 발전을 증폭시키기 위해 OpenAI는 Sutskever와 Leike가 공동으로 이끄는 새로운 'Superalignment' 팀을 발족합니다. 이 팀은 회사가 현재 소유하고 있는 컴퓨팅 리소스의 20%에 액세스할 수 있습니다. OpenAI의 이전 정렬 부서의 과학자 및 엔지니어와 회사 내 다양한 조직의 연구원으로 구성된 이 팀은 향후 4년 동안 초지능 AI를 제어하는 핵심 기술 과제를 해결할 예정입니다.
이 계획은 인간의 피드백을 통해 AI를 훈련시키고, 다른 AI 시스템을 평가하는 데 AI를 참여시키고, 궁극적으로 정렬 연구를 수행할 수 있는 AI를 엔지니어링하는 것을 목표로 하는 '인간 수준의 자동 정렬 연구원'을 만드는 것입니다. 정렬 연구의 목표는 AI 시스템을 정렬하여 특정 결과를 달성하고 경로를 벗어나지 않도록 방지하는 것입니다. OpenAI는 AI가 정렬 연구에서 인간보다 더 빠르고 효과적으로 상당한 진전을 이룰 수 있다는 가설을 세우고 있습니다. 진행이 진행됨에 따라 AI 시스템은 정렬 작업의 양을 증가시켜 정렬 기술을 개선할 것으로 예상됩니다. 이를 통해 AI가 인간과 협력하여 후계자가 인간과 더욱 긴밀하게 연결될 수 있기를 바랍니다. 그 동안 인간 연구자의 초점은 이 연구를 독립적으로 생성하는 대신 AI 시스템이 수행하는 정렬 연구를 검토하는 것으로 전환될 것입니다.
어떤 방법도 오류가 없는 것으로 간주될 수는 없지만 Leike, Schulman 및 Wu는 게시물에서 OpenAI 접근 방식의 단점을 설명합니다. 평가를 위해 AI를 활용하면 해당 AI의 불일치, 편향 및 취약성을 확장할 수 있습니다. 또한 정렬 문제의 가장 복잡한 측면은 엔지니어링과 전혀 관련이 없을 수 있습니다. 그럼에도 불구하고 Sutskever와 Leike는 기꺼이 테스트에 임했습니다. Sutskever와 Leike는 초지능의 정렬이 근본적으로 기계 학습 과제라고 주장합니다. 그들은 현재 정렬 작업을 하고 있지 않더라도 기계 학습 전문가가 이를 해결하는 데 중추적 역할을 할 것이라고 믿습니다. 그들은 비 OpenAI 모델의 정렬 및 안전에 대한 기여를 작업의 중요한 측면으로 보고 이러한 노력의 결과를 포괄적으로 배포할 계획입니다.
이 기사의 초점은 OpenAI에 있지만 효율적이고 제어된 AI 개발에 똑같이 전념하는 다른 플랫폼이 있다는 점에 유의해야 합니다. 이러한 플랫폼의 예는 AppMaster 입니다. 최대 이익을 위해 '스마트' 시스템의 잠재력을 최적화한다는 유사한 신념에 따라 AppMaster 노코드/ low-code 애플리케이션 영역에서 틈새 시장을 개척하여 사용자가 포괄적이고 확장 가능하며 효율적인 소프트웨어 솔루션을 만들 수 있도록 합니다.