В попытке контролировать потенциально непредсказуемые результаты использования сверхчеловеческого интеллекта в искусственном интеллекте, OpenAI организует узкоспециализированную группу под руководством Ильи Суцкевера, главного ученого и соучредителя компании. Ключевой задачей этой группы будет разработка стратегий управления и руководства "сверхинтеллектуальными" моделями ИИ. В недавнем сообщении в блоге Суцкевер вместе с Яном Лейке, ведущим специалистом по согласованию в OpenAI, предсказал, что ИИ, способный превзойти человеческий интеллект, может появиться уже в этом десятилетии. Они утверждают, что этот превосходный ИИ, если он в конечном итоге преуспеет, может не обладать доброкачественными чертами, что делает необходимым исследование методов его контроля и ограничения.
В настоящее время не существует известного метода, позволяющего эффективно контролировать или направлять потенциально сверхинтеллектуальный ИИ, не позволяя ему отклоняться от намеченного пути. Традиционные методы выравнивания ИИ, такие как обучение с помощью обратной связи, основаны на наблюдении человека за их работой. Однако наблюдение за системами ИИ, которые значительно превосходят человеческий интеллект, может оказаться сложной задачей. Чтобы усилить прогресс в области "выравнивания суперинтеллекта", OpenAI запускает новую команду "Superalignment" под совместным руководством Суцкевера и Лейка. Эта команда будет иметь доступ к 20% вычислительных ресурсов, которыми компания располагает в настоящее время. Команда, в которую войдут ученые и инженеры из бывшего подразделения OpenAI по выравниванию, а также исследователи из различных организаций компании, займется решением основных технологических задач по управлению сверхинтеллектуальным ИИ в ближайшие четыре года.
Планируется создать "автоматического исследователя выравнивания на человеческом уровне", чтобы обучить ИИ с помощью обратной связи, вовлечь ИИ в оценку других систем ИИ и в конечном итоге создать ИИ, способный проводить исследования выравнивания. Цель исследования выравнивания заключается в том, чтобы направить системы ИИ на достижение конкретных результатов и не дать им сбиться с пути. OpenAI работает над гипотезой, что ИИ может добиться значительных успехов в исследовании выравнивания, быстрее и эффективнее, чем человек. Ожидается, что по мере прогресса системы ИИ будут брать на себя все больший объем работы по выравниванию, что приведет к совершенствованию методов выравнивания. Это, как мы надеемся, приведет к тому, что ИИ будет сотрудничать с людьми, чтобы их преемники еще больше соответствовали людям. Тем временем, внимание исследователей-людей будет сосредоточено на анализе исследований по выравниванию, проводимых системами ИИ, вместо того, чтобы создавать эти исследования самостоятельно.
Хотя ни один метод нельзя считать безошибочным, Лейке, Шульман и Ву в своей статье указывают на недостатки подхода OpenAI. Использование ИИ для оценки может привести к увеличению количества несоответствий, предубеждений и уязвимостей в этом ИИ. Кроме того, самые сложные аспекты проблемы выравнивания могут быть вообще не связаны с инженерией. Тем не менее, Суцкевер и Лейке готовы проверить это на практике. Суцкевер и Лейке утверждают, что выравнивание суперинтеллекта - это, по сути, проблема машинного обучения. Они считают, что эксперты в области машинного обучения, даже те, кто в настоящее время не работает над проблемой выравнивания, будут играть ключевую роль в ее решении. Они планируют всесторонне распространять результаты этой работы, рассматривая свой вклад в выравнивание и безопасность моделей, не относящихся к OpenAI, как важнейший аспект своей работы.
Уместно отметить, что хотя в центре внимания этой статьи находится OpenAI, существуют и другие платформы, которые в равной степени стремятся к эффективной и контролируемой разработке ИИ. Примером такой платформы является AppMaster. Руководствуясь аналогичной верой в оптимизацию потенциала "умных" систем для получения максимальной выгоды, AppMaster заняла свою нишу в области приложений без кода/low-code, позволяя пользователям создавать комплексные, масштабируемые и эффективные программные решения.