Искусственный интеллект впервые научился улучшать свои способности, переписывая собственный код.
Представьте ИИ, который не просто обучается, а сам изменяет свой код, чтобы становиться умнее. Именно так работает Darwin Gödel Machine (DGM), созданный командой Sakana AI и лаборатории Джеффа Клуна.
Они воплотили идею Юргена Шмидхубер, предложенную в 2003 году. Шмидхубер описал гипотетическую «машину Гёделя», которая может решать задачи, рекурсивно изменяя свой код, если математически доказано, что это улучшит результат. Однако на практике доказать пользу каждой правки оказалось слишком сложно.
Исследователи DGM пошли другим путём. Вместо формальных доказательств они используют эксперимент. Агент вносит изменения в себя, а затем проверяет их эффективность на бенчмарке. Это похоже на естественный отбор в природе: мутация оценивается не теоретически, а на практике. Такой подход ближе к реальности и открывает путь к автоматическому улучшению ИИ-систем.
Как работает Darwin Gödel Machine (DGM)
DGM — это умный ИИ, который может сам улучшать свой код, чтобы работать лучше. Он написан на Python и использует большую языковую модель, похожую на GPT-4. Процесс улучшения состоит из трёх шагов:
1. Изменение кода (Self-modify): ИИ смотрит на свой код и делает изменения, например, добавляет новую библиотеку или меняет логику программы.
2. Оценка качества (Evaluate): После изменений ИИ решает задачи из набора тестов (бенчмарка) с новым кодом. Он смотрит, насколько лучше стал результат.
3. Эволюционный отбор (Archive & selection): Новая версия ИИ сравнивается с предыдущими. Если она работает лучше, её сохраняют вместе с прошлыми версиями. При этом старые версии не удаляются, а остаются в архиве. Это позволяет системе пробовать разные подходы и находить нестандартные решения, избегая тупиков.
За десятки попыток DGM значительно прокачал свои навыки в программировании. Тестировали его на двух задачах: исправление ошибок на GitHub (SWE-bench) и решение задач на разных языках программирования (Polyglot). Результаты просто офигенные:
* На SWE-bench доля решённых задач поднялась с 20% до 50%.
* На Polyglot — с 14% до 30%.
Последняя версия DGM сравнялась с лучшим открытым решением на SWE-bench и обошла помощника-программиста Aider на Polyglot. Если бы ИИ не мог улучшать себя, он бы быстро упёрся в потолок и не показал таких результатов. Это доказывает, что для долгосрочного успеха важны два вещи: способность ИИ изменять свой код и разнообразие подходов.
Новость о DGM вызвала широкий резонанс среди учёных и программистов. Эксперты считают это важным шагом к созданию автономных систем. В Reddit DGM назвали «практическим шагом к открытой, саморазвивающейся системе ИИ». Однако есть и скептики. В Hacker News обсуждают ограниченность современных моделей и возможность выхода ИИ на новый уровень.
Авторы DGM подчёркивают, что система работает в изолированной среде и под контролем человека. Но возникает вопрос: что будет, если убрать «предохранители» и позволить ИИ бесконтрольно изменять себя?
Пока DGM улучшала только навыки программирования, но в будущем такой алгоритм может оптимизировать и другие аспекты, что теоретически таит риски.
DGM выгодно отличается от предыдущих попыток. Например, авто-GPT-агенты, популярные в 2023 году, не умели изменять свой код и работали по заданному сценарию. В отличие от них, DGM переписывает себя и накапливает новый опыт.
Другой пример — агент Voyager для Minecraft. Нейросеть GPT-4 помогала персонажу осваивать новые навыки, но базовый алгоритм оставался прежним. DGM же изменяет сам код, стоящей за агентом.
Классические методы, такие как AutoML и эволюционные алгоритмы, оптимизируют модели на этапе обучения. DGM же показывает, что ИИ может улучшать себя уже во время работы над задачей. Это новая веха в области ИИ и мы ещё ближе становимся к "научно-технологическому взрыву цивилизации" — пока фантастическая технологическая сингулярность.