ИИ создал новый метод обучения и обошёл человеческие алгоритмы

Анастасия Максименко Редактор ленты новостей

Исследователи Google DeepMind сообщили, что их система самостоятельно разработала метод обучения DiscoRL, который показал лучшие результаты, чем алгоритмы, созданные людьми. Работа опубликована в журнале Nature.

Традиционно системы обучения с подкреплением проектируют люди: агент учится методом проб и ошибок, получая награды за успешные действия. Этот процесс трудоёмок и зависит от человеческой интуиции. В новой работе учёные переложили проектирование на сам ИИ.

Команда сформировала большую цифровую популяцию ИИ‑агентов, решавших множество задач. За их работой наблюдала «мета‑нейросеть» — родительская система, которая анализировала действия, корректировала правила и настраивала обучение так, чтобы следующее поколение училось быстрее и эффективнее. Так были выработаны новые правила DiscoRL.

После этого на DiscoRL обучили нового агента и сравнили его результаты с лучшими человеческими алгоритмами. Агент на DiscoRL превзошёл конкурентов в тестах, описанных в Nature.

Читайте также:

Сообщает info.sibnet.ru

Источник: samaraonline24.ru

Читайте в Дзен