ИИ создал новый метод обучения и обошёл человеческие алгоритмы

Система самостоятельно разработала метод обучен...

freepik.com

Исследователи Google DeepMind сообщили, что их система самостоятельно разработала метод обучения DiscoRL, который показал лучшие результаты, чем алгоритмы, созданные людьми. Работа опубликована в журнале Nature.

Традиционно системы обучения с подкреплением проектируют люди: агент учится методом проб и ошибок, получая награды за успешные действия. Этот процесс трудоёмок и зависит от человеческой интуиции. В новой работе учёные переложили проектирование на сам ИИ.

Команда сформировала большую цифровую популяцию ИИ‑агентов, решавших множество задач. За их работой наблюдала «мета‑нейросеть» — родительская система, которая анализировала действия, корректировала правила и настраивала обучение так, чтобы следующее поколение училось быстрее и эффективнее. Так были выработаны новые правила DiscoRL.

После этого на DiscoRL обучили нового агента и сравнили его результаты с лучшими человеческими алгоритмами. Агент на DiscoRL превзошёл конкурентов в тестах, описанных в Nature.

Читайте также:

Сообщает info.sibnet.ru

Источник: samaraonline24.ru

Читайте в Дзен