ИИ создал новый метод обучения и обошёл человеческие алгоритмы

freepik.com
Исследователи Google DeepMind сообщили, что их система самостоятельно разработала метод обучения DiscoRL, который показал лучшие результаты, чем алгоритмы, созданные людьми. Работа опубликована в журнале Nature.
Традиционно системы обучения с подкреплением проектируют люди: агент учится методом проб и ошибок, получая награды за успешные действия. Этот процесс трудоёмок и зависит от человеческой интуиции. В новой работе учёные переложили проектирование на сам ИИ.
Команда сформировала большую цифровую популяцию ИИ‑агентов, решавших множество задач. За их работой наблюдала «мета‑нейросеть» — родительская система, которая анализировала действия, корректировала правила и настраивала обучение так, чтобы следующее поколение училось быстрее и эффективнее. Так были выработаны новые правила DiscoRL.
После этого на DiscoRL обучили нового агента и сравнили его результаты с лучшими человеческими алгоритмами. Агент на DiscoRL превзошёл конкурентов в тестах, описанных в Nature.
Читайте также:
- “Не выбирай жену, с которой можно жить”: мудрый Омар Хайям раскрыл как распознать настоящую любовь ещё 1000 лет назад
- Получается в разы дешевле, чем в кассе: Покупаю так билеты на поезд уже несколько лет
- "Предстоящая зима будет безумной": синоптики сделали новый прогноз на декабрь, январь и февраль
- Что изменится с ноября: надбавки пенсионерам, лимит SIM-карт и взыскание долгов
- Бройлеры без мифов: что вы на самом деле покупаете и насколько это безопасно
Сообщает info.sibnet.ru
Источник:
samaraonline24.ru
Читайте в
Дзен


