OpenAI обновила Chat GPT: теперь ИИ-агент сам управляет компьютером

Фото с сайта pxhere.com
Компания OpenAI существенно модернизировала свой флагманский продукт платформу ChatGPT. Теперь чат-бот способен не только предоставлять ответы, но и автономно решать сложные, многоэтапные задачи, используя свой личный виртуальный компьютер и набор специализированных инструментов. Это превращает его из обычного собеседника в полноценного цифрового ассистента.
Прежде ChatGPT мог осуществлять поиск информации, но не мог использовать ее для решения практических задач, например, для планирования поездки или анализа данных с последующим созданием презентации. Обновленный режим агента объединяет функциональность взаимодействия с веб-сайтами, углубленный анализ информации и диалоговый интеллект в единой, комплексной системе.
ChatGPT легко переключается между различными инструментами: визуальным браузером, текстовым браузером, терминалом и программным интерфейсом (API). К примеру, он может анализировать конкурентов, собирать данные и представлять их в формате слайд-шоу, готового к редактированию. При этом пользователь сохраняет полный контроль и должен подтверждать важные действия, такие как совершение платежей.
Это представляет собой значительный шаг в направлении монетизации ChatGPT. Расширенные возможности доступны подписчикам платных тарифных планов Pro, Plus и Team. Это значительно повышает ценность подписки, предлагая автоматизацию рутинных профессиональных и личных задач. OpenAI демонстрирует впечатляющие показатели производительности: в тесте SpreadsheetBench агент показал результат 45.5%, в то время как Copilot в Excel достиг 20%, а в BrowseComp установил новый рекорд 68.9%.
Однако, новые возможности несут и новые угрозы, особенно в сфере безопасности. OpenAI уделила особое внимание защите от «атак через промпты», когда злоумышленники могут попытаться изменить поведение агента через скрытые инструкции, внедренные на веб-страницы. Для минимизации этих рисков реализованы многоуровневые меры безопасности, включая обязательное подтверждение пользователем критически важных действий и отказ от выполнения задач с повышенным уровнем риска, таких как банковские транзакции, сообщает Инк.