ChatGPT, Gemini или Claude: какая нейросеть реально пишет код лучше всех

Дмитрий Орлов Редактор lifestyle-раздела
Тест ИИ по кодингу: ChatGPT, Claude и Gemini в ...

Шедеврум

MaxДзенTelegram

Тест ИИ по кодингу: ChatGPT, Claude и Gemini в деле

Новые нейросети появляются с пугающей скоростью, и сегодня мы проверим три флагманские модели в программировании. ChatGPT 5.4, Claude Opus 4.6 и Gemini 3.1 Pro прошли через четыре задания от лёгкого до сложного, чтобы понять, кто реально рулит в кодинге.

Участники теста: кто есть кто

ChatGPT 5.4 — свежая версия OpenAI с контекстным окном в 1 млн токенов. Модель умеет искать информацию в интернете, анализировать скриншоты, пользоваться браузером, работать с API и инструментами через внешнее ПО. Отличается широкими базовыми возможностями, но дорого обходится в использовании.

Claude Opus 4.6 от Anthropic ориентирован на промышленное использование. Главная фишка — внутренняя карта рассуждений: модель заранее планирует шаги, верифицирует каждый этап, а контекстное окно в полтора миллиона токенов позволяет обрабатывать целые модули кода.

Gemini 3.1 Pro — топовая модель Google DeepMind для сложных задач. Технология глубокого мышления интегрирована прямо в ядро, контекстное окно 1 млн токенов, на выходе до 64 тыс. токенов. Модель оптимизирована для программирования и цепочек агентных задач, умеет анализировать несколько путей решения одновременно.

Условия тестирования

Мы не брали сверхсложные проекты на сотни файлов. Всего четыре задания — от лёгкого до сложного. Оценка от 1 до 5 баллов, где максимум получает только лучший вариант, остальные — 4. Критерии — функциональность и оформление.

Результаты теста

Итак, неожиданность: Claude Opus 4.6 стал лидером. Модель показала отличные результаты по всем четырем заданиям, при этом цена средняя и доступна. Она реально умеет мыслить шагами и обрабатывать большие куски кода без потери контекста.

Gemini 3.1 Pro — сильный игрок за небольшую цену. Мощное мышление, длинные контекстные окна и возможность генерации больших блоков кода делают ее отличным вариантом для цепочек задач и проектов средней сложности.

Самым слабым оказался ChatGPT 5.4. Хотя модель универсальна и умеет многое, результаты в тесте по программированию оказались ниже, а стоимость использования — самой высокой среди участников.

Что важнее: цена или производительность?

Claude Opus 4.6 доказал, что дорогая модель не всегда лучше. Gemini 3.1 Pro — компромисс между ценой и функционалом, который подойдет большинству задач. ChatGPT 5.4 — больше для тех, кто ценит универсальность и готов платить за бренд.

Итоги для разработчика

  1. Claude Opus 4.6 — лидер по результатам теста, хорошая логика и планирование, средняя цена.
  2. Gemini 3.1 Pro — отличная цена, высокая генерация кода, длинное контекстное окно, подходит для сложных цепочек задач.
  3. ChatGPT 5.4 — универсальная, но дорогая и менее эффективная в наших тестах.

Так что если вы хотите ИИ, который реально поможет с кодом и не разорит кошелек, советую присмотреться к Opus или Gemini. ChatGPT пока больше для фанатов бренда, чем для экономных программистов, пишет источник.

MaxДзенTelegramВКонтактеОдноклассники