Уличили в жульничестве: 14% научных публикаций имеют признаки использования ИИ

Фото с сайта pxhere.com
Тщательный разбор научных публикаций показал, что приблизительно каждая седьмая краткая выжимка из биомедицинских исследований, увидевших свет в 2024 году, была сгенерирована с использованием искусственных нейросетей. Из полутора миллионов аннотаций, занесённых в базу данных PubMed, свыше двухсот тысяч имели характерные для ИИ лингвистические конструкции, такие как "увеличивать", "сдерживать" и "не имеющий аналогов". Результаты этого анализа опубликованы в журнале Science Advances.
Обширные лингвистические модели (ОЯМ), построенные на основе колоссальных объемов данных текста, способны понимать, порождать и обрабатывать информацию на естественных языках, применяемых людьми в коммуникации. Самой известной ОЯМ является ChatGPT, в России также активно разрабатываются собственные аналоги, такие как GigaChat и YandexGPT. Эти нейросети все шире применяются в научной деятельности, и общий объём научных работ, в создании которых они участвовали, неуклонно растет.
С целью оценки распространенности текстов, созданных искусственным интеллектом, исследователи изучили 1,5 миллиона аннотаций, выявляя "избыточные" термины, частота употребления которых резко возросла после ноября 2022 года, когда ChatGPT стал доступен широкой публике. Было установлено, что 454 слова начали встречаться значительно чаще, чем в предыдущие годы, начиная с 2010 года. Среди них были как общеупотребительные выражения, такие как "полученные результаты", "ключевой" и "вероятный", так и более редкие, к примеру, "углубляется" и "демонстрация". Также были идентифицированы избыточные слова, такие как "усиливать", "препятствовать", "непревзойдённый" и "бесценный".
В отдельных регионах, например в Китае и Южной Корее, применение нейросетей особенно выражено: признаки использования ИИ были обнаружены примерно в каждой пятой аннотации статей, посвящённых биоинформатике.
Ученые акцентируют внимание на том, что изменения в научной терминологии являются закономерным процессом, особенно в связи с глобальными событиями, такими как пандемия COVID-19. Однако, с появлением ChatGPT эти изменения произошли чересчур стремительно, что вызывает определенные опасения.
Вместе с тем, исследователи отмечают, что к концу 2024 года некоторые характерные для ИИ слова и фразы стали использоваться реже, например, "углубляется". Это может быть обусловлено появлением инструментов, способных распознавать применение нейросетей в текстах на основе подобных слов.
Кроме того, ученые подчеркивают, что имеющиеся исследования, включая данное, не позволяют установить, каким конкретно образом ИИ использовался при создании научных статей. Возможно, авторы прибегали к помощи нейросетей для редактуры текста, повышения его читабельности, помощи в переводе, или же создавали значительные фрагменты текста, не контролируя действия ИИ, сообщает InScience News.
Обратите внимание: Такого июля на нашей памяти еще не было - глава Гидрометцентра заявил о крайне аномальной погоде
Источник: samaraonline24.ru
Читайте в Дзен