Ученые РФ научили компьютер распознавать пол человека по тексту

Учёные НИЯУ МИФИ, Курчатовского института и ВГУ...

magnific.com

MaxДзенTelegram

Российские ученые создали систему распознавания пола автора по тексту

Специалисты НИЯУ «МИФИ», Национального исследовательского центра «Курчатовский институт» и Воронежского государственного университета представили метод, позволяющий компьютеру определять пол автора по написанному тексту. Точность технологии достигает 80%. Об исследовании, выполненном при поддержке гранта Российского научного фонда, сообщает РИА Новости. Научные результаты опубликованы в журнале Procedia Computer Science.

Как текст помогает определить автора

Исследователи отмечают, что письменная речь нередко отражает особенности человека: пол, уровень образования, психологические характеристики и даже особенности поведения. Именно поэтому анализ текста давно используется кадровыми подразделениями крупных компаний и службами безопасности.

Кроме того, языковые особенности могут указывать на отдельные состояния здоровья. По речи специалисты способны выявлять признаки депрессии, деменции и склонности к суицидальному поведению. С развитием цифровой коммуникации интерес к таким технологиям только усиливается, поскольку бизнес стремится лучше понимать аудиторию своих товаров и услуг.

Какие технологии сравнили ученые

Коллектив исследователей протестировал несколько подходов машинного обучения для анализа текстов. В эксперименте сравнивались классические алгоритмы, включая метод опорных векторов и градиентный бустинг, а также технологии глубокого обучения — сверточные и рекуррентные нейронные сети с долгой краткосрочной памятью.

Доцент НИЯУ «МИФИ» Александр Сбоев сообщил, что наиболее высокие результаты показали продвинутые нейросетевые модели. По его словам, сейчас специалисты работают над задачей определения пола автора даже в случаях, когда человек сознательно пытается скрыть свою гендерную принадлежность.

Над чем работают дальше

Исследование показало, что наиболее эффективным оказался подход на основе сверточных нейронных сетей. Сейчас научная группа продолжает исследования и занимается разработкой методов распознавания возраста автора текста.

Больше новостей и эксклюзивных видео смотрите в канале Самара Онлайн 24 в MAX.

MaxДзенTelegramВКонтактеОдноклассники