Ученые РФ научили компьютер распознавать пол человека по тексту

magnific.com
Российские ученые создали систему распознавания пола автора по тексту
Специалисты НИЯУ «МИФИ», Национального исследовательского центра «Курчатовский институт» и Воронежского государственного университета представили метод, позволяющий компьютеру определять пол автора по написанному тексту. Точность технологии достигает 80%. Об исследовании, выполненном при поддержке гранта Российского научного фонда, сообщает РИА Новости. Научные результаты опубликованы в журнале Procedia Computer Science.
Как текст помогает определить автора
Исследователи отмечают, что письменная речь нередко отражает особенности человека: пол, уровень образования, психологические характеристики и даже особенности поведения. Именно поэтому анализ текста давно используется кадровыми подразделениями крупных компаний и службами безопасности.
Кроме того, языковые особенности могут указывать на отдельные состояния здоровья. По речи специалисты способны выявлять признаки депрессии, деменции и склонности к суицидальному поведению. С развитием цифровой коммуникации интерес к таким технологиям только усиливается, поскольку бизнес стремится лучше понимать аудиторию своих товаров и услуг.
Какие технологии сравнили ученые
Коллектив исследователей протестировал несколько подходов машинного обучения для анализа текстов. В эксперименте сравнивались классические алгоритмы, включая метод опорных векторов и градиентный бустинг, а также технологии глубокого обучения — сверточные и рекуррентные нейронные сети с долгой краткосрочной памятью.
Доцент НИЯУ «МИФИ» Александр Сбоев сообщил, что наиболее высокие результаты показали продвинутые нейросетевые модели. По его словам, сейчас специалисты работают над задачей определения пола автора даже в случаях, когда человек сознательно пытается скрыть свою гендерную принадлежность.
Над чем работают дальше
Исследование показало, что наиболее эффективным оказался подход на основе сверточных нейронных сетей. Сейчас научная группа продолжает исследования и занимается разработкой методов распознавания возраста автора текста.
Больше новостей и эксклюзивных видео смотрите в канале Самара Онлайн 24 в MAX.



