Искусственный интеллект научили определять пол человека по написанному тексту
01.05.2018 в 19:21
824
0
Коллектив российских ученых разработал метод, который обучает компьютер распознавать пол человека по написанному им тексту с точностью до 80 процентов. Научная разработка ядерного университета МИФИ, Национального исследовательского центра "Курчатовский Институт" и Воронежского государственного университета относится к области компьютерной лингвистики, говорится в статье РИА Новости.
Научные исследования показывают, что в письменном тексте неизбежно отражаются характеристики его автора – пол, психологические особенности, уровень образования. На основе анализа речи можно диагностировать наличие у человека некоторых заболеваний (деменции, депрессии) и склонность к суицидальному поведению. Потребность в установлении характеристик автора текста также растет с развитием интернет-коммуникаций: компаниям важно знать, каким группам лиц нравятся их товары и услуги.
Коллектив специалистов проанализировал эффективность различных технологий машинного обучения с использованием нейронных сетей для анализа текстов.
В ходе исследования они сравнили точность решения задачи гендерной идентификации текстов на основе двух подходов к моделированию на основе данных: с одной стороны, алгоритмы машинного обучения, с другой стороны – нейронные сети глубокого обучения (сверточные нейронные сети и рекуррентные нейронные сети с долгой краткосрочной памятью).
"Мы достигли высоких результатов в определении пола автора текста благодаря продвинутым нейросетевым моделям, в условиях, когда автор не скрывает свой пол. На очереди задача определения пола в условиях его намеренного сокрытия", – говорит доцент НИЯУ МИФИ Александр Сбоев.
Отмечается, что в текстах, которые были размещены на сайте знакомств, нейросеть без труда находит подвох в десяти случаях из десяти, притом, что автор намеренно ставит в подписи имя противоположного пола.
Результаты этого исследования показали, что подход, основанный на использовании сверхточной нейронной сети и методов глубокого обучения для распознавания пола человека, написавшего текст, является наиболее оптимальным. Сейчас группа исследователей работает над задачей распознавания возраста.
Научные исследования показывают, что в письменном тексте неизбежно отражаются характеристики его автора – пол, психологические особенности, уровень образования. На основе анализа речи можно диагностировать наличие у человека некоторых заболеваний (деменции, депрессии) и склонность к суицидальному поведению. Потребность в установлении характеристик автора текста также растет с развитием интернет-коммуникаций: компаниям важно знать, каким группам лиц нравятся их товары и услуги.
Коллектив специалистов проанализировал эффективность различных технологий машинного обучения с использованием нейронных сетей для анализа текстов.
В ходе исследования они сравнили точность решения задачи гендерной идентификации текстов на основе двух подходов к моделированию на основе данных: с одной стороны, алгоритмы машинного обучения, с другой стороны – нейронные сети глубокого обучения (сверточные нейронные сети и рекуррентные нейронные сети с долгой краткосрочной памятью).
"Мы достигли высоких результатов в определении пола автора текста благодаря продвинутым нейросетевым моделям, в условиях, когда автор не скрывает свой пол. На очереди задача определения пола в условиях его намеренного сокрытия", – говорит доцент НИЯУ МИФИ Александр Сбоев.
Отмечается, что в текстах, которые были размещены на сайте знакомств, нейросеть без труда находит подвох в десяти случаях из десяти, притом, что автор намеренно ставит в подписи имя противоположного пола.
Результаты этого исследования показали, что подход, основанный на использовании сверхточной нейронной сети и методов глубокого обучения для распознавания пола человека, написавшего текст, является наиболее оптимальным. Сейчас группа исследователей работает над задачей распознавания возраста.
Сейчас читают
Комментарии (0) |
Войдите, чтобы оставить комментарий.