Я слышу вас насквозь: разработка ученых СГТУ способна распознать эмоции по голосу

IMG_2456Специалисты кафедры «Информационная безопасность автоматизированных систем» Саратовского технического госуниверситета создали программу, которая может распознать психоэмоциональное состояние человека по речи. Для этого достаточно речевого сигнала длинной 10 секунд. Десктопное приложение анализирует физические характеристики речи как по записи, так и в режиме on-line, сравнивает контрольные показатели речи с параметрами в своей базе данных и на основе этого анализа выносит заключение. Сейчас в программу внесено 20 психотипов, которые оцениваются по 6 показателям. Учитываются такие особенности, как темп речи, ее мелодика, громкость, интонации, паузы и модуляция голоса. Смысловое значение слов при этом не оценивается, предметом анализа являются только звуковые особенности. Разработал программу магистрант направления «Информатика и вычислительная техника» Александр Захаров под руководством профессора кафедры информационной безопасности Инны Пластун. Данными о характере речи, с которыми работает программа, поделились со специалистам СГТУ ученые Саратовского медицинского университета — завкафедрой русского и латинского языков Лариса Прокофьева и доцент кафедры психиатрии Наталья Филипова. Расчеты базируются на сферической модели эмоций, разработанной учеными МГУ. Саратовские медики и филологи составили таблицу с речевыми показателями, характерными для конкретных психических состояний человека, например, астении, депрессии, агрессии, мании. А сферическая модель позволяет выявить в речи преобладающую эмоцию — радость, тревогу, задумчивость, напряжение говорящего или наоборот — апатию.
Как рассказал разработчик Александр Захаров, работа над программой шла более полутора лет. За это время был создан программный код и протестирована эффективность приложения, в том числе на примере записей, предоставленных специалистами медуниверситета.
- В перспективе необходимо дальнейшее тестирование приложения вместе с профессиональными психологами и специалистами по фонологической экспертизе, которые будут давать заключения, а оператор сможет сравнить их с данными программы. Такие испытания планируется провести в январе-марте 2019 года, - пояснил молодой ученый. Актуальность новой разработки особо отметил глава СГТУ Олег Афонин.
- Используя в дальнейшем программу Александра Захарова в тестировании студентов, например, можно будет предотвратить ситуации, подобные недавнему керченскому происшествию, - уверен он.
Следующим шагом, как пояснила профессор Инна Пластун, будет сертификация приложения. Вся информация, получаемая в результате анализа речи, попадают под действие федерального закона «О персональных данных», в общем доступе такие сведения, как и медицинские диагнозы, находиться не могут. По мнению специалиста, у разработки может быть очень большое будущее.
- Эти сведения помогут существенно повысить безопасность, если использовать разработанное приложение при приеме на работу сотрудника на ответственную должность, например, пилота, авиадиспетчера, оператора оборудования на атомной станции, сотрудника полиции, или при возникновении различных спорных и конфликтных ситуаций, требующих разрешения, - отметила профессор.
Сейчас погрешность выявления эмоционального состояния человека при использовании новой разработки составляет 5-10%. Дальнейшие испытания, которые будут проводить с участием специалистов по фонологической и психиатрической экспертизе, должны скорректировать этот показатель. Приложение будет совершенствоваться за счет уточнения характеристик речи и расширения базы знаний.