«Нейросети могут давать настолько же точные оценки, как и человек»

Голосовые помощники стали частью обычной жизни. Они могут строить маршрут, включать музыку и фильмы, отвечать на вопросы. Качество речи голосовых ассистентов требует оценки. Для решения этой задачи студенты мастерской по прикладному искусственному интеллекту ИМШ НИУ ВШЭ и VK разработали нейросети, способные оценивать синтез речи.
Никита Шевцов
«Технологии Text-to-Speech превращают текст в речь. Это те самые голоса, которые мы слышим в навигаторах или аудиокнигах. Чтобы понять, насколько хорошо работает синтез, раньше требовалась ручная проверка: люди слушали записи и выставляли оценки. Мы решили автоматизировать этот процесс. Студентам мастерской предстояло создать систему, которая заменит субъективную оценку на нейросетевую модель. Ручная разметка не только дорогая и долгая, но и требует участия множества специалистов», — говорит Никита Шевцов, руководитель проекта мастерской по прикладному искусственному интеллекту ИМШ НИУ ВШЭ и VK.
Студенты мастерской ИМШ и VK использовали открытые англоязычные датасеты SOMOS, содержащие 20 100 аудиофрагментов, 200 TTS-систем, 987 асессоров и более 350 000 оценок.
На их основе были подготовлены и внедрены две метрики: MOS (Mean Opinion Score) — оценка одного аудиофайла от 1 до 5; SBS (Side-by-Side) — сравнение двух аудиофрагментов с выбором лучшего. Также были разработаны пять моделей: для MOS — MOSNet, MOSNetBert, WhisperBert; для SBS — NeuralSBS, NeuralSBSBert. Модели работают как в аудиоформате, так и в мультимодальном формате.
«Мы увидели, что нейросети могут давать настолько же точные оценки, как и человек. MOS-модели показали RMSE ≈ 0,4, что близко к человеческой погрешности 0,62. Модель NeuralSBS определяет лучшее аудио в 73% случаев — на уровне среднего субъективного слушателя. Это открывает путь к ускорению и удешевлению оценки качества TTS», — отметил Никита Шевцов.
Следующий этап — переобучение моделей на русском языке. Команда также рассматривает возможность интеграции оценочных моделей в пайплайны CI/CD, чтобы внедрить автоматическую проверку качества в производственные процессы генерации речи.
«Автоматическая оценка синтеза речи — это шаг к более надежным и масштабируемым TTS-системам. Мы собираемся сделать ее доступной для широкой разработки», — добавил Никита Шевцов.
Вам также может быть интересно:
ВШЭ и БГУ запускают совместную ИТ-программу при поддержке Правительства Бурятии
Высшая школа экономики подписала соглашения о сотрудничестве в сфере подготовки кадров в области искусственного интеллекта и информационных технологий с Правительством республики Бурятия и Бурятским государственным университетом имени Доржи Банзарова. Оба документа закладывают основу для реализации совместной образовательной программы по направлению «Прикладная математика и информатика», а также для системного развития сквозных цифровых компетенций студентов и преподавателей вузов республики (программирование, анализ данных, методы искусственного интеллекта).
«Планируем работать в русле Программы развития университета»
25 марта на заседании Ученого совета НИУ ВШЭ был рассмотрен отчет о реализации программы развития университета в 2025 году, представлена стратегия Высшей школы бизнеса НИУ ВШЭ на 2026-2030 годы, обсуждены возможности участия пермского кампуса в создании регионального кластера креативных индустрий.
Как правильно монетизировать научные разработки
Грамотная коммерциализация научных исследований, предполагающая их трансформацию в реальные разработки и новые продукты и получение дохода от интеллектуальной собственности, способствует трансферу передовых технологий в экономику и государственное управление, стимулирует творческую энергию ученых и укрепляет материальную базу научных лабораторий и университетов. Коммерциализация не ограничивается инженерными и ИТ-направлениями, она может быть результативной для исследований в разных науках, в том числе социальных и гуманитарных. Важно, чтобы университет сохранил роль одного из лидеров в коммерческом использовании научных результатов.
В Выcшей школе экономики запускается проектный майнор по робототехническим системам
Институт робототехнических систем НИУ ВШЭ совместно со стратегическим партнером — компанией ЭФКО — открывает новый майнор «Проектная мастерская робототехнических систем». Программа рассчитана на студентов всех образовательных направлений НИУ ВШЭ в Москве и предлагает уникальный практико-ориентированный подход к изучению направления робототехники и киберфизических систем путем последовательного создания аппаратно-программных продуктов.
Четвертый фестиваль робототехники состоится в НИУ ВШЭ
С 1 по 3 апреля в кампусе НИУ ВШЭ на Покровке пройдет IV Фестиваль робототехники — одно из ключевых событий факультета компьютерных наук Вышки для всех, кто увлечен робототехникой, программированием и инженерным творчеством. Фестиваль объединит соревнования по робототехнике, дискуссии, образовательные форматы и демонстрацию разработок.
Новая разработка ученых ВШЭ поможет быстрее и дешевле спроектировать надежную электронику
Российские ученые из МИЭМ ВШЭ разработали новый подход к моделированию электротепловых процессов в мощных электронных схемах на печатных платах. Они научились быстро и точно рассчитывать, как нагреваются электронные компоненты во время работы, чтобы заранее предотвращать их перегрев и поломку. Результаты работы опубликованы в журнале Russian Microelectronics.
«Вышка — место, где формируются научные школы»
11 февраля в НИУ ВШЭ состоялась церемония награждения победителей конкурса на лучшую научно‑исследовательскую работу студентов (НИРС) 2025 года. Всего в нем участвовала 2061 работа. По итогам экспертной оценки звания победителей и лауреатов получили 366 студентов по таким секциям, как социальные науки, экономико‑менеджериальные дисциплины, точные и гуманитарные науки, а также креативные индустрии.
В Вышке прошел масштабный фестиваль игровой индустрии — ГеймДевФест-2026
В Вышке прошел третий ГеймДевФест ФКН — фестиваль компьютерных игр, организованный департаментом программной инженерии и проектной группой «Программная инженерия компьютерных игр — ПИКИ» при участии игровой студии «Винторог». Гости могли сыграть во множество видеоигр, в том числе демоверсии игр студентов ФКН и других начинающих гейм-дизайнеров.
В ВШЭ создан департамент кибербезопасности
В Московском институте электроники и математики им. А.Н. Тихонова ВШЭ открылось новое подразделение. Среди его задач — объединение образовательных, научных и экспертных ресурсов МИЭМ в области информационной и компьютерной безопасности, расширение портфеля образовательных программ, укрепление партнерства с лидерами индустрии и позиций ВШЭ как ведущего центра компетенций в области кибербезопасности.
Серьезный вызов: студенты Вышки исследуют глобальные технологические тренды и стартапы
В НИУ ВШЭ подвели промежуточные итоги совместного исследовательского проекта с компанией ЭФКО: студенты представили результаты исследований и рассказали о дальнейших планах. Проект ориентирован на вовлечение студентов в прикладные исследования по трем крупным направлениям: анализ глобальных технологических стартапов, изучение культурного кода и созидательного потенциала общества, а также прогнозирование социально-экономического развития России.


