• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

«Нейросети могут давать настолько же точные оценки, как и человек»

«Нейросети могут давать настолько же точные оценки, как и человек»

© Высшая школа экономики

Голосовые помощники стали частью обычной жизни. Они могут строить маршрут, включать музыку и фильмы, отвечать на вопросы. Качество речи голосовых ассистентов требует оценки. Для решения этой задачи студенты мастерской по прикладному искусственному интеллекту ИМШ НИУ ВШЭ и VK разработали нейросети, способные оценивать синтез речи.

Никита Шевцов

«Технологии Text-to-Speech превращают текст в речь. Это те самые голоса, которые мы слышим в навигаторах или аудиокнигах. Чтобы понять, насколько хорошо работает синтез, раньше требовалась ручная проверка: люди слушали записи и выставляли оценки. Мы решили автоматизировать этот процесс. Студентам мастерской предстояло создать систему, которая заменит субъективную оценку на нейросетевую модель. Ручная разметка не только дорогая и долгая, но и требует участия множества специалистов», — говорит Никита Шевцов, руководитель проекта мастерской по прикладному искусственному интеллекту ИМШ НИУ ВШЭ и VK.

Студенты мастерской ИМШ и VK использовали открытые англоязычные датасеты SOMOS, содержащие 20 100 аудиофрагментов, 200 TTS-систем, 987 асессоров и более 350 000 оценок.

На их основе были подготовлены и внедрены две метрики: MOS (Mean Opinion Score) — оценка одного аудиофайла от 1 до 5; SBS (Side-by-Side) — сравнение двух аудиофрагментов с выбором лучшего. Также были разработаны пять моделей: для MOS — MOSNet, MOSNetBert, WhisperBert; для SBS — NeuralSBS, NeuralSBSBert. Модели работают как в аудиоформате, так и в мультимодальном формате.

«Мы увидели, что нейросети могут давать настолько же точные оценки, как и человек. MOS-модели показали RMSE ≈ 0,4, что близко к человеческой погрешности 0,62. Модель NeuralSBS определяет лучшее аудио в 73% случаев — на уровне среднего субъективного слушателя. Это открывает путь к ускорению и удешевлению оценки качества TTS», — отметил Никита Шевцов.

Следующий этап — переобучение моделей на русском языке. Команда также рассматривает возможность интеграции оценочных моделей в пайплайны CI/CD, чтобы внедрить автоматическую проверку качества в производственные процессы генерации речи.

«Автоматическая оценка синтеза речи — это шаг к более надежным и масштабируемым TTS-системам. Мы собираемся сделать ее доступной для широкой разработки», — добавил Никита Шевцов.

Вам также может быть интересно:

ВШЭ и БГУ запускают совместную ИТ-программу при поддержке Правительства Бурятии

Высшая школа экономики подписала соглашения о сотрудничестве в сфере подготовки кадров в области искусственного интеллекта и информационных технологий с Правительством республики Бурятия и Бурятским государственным университетом имени Доржи Банзарова. Оба документа закладывают основу для реализации совместной образовательной программы по направлению «Прикладная математика и информатика», а также для системного развития сквозных цифровых компетенций студентов и преподавателей вузов республики (программирование, анализ данных, методы искусственного интеллекта).

«Планируем работать в русле Программы развития университета»

25 марта на заседании Ученого совета НИУ ВШЭ был рассмотрен отчет о реализации программы развития университета в 2025 году, представлена стратегия Высшей школы бизнеса НИУ ВШЭ на 2026-2030 годы, обсуждены возможности участия пермского кампуса в создании регионального кластера креативных индустрий.

Как правильно монетизировать научные разработки

Грамотная коммерциализация научных исследований, предполагающая их трансформацию в реальные разработки и новые продукты и получение дохода от интеллектуальной собственности, способствует трансферу передовых технологий в экономику и государственное управление, стимулирует творческую энергию ученых и укрепляет материальную базу научных лабораторий и университетов. Коммерциализация не ограничивается инженерными и ИТ-направлениями, она может быть результативной для исследований в разных науках, в том числе социальных и гуманитарных. Важно, чтобы университет сохранил роль одного из лидеров в коммерческом использовании научных результатов.

В Выcшей школе экономики запускается проектный майнор по робототехническим системам

Институт робототехнических систем НИУ ВШЭ совместно со стратегическим партнером — компанией ЭФКО — открывает новый майнор «Проектная мастерская робототехнических систем». Программа рассчитана на студентов всех образовательных направлений НИУ ВШЭ в Москве и предлагает уникальный практико-ориентированный подход к изучению направления робототехники и киберфизических систем путем последовательного создания аппаратно-программных продуктов.

Четвертый фестиваль робототехники состоится в НИУ ВШЭ

С 1 по 3 апреля в кампусе НИУ ВШЭ на Покровке пройдет IV Фестиваль робототехники — одно из ключевых событий факультета компьютерных наук Вышки для всех, кто увлечен робототехникой, программированием и инженерным творчеством. Фестиваль объединит соревнования по робототехнике, дискуссии, образовательные форматы и демонстрацию разработок.

Новая разработка ученых ВШЭ поможет быстрее и дешевле спроектировать надежную электронику

Российские ученые из МИЭМ ВШЭ разработали новый подход к моделированию электротепловых процессов в мощных электронных схемах на печатных платах. Они научились быстро и точно рассчитывать, как нагреваются электронные компоненты во время работы, чтобы заранее предотвращать их перегрев и поломку. Результаты работы опубликованы в журнале Russian Microelectronics.

«Вышка — место, где формируются научные школы»

11 февраля в НИУ ВШЭ состоялась церемония награждения победителей конкурса на лучшую научно‑исследовательскую работу студентов (НИРС) 2025 года. Всего в нем участвовала 2061 работа. По итогам экспертной оценки звания победителей и лауреатов получили 366 студентов по таким секциям, как социальные науки, экономико‑менеджериальные дисциплины, точные и гуманитарные науки, а также креативные индустрии.

В Вышке прошел масштабный фестиваль игровой индустрии — ГеймДевФест-2026

В Вышке прошел третий ГеймДевФест ФКН — фестиваль компьютерных игр, организованный департаментом программной инженерии и проектной группой «Программная инженерия компьютерных игр — ПИКИ» при участии игровой студии «Винторог». Гости могли сыграть во множество видеоигр, в том числе демоверсии игр студентов ФКН и других начинающих гейм-дизайнеров.

В ВШЭ создан департамент кибербезопасности

В Московском институте электроники и математики им. А.Н. Тихонова ВШЭ открылось новое подразделение. Среди его задач — объединение образовательных, научных и экспертных ресурсов МИЭМ в области информационной и компьютерной безопасности, расширение портфеля образовательных программ, укрепление партнерства с лидерами индустрии и позиций ВШЭ как ведущего центра компетенций в области кибербезопасности.

Серьезный вызов: студенты Вышки исследуют глобальные технологические тренды и стартапы

В НИУ ВШЭ подвели промежуточные итоги совместного исследовательского проекта с компанией ЭФКО: студенты представили результаты исследований и рассказали о дальнейших планах. Проект ориентирован на вовлечение студентов в прикладные исследования по трем крупным направлениям: анализ глобальных технологических стартапов, изучение культурного кода и созидательного потенциала общества, а также прогнозирование социально-экономического развития России.