Нейросети синтезируют голос советского диктора Юрия Левитана к его 110-летию

В России создадут голосовую модель советского диктора Юрия Левитана. Проектом займется компания «Наносемантика» по предложению правнука известного диктора Артура Левитана-Сударикова. Модель представят в 2024 году, к 110-летию со дня рождения народного артиста СССР.

В компании отметили, что ставят задачу увековечить голос диктора в цифровом формате. Ведь именно Левитан объявлял гражданам о важнейших событиях XX века, в том числе о начале Великой Отечественной войны и о победе в ней Советского Союза.

Для обучения модели будет использован архив записей голоса диктора из Госфильмофонда. Правнук также попросил открыть разработчикам доступ к аудиоматериалам, хранящимся в музее Левитана во Владимире.

«Наносемантика» уже занимается разработкой первой версии голосовой модели. Компания отмечает сложность задачи — ей нужно синтезировать узнаваемый тембр голоса с помощью аудиозаписей с разным уровнем качества. По словам главы «Наносемантики» Станислава Ашманова, сейчас команде удалось убрать 80% лишних дефектов. Однако в голосовую модель добавлены фоновые шумы, «чтобы записи звучали одинаково приятно, узнаваемо и при этом не теряли звучание той эпохи».

Голосовую модель, возможно, выложат в открытый доступ. Этот вариант обсуждается участниками проекта. Ее также могут интегрировать с генеративными технологиями. Известно, что голос Левитана будет доступен в приложении «Ударения». Релиз запланирован на 2024 год.


Источник: Sostav