Свежий курс Практикума PRO: освойте цельный стек обработки аудиоданных

2 мин
Свежий курс Практикума PRO: освойте цельный стек обработки аудиоданных

Речевые технологии лежат в основе целого класса продуктов: от голосовых ассистентов и расшифровщиков аудио до сервисов озвучки контента. На курсе «Аудиоанализ, распознавание и генерация речи» от Яндекс Практикума PRO освоите инженерную базу для работы с ними — создадите собственный служба и научитесь обучать и дообучать речевые модели под конкретные задачи. 

Курс подойдёт инженерам машинного обучения и тем, кто уже знаком с обработкой естественного языка (NLP).

Что освоите 

  • Работу со звуком. Научитесь превращать аудиосигнал в числовые представления — спектрограммы и частотные признаки — и строить на их основе классификаторы.

  • Распознавание речи. Пройдёте путь от классических архитектур до современных трансформерных моделей — Whisper и других. Научитесь настраивать декодирование и оценивать качество.

  • Дообучение под свои задачи. Разберётесь, как адаптировать большие речевые модели — HuBERT и другие — под определённый адрес сайта и информация.

  • Синтез речи. Соберёте конвейер для обработки аудио. Поработаете с акустической моделью FastSpeech и нейросетевым вокодером HiFi-GAN, научитесь управлять характеристиками голоса.

  • Оптимизацию и выполнение модели на новых данных (инференс). Экспортируете всё в компактный формат ONNX, ускорите работу на видеокарте и соберёте готовый служба.

Два уровня погружения — под разные цели

  • Базовый тариф рассчитан на три месяца — освоите стек для обработки аудиоданных, положите четыре проекта в портфолио. Поможет разобраться в технологии и забрать навыки в работу.

  • Расширенный тариф длится пять месяцев — добавите восемь проектов и глубоко изучите обработку естественного языка (NLP): языковые модели, работу с текстом и интеграцию с речевыми системами. Поможет сменить специализацию и закрепиться в роли. 

Как устроено обучение

Нагрузка — приблизительно 10 часов в неделю, учёба разбита на спринты. В каждом есть теория и работа над проектами на облачных машинах с графическими процессорами (GPU). 

Учиться можно в любое время, главное — успевать к срокам сдачи, чтобы получить обратную связь от опытных инженеров. Если поймёте, что нужен свой темп, — можно перейти на трек без дедлайнов. 

Ближайший старт — 27 августа и 24 сентября. А бесплатный первый компонент можно пройти уже сейчас — освежите базу по нейросетям и посмотрите, как устроена платформа, прежде чем нырять в основное обучение.

Читают сейчас

Google планирует выключить все блокировщики рекламы с версии Chrome 150

22 минуты назад

Google планирует выключить все блокировщики рекламы с версии Chrome 150

Google хочет выключить вообще все блокировщики реклам в браузере Chrome с версии 150 (его выпуск запланирован на конец июня 2026 года, Chrome 149 вышел в начале июня). Так в Google решили бороться с A

52 минуты назад

R-Vision SIEM и R-Vision SOAR на Standoff 17: «синие» получат дополнительные инструменты для мониторинга и реагирования

R-Vision, российский разработчик систем цифровизации и кибербезопасности, выступит технологическим партнером кибербитвы Standoff 17, которая пройдет с 16 по 19 июня в Москве в Кибердоме. Команды защит

53 минуты назад

ТГУ тестирует NGFW от InfoWatch ARMA для защиты критической инфраструктуры

Привет! Хотим поделиться новостью о нашем сотрудничестве с Томским государственным университетом — мы (InfoWatch ARMA) запустили вместе с ним пилот по внедрению файрволла нового поколения InfoWatch AR

Китай передал российским учёным часть образцов грунта, собранных на обратной стороне Луны миссией «Чанъэ-6»

1 час назад

Китай передал российским учёным часть образцов грунта, собранных на обратной стороне Луны миссией «Чанъэ-6»

Китай передал России часть образцов грунта, в начальный раз в истории собранного на обратной стороне Луны во время миссии «Чанъэ-6». Приблизительно 1,5 г лунного грунта передали в Отдел физики планет

Stack Overflow запустила отдельную платформу для AI-агентов

1 час назад

Stack Overflow запустила отдельную платформу для AI-агентов

Разработчики Stack Overflow представили платформу для обмена техническими знаниями между AI-агентами. Подход призвано дать нейросетям доступ к проверенным и рабочим решениям, чтобы делать меньше ошибо