
11.11.2025
Будни звукорежиссеров в эпоху ИИ
Фестиваль «ПитерКиТ» открылся мастер-классом Михаила Николаева и Тариэля Гасан-Заде «Искусственный интеллект — инструмент в работе звукорежиссёра». Полный зал студентов и преподавателей ГИКИТ разных специальностей активно слушал и участвовал в обсуждении, проявляя живой интерес к теме.
Михаил Николаев – выпускник ГИКИТ по специальности «Звукорежиссура» (мастерская В.Г. Динова, 1999 год), генеральный директор студии звукозаписи «Синемикс». В качестве звукорежиссера он работал с более чем сорока художественными фильмами, включая картины «Жмурки» (2005), «Мне не больно» (2006), «Груз 200» (2007) режиссера Андрея Балабанова.
Вместе с коллегами, звукорежиссерами Тариеэлем Гасан-Заде и Анастасией Чернышевой, в формате открытой дискуссии спикер затронул множество аспектов применения ИИ в работе.
«В звукорежиссуре есть три выразительных инструмента – речь, шумы и музыка. Во все эти компоненты искусственный интеллект уже проник», – подчеркнул Михаил Николаев.
Эксперты продемонстрировали успешные примеры применения новейших технологий во всех трех сферах.
Среди возможностей искусственного интеллекта — изменение музыки в кадре, включая разделение фонограммы на отдельные компоненты для последующей замены. По-прежнему востребована работа ИИ по обработке реплик: устранение шумов и повышение технического качества звука. Особенно актуально это при использовании живого звука в фильме.
Кроме того, с помощью ИИ можно полностью «переозвучить» актера: скопировать особенности речи и применить их для другого. В качестве наглядного примера спикер показал социальный ролик, в котором воспроизведен голос легендарного советского Шерлока Холмса – Василия Ливанова.
«Для достижения такого эффекта важно наличие правильного референса. В данном случае нам сильно помог известный петербургский артист Владимир Маслаков. Он просто виртуозно скопировал интонации любимых артистов. Нам оставалось только придать его голосу нужный тембр», – пояснил звукорежиссер.
Тариеэль Гасан-Заде в формате видеосвязи рассказал о тонкостях подготовки референсов. Главное требование к ним – хорошее качество звука и отсутствие длительных пауз дольше 2-3 секунд.
«Рекомендуемая длительность такого аудиофайла для обучения искусственного интеллекта - 20-30 минут. Также при подготовке необходимо учитывать эмоциональную окраску. В идеале в этом материале должна присутствовать целая гамма эмоций: от тихой беседы до крика», – пояснил спикер.
А звукорежиссер Анастасия Чернышева рассказала, как с помощью нейросетей с нуля написала музыку для сцены в сериале по заданным параметрам.
«Есть важный правовой аспект – если пользоваться бесплатной версией приложения для генерации музыки, материал нельзя будет использовать для коммерческих целей, поэтому музыку для фильмов лучше генерировать в платной версии», – подчеркнула выступающая.
При всем многообразии вариантов применения искусственного интеллекта в звукорежиссуре главным условием эффективности остаются чётко сформулированные промпты и качественные исходные материалы. Технологии берут на себя рутинные и технически сложные задачи — такие как очистка шумов или реставрация звука, — но финальное творческое решение, художественный замысел и чувство меры остаются за человеком.
ИИ лишь освобождает время и руки для подлинного творчества, помогая реализовывать идеи, которые ещё вчера казались фантастикой. Будущее не просто наступило — оно требует от новых поколений звукорежиссёров быть на шаг впереди своих цифровых помощников.





