Как сделать шепот из голоса

Добавил пользователь Алексей Ф.
Обновлено: 31.08.2024

Люди чавкают, хрустят и шепчут в микрофон, а остальным это нравится. Как ASMR-видео набрали феноменальную популярность на YouTube

ASMR-видео ворвались в интернет-пространство почти 10 лет назад, завоевав тысячи поклонников со всего света. В отличие от остальных мимолетных трендов, ASMR прочно закрепил свои позиции: ежедневно на YouTube появляется порядка 500 новых роликов. Чем же ASMR так привлекателен? Есть ли в нем сексуальный подтекст? И как относиться к детским ASMR-видео? Давайте разбираться.

Приятные покалывания и мурашки

2010 год. На Facebook появляется сообщество под названием Autonomous Sensory Meridian Response Group, где люди обсуждают странные ощущения, которые возникают у них от определенных звуков. У каждого свои триггеры: кого-то привлекает хруст картофельных чипсов, других успокаивает женский шепот, третьи в восторге от треска костра.

Вот только ощущения у всех похожи: приятные покалывания в затылке, необычные вибрации в голове, мурашки по телу и расслабленность. Как только интернет заговорил об этом публично, на YouTube стали появляться ASMR-видео.

В одном из первых роликов девушка разговаривает шепотом, одновременно листая журнал. Больше ничего не происходит, но это именно то, что было нужно новоиспеченному ASMR-сообществу. Так началась эпоха ASMR-видео.

ASMR (англ. Autonomous sensory meridian response) — автономная сенсорная меридиональная реакция. Это неологизм, обозначающий приятные ощущения в коже головы и теле, возникающие из-за определенных звуковых, зрительных и когнитивных стимулов.

Формально все ASMR-видео делятся на три категории:

Звуковые. На таких видео можно услышать шепот, хруст, постукивания, пощелкивания, шипения, цоканья. Блогеры (чаще всего девушки) стучат ноготками по разным предметам, медленно проводят пальцами по шершавым поверхностям, шелестят страницами книг и журналов, мнут в руках сухоцветы, едят огурцы, чипсы, лапшу, икру, варенье, смачно причмокивая в микрофон.

Ведущий смотрит в камеру, разговаривает со зрителем, просит его что-то сделать или сам будет делать вид, что стрижет вас, наносит макияж или приятным голосом прочитает книгу. Разумеется, в ролевых видео используются различные звуковые и визуальные триггеры.

Такие ролики самые сложные в реализации, поскольку блогер должен продумать сценарий, подобрать костюмы и большой арсенал звуков, чтобы охватить максимальное количество зрителей. У каждого человека свой набор триггеров, поэтому нужно постараться угодить всем.

Микрофоны в виде ушей и тишина

Конечно, самые первые ASMR-видео выглядят немного нелепо и наигранно, а о том, чтобы записывать четкий звук с помощью профессионального оборудования, никто даже не задумывался. Но со временем блогеры поняли, что для максимального погружения зрителю нужны качественные наушники, а авторам — специальные микрофоны.

Существуют так называемые бинауральные 3Dio микрофоны в форме человеческих ушей. В них два канала: левый и правый. Такое оборудование имитирует пространство вокруг головы слушателя. Если ASMR-блогер будет что-то шептать в правый канал, вы ощутите, что вам шепчут в правое ухо. И наоборот. Конечно, для достижения максимального эффекта у слушателя должны быть очень хорошие наушники.

Но оборудованием дело не заканчивается: важно создать нужную атмосферу. Согласно одному исследованию, порядка 81% зрителей смотрят ASMR-ролики вечером, в том числе перед сном. Это доказывает, что широкая часть аудитории с помощью таких видео старается расслабиться и уснуть, поэтому слушать и смотреть ролики на ходу или в общественных местах — бессмысленно.

Здесь важна подготовка: спокойная обстановка дома, абсолютная тишина, хорошие наушники и никаких отвлекающих факторов. Даже уведомления на смартфоне лучше отключить, чтобы не раздражали. Тихий голос, плавные, размеренные движения, мягкий свет, приятная улыбка и завораживающие звуки — и зритель уже почти в трансе, уровень тревоги снизился, его клонит в сон.

Как узнать, чувствительны ли вы к ASMR? Вспомните, нравится ли вам, когда парикмахер моет вашу голову. Если да, поздравляем. Вот вам одно из популярнейших ASMR-видео, наслаждайтесь.

Будто мама читает сказку

И все-таки почему ASMR-ролики снискали бешеную популярность в интернете? Ласковый голос и плавные движения, которые есть почти в каждом видео, оказывают на зрителя особый успокаивающий эффект.

Американские исследователи считают, что в ASMR-роликах наш мозг распознает сигналы, знакомые с раннего детства. Мы помним, как мама гладила нас по голове или приятным голосом читала сказки. Именно поэтому спокойные движения и шепот становятся триггерами, расслабляют нас.

Может ли ASMR вызвать сексуальное возбуждение?

По данным ученых, только 5% опрошенных любителей звуковых видео утверждают, что ASMR их возбуждает. Остальные респонденты смотрят подобные ролики ради эстетического удовольствия и расслабления, чтобы справляться с тревогой и стрессом, а также чувствовать себя кому-то нужным (речь идет об игровых роликах).


Но все упирается в моральные принципы и фантазии самих блогеров. Есть авторы, целенаправленно использующие свою внешность для привлечения внимания. Некоторые даже имитируют звуки физического контакта и поцелуев. Не будем их осуждать: на каждого такого блогера найдется свой зритель. Главное не привлекать к этому детей.

Детский ASMR. Хорошо это или плохо?

Детские ASMR-видео — явление довольно спорное. Проблема в том, что благодаря доступности гаджетов и стриминговых сервисов видео в Сеть может выложить любая пятилетка. Разумеется, в детских ASMR-роликах меньше креативности, но больше игривости: вот девочка ест конфеты или желе ложкой, чавкая в микрофон, красит губы блеском, помадой или яркими тенями.

Многие дети воспринимают такие видео как игру и подражание взрослым. Но есть и другой нюанс — деньги. Некоторые родители не упускают возможности заработать несколько тысяч долларов на роликах, в которых их ребенок поедает медовые соты или нелепо красит ногти.

Однако шепот и наигранная близость смущают даже некоторых зрителей взрослых ASMR-видео, что уж говорить о роликах с детьми? Все чаще в интернете можно встретить мнение о том, что такие видео жутковаты и неуместны. Кроме того, не дремлют и комментаторы: под безобидными детскими ASMR-видео появляются фразы о внешности детей и даже таймкоды с моментами, когда ребенок становится в неоднозначную позу. Так может быть не зря в Китае ASMR-видео под запретом?

Феномен ASMR еще почти не изучен, однако первые научные исследования показали, что среди зрителей есть те, кому подобные видео помогают расслабиться или заснуть. Однако не все люди испытывают удовольствие от хруста и шепота незнакомца по ту сторону экрана. Немалую часть аудитории подобные звуки попросту раздражают, а иные и вовсе не испытывают никаких эмоций. От чего это зависит — неизвестно. Узнаем ли мы ответ на этот вопрос? Покажет время.

Замечали, что голоса у западных вокалистов звучат интересно? А все потому, что они добавляют в свой вокал приемы пения . Западные техники и методики вокала давно строятся на этом. Чем помогают вокальные приемы? Меняют тембр и краски голоса. Вот вокалист шепчет, вот поёт на надрыве, там вставил мелизмы, а тут добавил хрипотцу. Голос становится разным и необычным.

Приемы помогают петь красиво. И вы тоже владеете такими вокальными фишками! Потому что способны издавать следующие звуки: шепот, крик, плач, разговор и смех. На этих пяти красках голоса строится большинство современных приемов вокала. Давайте разберем каждую из этих эмоций и поймем, как научиться петь интересно и использовать то, что заложено в голосе самой природой.

Прием пения с придыханием или зачем вокалисту шептать?

Представьте такую картинку. Темный джаз-бар, уютные столики, сцена в лучах огней. Выходит красотка с обворожительной улыбкой и начинает петь. Точнее, не петь. А шептать! Прямо в микрофон. Низким и чувственным тембром. И у всех зрителей бегут по спине мурашки.

Такой эффект получается от пения с придыханием . Этот вокальный прием основан на полушёпоте. С ним голос становится чувственным и нежным. Потому что в вокал певец добавляет много выдоха. При пении с придыханием голосовые связки смыкаются не полностью , они не сдерживают воздух, и он свободно выходит вместе со звуком.

Примеры придыхания в вокале

Услышать прием пения "с шепотом" можно не только в джазовом вокале. Современные поп-звезды тоже часто им пользуются.

Mariah Carey — Without You
Leona Lewis — Here I Am

Особенно слушателя цепляет, когда вы чередуете придыхание с плотным голосом . Добавьте в свою песню выдох в паре строчек, а остальные спойте как обычно. Уже этого достаточно, чтобы звучать интересно. Вот, например, Leona Lewis добавляет полушепот лишь на некоторых словах. Такой контраст слушается ярко:

Обработка аудио для ютуба и стримов: как сделать дикторский голос программными средствами

Создание видеороликов, трансляция подкастов и стримов — все это становится популярнее с каждым годом. Растущая конкуренция выдвигает больше требований к качеству контента, особенно к технической части — мало кто будет терпеть хрипящий звук и едва различимую речь, которую заглушает фоновая музыка. В этой статье рассматриваются базовые методы обработки голоса, которые помогут сделать его сопоставимым по качеству с речью профессионального диктора или радиоведущего.

Общие советы

Идеально, если речь записана в акустически обработанной комнате. Если таковой нет, можно обойтись акустическим экраном для микрофона. Расстояние до микрофона индивидуально и зависит от громкости голоса, экспрессии и динамики. Главное, чтобы не было перегрузов или откровенно тихого сигнала. Оптимальное значение — от -18 до -12 дБ.


На микрофоне обязательно должна быть либо ветрозащита, либо поп-фильтр. Взрывные согласные сложно поддаются компьютерной обработке, так что лучше приобрести недорогой аксессуар, который избавит от большинства проблем с ними.

Набор неплохих бесплатных плагинов от DAW Reaper можно скачать с официального сайта — там есть все необходимое. Для тех, кто всерьез увлечется звукорежиссурой, можно посоветовать более продвинутые пакеты плагинов от Waves, Fabfilter, Softube — их существует множество на любой вкус.

Обработку стоит выполнять на студийных мониторах или в наушниках студийного уровня. Без качественного контроля будет сложно разобрать, что вообще происходит с аудиосигналом.

Обрабатываем звук для оффлайн-видео

Итак, голос записан, и теперь нужно его обработать.



Следующий шаг — шумоподавление. Нужно найти участок записи без какого-либо сигнала, чтобы на нем присутствовал только шум цепи звукозаписи. Если уровень шума ниже 50 дБ (как на скриншоте выше) — можно смело махнуть на него рукой и не делать ничего, такой шум никто не услышит. Если шум явно заметен, можно использовать специальные плагины (например, reafir от Reaper или denoiser в Cubase) для его удаления, либо подрезать эквалайзером пару самых шумных частот — точно так же, как будут удалятся резонансы в следующем пункте.

Фильтрация и удаление резонансов. Бывает, что низкий мужской голос начинает неприятно бубнить в районе 100–200 Гц, либо высокий женский тембр в сочетании с не самым лучшим микрофоном неприятно режет по ушам. Так и проявляются резонансы. Избавиться от них просто: нужно поставить в цепь обработки эквалайзер и узкой полосой с большим усилением (10–30 дБ) “пройтись” по всему частотному спектру, вычисляя самые неприятные места с режущим ухо свистом, звоном или гудением. Их необходимо ослабить узкой полосой на 3–5 дБ. Главное здесь не перестараться — удаления всего двух-трех основных резонансов обычно хватает для дикторского голоса.


Поиск и подрезание резонанса

Помимо этого, можно вовсе удалить целые куски спектра, в которых нет никакого полезного сигнала. Это делается с помощью low-pass и hi-pass фильтров, которые обрезают высокие и низкие частоты соответственно.

Чаще всего проблемы встречаются в следующих областях:

? Ниже 75–100 Гц — здесь находится, в основном, низкочастотный бубнящий шум. Можно смело применить hi-pass фильтр и обрезать все до этих значений.

? 100–150 Гц — тут нередко находятся гудящие частоты, особенно это касается мужского вокала, записанного в небольшой комнате. Можно подрезать их узкой полосой.

? Выше 16 кГц — в человеческой речи редко присутствует что-то полезное выше этой частоты, так что можно смело применять low-pass фильтр.


Так выглядит эквалайзер после вырезания резонансов и ненужных частот

Добавление недостающих частот. Теперь, когда остался только полезный сигнал, нужно сделать его четче и ярче. В качестве отправной точки будут полезны следующие данные:

? 180–240 Гц — прибавление 3–5 дБ широкой полосой в этой области сделает мужскую речь более полной и читаемой. Для женской речи это будет 200–300 Гц.

? 1.5–2 — 5 кГц — это самый важный диапазон для голоса, так называемая область разборчивости. Человеческий слух наиболее чувствителен именно к этим частотам, стоит прибавить их широкой полосой на 3–8 дБ.

? 9–11 кГц — эти частоты отвечают за яркость голоса. Их очень часто не хватает в речи, записанной даже на студийный микрофон, особенно в заглушенной комнате, которая с аппетитом пожирает верха вокала. Нередко приходится значительно прибавлять этот диапазон — на 6–12 дБ, чтобы придать речи ясности. Но нужно следить за шипящими согласными.


При эквализации низких частот лучше использовать узкие полосы, а при высоких — широкие, это сделает работу эквалайзера менее заметной.

Компрессия. Компрессором убирается разница между громкими и тихими участками записи. В итоге голос будет звучать равномерно, от хлопков и кашля слушатель не будет вздрагивать, а при шепоте ему не придется прибавлять громкость. Понять работу компрессора поможет аналогия с громкой музыкой в комнате, которая не нравится соседу за стенкой. Параметр threshold будет тем критическим уровнем громкости музыки, при превышении которого сосед начинает тарабанить по батарее монтировкой; attack — как быстро он бежит к батарее при превышении этого уровня; ratio — насколько нужно убавить громкость, чтобы успокоить соседа; а release — как долго сосед перестает возмущаться после убавления громкости. Сосед-компрессор заставляет несчастного меломана держать уровень громкости музыки в определенных пределах. Начать настройку можно со следующих значений:

? Ratio: 4:1 (таким образом, если сигнал превышает порог на 4 дБ, то он скомпрессируется до 1 дБ выше порога)

? Attack: как правило, для голоса хорошо работает быстрая атака в районе 5–10 мс, она позволяет компрессору срабатывать мгновенно. Если при этом компрессия начинает съедать согласные — атаку нужно увеличить.

? Release: если в компрессоре есть функция авторелиз, можно ей и воспользоваться. Если нет — начать стоит с 40–50 мс.

? Output или make-up: если в компрессоре есть функция автомейкапа, можно применить ее. В противном случае компенсацию громкости можно выполнить вручную на слух — главное, чтобы итоговый сигнал не попадал в красную зону.

? Threshold: здесь нужно смотреть по уровню громкости исходного трека. Начать можно с -8 дБ.


Лимитеринг. Это операция позволяет ограничить максимальный уровень громкости. Сигнал на мастер-шине не должен зашкаливать, и лимитер выступает в роли очень жесткого компрессора, который не позволяет сигналу выбраться за пределы установленного значения. Как правило, среднее арифметическое уровня сигнала (RMS) должно быть около -16 дБ. При рендере на мастер-шине нужно выставить уровень -0.5 дБ, потому что финальная конвертация аудио может сделать звук громче и добавить искажений. При отсутствии лимитера его роль может сыграть компрессор: достаточно выставить ratio на максимум, threshold на -0.5 дБ, и атаку на минимум.


Лимитер и компрессор в роли лимитера

Если фоновая музыка в видео заглушает речь, нужно выставить RMS музыки и RMS голоса одинаковыми, после чего убавить музыку на 5–10 дБ. Если в некоторых местах слова все еще неразборчивы, можно применить к музыкальной подложке эквализацию. Достаточно посмотреть на эквалайзер для речи и сделать все наоборот в эквалайзере для музыки: например, если в речи 5 кГц приподнято широкой полосой, то в музыке эти же 5 кГц нужно убавить.

Обрабатываем звук в онлайне

У стримов и подкастов есть своя специфика при обработке голоса — здесь важно, чтобы плагины не были ресурсоемкими и не сильно грузили компьютер. Поэтому стоит использовать минимально необходимый набор эффектов.

Чаще всего для стримов используется программа OBS Studio. В ней можно загружать точно те же VST-плагины для обработки звука, что и в DAW. Если используется не OBS Studio, то для обработки голоса можно воспользоваться отдельной программой для потоковой обработки звука VSTHost, она работает с любыми приложениями для стримов.


Так выглядит плагин ReaFIR в OBS Studio

Для обработки голоса потребуется необходимый минимум:

1. Шумоподавление. В отличие от оффлайн-видео, звук к которым нередко записывается отдельно на качественный микрофон, в стримах часто используется не самое лучшее оборудование. Недорогой микрофон вкупе со встроенной звуковой картой и включенной функцией Microphone Boost в настройках звука Windows будут сильно шуметь. Для того, чтобы избавиться от этого шума, можно использовать встроенный в OBS фильтр Noise Suppression. У него всего одна настройка — уровень шумоподавления, начать стоит со значения около -20 дБ.


2. Гейт. Если в звуке для оффлайн-видео можно вручную вырезать все крики детей за окном и рев соседского перфоратора за стеной, то с онлайном такой фокус не провернуть. Понадобится гейт.

? Release можно сделать длинным, около 200 мс, поскольку работа гейта будет слишком слышна при быстром релизе. Правильно настроенный гейт почти незаметен для слушателя и удаляет лишь шумы и призвуки в паузах между фразами.

? Уровень гейта нужно сделать чуть выше, чем фоновый шум, не стоит выставлять уровень рядом с уровнем голоса.

? Простой способ настройки гейта для речи — нужно сложить губы трубочкой и шумно выдохнуть воздух в сторону от микрофона, запомнить на индикаторе значение уровня этого шума и выставить его на гейте.



4. Компрессор. Для стримов он имеет даже большее значение, чем для оффлайн-видео — в онлайне ни один диктор не сможет уследить за динамикой своего голоса на протяжении нескольких часов. Следует быть готовым к тому, что речь будет то едва слышной, то слишком громкой. Поэтому нужно использовать более жесткие настройки компрессора, чем для оффлайн-видео. Начать можно с ratio 10:1, атаки 5 мс и релиза в 30 мс или автоматически.


При подобных настройках нет необходимости в лимитере — компрессор будет выполнять его роль. Но если динамика речи очень большая и не позволяет настроить гейт (то слова начинают обрезаться, то шум просачивается в эфир), тогда можно использовать два компрессора: первый, с более мягкими настройками (ratio 3:1) поставить перед гейтом, второй, в качестве лимитера — в конце цепи (ratio выкрутить на максимум, threshold — так, чтобы компрессор срабатывал только при очень громких фразах).


Дайте послушать результаты!

Разобраться в обработке звука по тексту бывает непросто, но результат того стоит. Смотрите сами. Точнее, слушайте.

Качественный звук в современных видео и стримах значит ничуть не меньше, чем видео в высоком разрешении. А порой и больше — ведь многие ставят ролики на фон, смотря их вполглаза и воспринимая происходящее в основном на слух.

При этом стоит учесть, что данное руководство дает лишь базовые настройки в качестве точки отсчета. Конечный результат должен подбираться аудиально, ведь главный инструмент в работе звукорежиссера — это его собственные уши.

Алиса может сочинять сказки

С Алисой теперь можно разговаривать шепотом. Данная функция может быть полезна во многих сценариях, например ночью. Вам нужно всего лишь обратиться к голосовому помощнику шепотом, и Алиса тоже перейдет на пониженный голос.

Андрей Стыскин, руководитель поиска Яндекса, рассказал, какая задача стояла перед разрабочиками:

… нужно было изобретать, как уже выучив голос и принципы того, как формируются звуки и слова, его трансформировать в шепот. Представьте, что для этого нужно было сделать специальный нейросетевой трансформер, который умеет делать разные тональности, разные ударения или эмоции.

Алиса может говорить шепотом

Процесс обучения происходил в две фазы. На первом этапе Алису научили отличать шепот от глухого звука или простуженного, тихого голоса. Для этого пришлось записать несколько часов шепота вместе с Татьяной Шитовой, которая озвучивает голосового помощника. На следующей стадии разработчики использовали нейросети, чтобы научить Алису шептать в ответ.

Чтобы воспользоваться новой функцией, достаточно сказать: Алиса, сочини сказку

Читайте также: