Что можно узнать о человеке по его речи. Кто там? — Идентификация человека по голосу

Когда мы слышим другого человека, то интуитивно можем нарисовать его образ: старый или молодой, толстый или худой, низкий или высокий, добрый или злой, скромный или заносчивый и так далее.

Центры человеческого мозга, ответственные за восприятие и оценку эмоционального окраса речи и звуков, начинают свою работу с момента рождения. Малыш двух недель отроду еще не понимает значение слов, но интонацию, с какой они сказаны, определяет безошибочно.

Благодаря этой способности мы можем по голосу определить характер человека, идентифицировать его личность, то есть составить физиологический и психологический портрет. Существуют определенные стереотипы восприятия человека: по тому, как мы «звучим» можно судить об уровне интеллекта, о роде занятий, темпераменте.

К примеру, если человек разговаривает четко, быстро, напористо, то он довольно энергичен и активен, сначала сделает, потом подумает. Если его речь медленная, он будто взвешивает слова, то этот человек нетороплив, подходит к любому вопросу обстоятельно, анализирует ситуацию и прежде чем отрезать, отмерит семь раз.

Если говорящий проглатывает окончания, его речь логически несвязана и похожа на скороговорку, то в жизни он такой же несобранный. Любые изменения физического состояния или настроения отражаются в речи. Это хорошо известно представителям многих профессий — психологам, следователям, политикам, менеджерам. Они с успехом пользуются этими знаниями для манипулирования окружающими людьми, достижения своих задач.

Так, талантливый дипломат и политик Талейран, мог искусно изменять свою речь на нечленораздельное бормотание себе под нос с целью отказа от своих слов впоследствии. Свой отказ Талейран объяснял тем, что его неправильно поняли.

К своему голосу мы привыкаем и себя не «слышим». А значит, можем и не подозревать о том, что оттенки, тон или тембр голоса могут создавать о нас представление противоположное тому, которое мы хотим производить на окружающих. Интонации голоса могут рассказать о многих чертах характера человека.

Резкие голосовые колебания вниз и вверх
Человек только учится самовыражаться, возможно находится на уровне подросткового развития. Столкновение с неизвестными жизненными ситуациями ломает его привычные стереотипы поведения и мышления.

Возможно, он крайне неуравновешен, легко поддается сменам настроения. Голос отражает его взлеты и падения, причем, на неудачи он реагирует крайне остро.

Напряженные интонации в голосе
Обладатель голоса контролирует каждый свой шаг, вдох и выдох. Это импонирует его коллегам и начальству, но напрягает близкое окружение. Ведь в его обществе мало душевного тепла, он слишком замкнут, поглощен работой и самодисциплиной.

Громкий голос
Человек стремится доминировать во всем, контролировать людей и ситуацию. Частое перебивание собеседников при этом говорит о невоспитанности и эгоизме. Существует ошибочное мнение, что громкая речь – признак уверенности. Часто таким способом пытаются привлечь к себе внимание.

Иногда громко разговаривают люди маленького роста или с плохим телосложением, стремясь компенсировать свои физические недостатки. По-настоящему уверенные в себе люди редко разговаривают громко, это всегда получается уместно и, как правило, для оказания давления.

Спокойный и уверенный голос, четкая дикция
Человек имеет четкое представление о том, как подать себя миру. Саморуководство и самодисциплина - его конек. Благодаря им он добился хороших результатов. Однако в общении с ним может возникнуть ощущение театральности — слишком четкое выражение мыслей, лишенное чувств.

Высокий и звонкий
Голос вызывает ассоциации с энергичностью и юностью, а также с неопытностью и незрелостью. Чем голос выше, тем должность ниже - свидетельствует статистика. Высокие и пронзительные звуки воспринимаются подсознанием, как тревожный сигнал. Поэтому собеседники звонко говорящей личности испытывают дискомфорт, что непроизвольно уменьшает уровень доверия к словам.

Безразличный голос
Если речь вашего собеседника ровная и безразличная, видимо, ему неинтересна беседа, либо он в депрессии, тревоге или скучает. Еще такая манера может говорить о затаенных сильных чувствах: обиде, ревности, ненависти, зависти и др.

Голос с претензией
Напыщенность и претенциозность обусловлены разными причинами. Это может быть неуверенность, жажда одобрения и признания другими людьми успешности, ума и других качеств или неуважительное и высокомерное отношение к окружающим.

Голос с придыханием
Обычно дыхание собеседника в разговоре не слышится, но если это происходит, то причинами могут быть сексуальный интерес, сильное волнение, нервозность, стресс или недоверие, которое часто сопровождается покачиваниями головы и другими жестами.

Низкий голос
Вызывает ассоциации с уверенностью, самодостаточностью, интеллектом. Обладателя интуитивно воспринимают, как авторитетного и знающего. Чем ниже голос у мужчины, тем надежней и сильнее его считает женщина.

Низкий голос обусловлен высоким уровнем мужских гормонов в крови, что подразумевает более яркий темперамент. По этой причине обладательница низкого грудного голоса, кажется более сексуальной, чем женщина, говорящая звонко.

Тихий голос
Тихий голос может говорить о противоположных качествах обладателя, поэтому никогда не стоит спешить с выводами. Тихая речь наводит мысль на то, что человек застенчив и неуверен в себе, занимает позицию созерцателя жизни, а не творца.

Голос может выступать, как предатель, если не умееть управлять им. Он расскажет всю подноготную, — от болезней, перенесенных в детстве до сиюминутных переживаний. Психологи, к примеру, по голосу могут определить, являетесь ли человек потенциальным алкоголиком, что для него важнее — семья или карьера.

Голос может быть и союзником. С его помощью производить желаемое впечатление, манипулировать людьми и добиваться тем самым своих целей. Каким бы ни был ваш голос, давайте ему волю чаще: пойте под караоке или застольные песни с друзьями, кричите или аукайте на природе.

Возьмите за правило распевать или хотя бы мурлыкать под нос себе любую мелодию. Выплескивайте эмоции без остатка, когда это возможно: смейтесь, а не хихикайте, рыдайте, не сдерживая слезы. Позволяйте себе звучать. Это очень полезно и помогает достичь гармонии с окружающим миром и с самим собой.


Интонации голоса меняются в зависимости от эмоционального или физического состояния. Важно обнаружить определенные закономерности. Если какая то характеристика неизменно проявляется, то можно делать вывод о возможных мыслях или поступках другого человека.

Речевых характеристик очень много, поэтому имеет смысл фокусироваться на наиболее информативных из них:

Время от времени встречаются люди с громким голосом. Что кроется за этим? Для оценки значимости этого необходимо понять, в каких ситуациях человек говорит громко. Чаще всего громкий голос принадлежит людям, которые пытаются контролировать ситуацию и людей. Громкость несколько подавляет, а иногда даже пугает.
Поэтому люди, стремящиеся к доминированию, использующие авторитарный способ управления, часто пользуются этим приемом. В отдельных случаях манера громко говорить у человека может сочетаться с постоянным перебиванием собеседника. Это не только попытка установить контроль над ситуацией, но и свидетельство эгоизма и невоспитанности. Некоторые считают, что громкий голос отвечает уверенным в себе людям. Однако во многих случаях это не так. Скорее, громко говорят люди, желающие, чтобы на них обратили внимание. Другого способа привлечь к себе внимание они не знают, то есть речь идет о демонстративности поведения.
Иногда люди используют громкий голос для пущей убедительности. Подобная манера говорить действует на людей, но только на запуганных, слабых, неуверенных в себе или ленивых, предпочитающих, чтобы за них решения принимали другие.
Часто приходится наблюдать, когда громким голосом люди пытаются компенсировать маленький рост, плохое телосложение и т. д.
Порой манера громко говорить отражает нежелание проявлять внимание к собеседникам. Люди, уверенные в себе, прибегают к громкому голосу редко и к месту, чаще всего для определенного давления.

Тихий голос может принадлежать человеку, уверенному в себе, который не видит необходимости доминировать в разговоре или привлекать к себе внимание. Тихий голос иногда указывает, наоборот, на нерешительность, отсутствие настойчивости. Часто таким голосом обладают люди высокомерные, вынуждающие своей манерой говорить прислушиваться к ним.
Каждый раз, услышав чей то тихий голос, не следует спешить с выводами. Лучше присмотреться к человеку и понять, чем обусловлен подобный голос, в каких ситуациях он используется.
В шумных местах человек, обычно говорящий тихо, вынужден начать говорить громче. Если этого не происходит, значит, ему не хватает наблюдательности, восприимчивости, возможно, он чрезмерно высокомерен.
Если в процессе общения человек говорит тихо, спокойно смотрит в глаза, его жесты неторопливы, то ситуация в целом для него комфортна. Тихий голос может сочетаться с нежеланием смотреть в глаза и суетливыми жестами. Значит, человек испытывает дискомфорт, возможно, ему не хватает уверенности в себе.
В любом случае стоит присматриваться к выражению глаз и жестам.

Быстрая речь

Надо различать постоянную быструю речь и реакцию на определенные обстоятельства. Замечено, что чаще всего люди с быстрой речью весьма активны и умеют, не задумываясь, принимать решения. Этому типу людей иногда не хватает осторожности, чрезмерная импульсивность приводит в некоторых случаях к поспешным выводам.
В отдельных случаях быстрая речь служит компенсацией неуверенности, желанием привлечь к себе внимание. И то и другое обусловлено низкой самооценкой.
Убыстренная речь может указывать и на ложь собеседника. Слова слетают с его губ быстро, так как он желает скорее освободить себя от ложной информации. Под потоком слов легче скрыть правду.
В подобных ситуациях надо обратить внимание на другие сигналы и понять, нет ли в них признаков волнения или неуверенности.

Медленная речь

Наиболее часто встречаются два следующих варианта. Медленно, спокойно и тихо говорят уверенные в себе люди. Медленно говорят и люди, находящиеся в состоянии дискомфорта, на что должны указывать другие сигналы.
Иногда в процессе разговора говорящий может замедлить свою речь, если он хочет подчеркнуть какой то важный момент, если его что то беспокоит или смущает, если он сочиняет или устал.
Глубоко задумавшиеся люди часто замедляют свою речь.

Запинающаяся речь

В речи некоторых людей много остановок и пауз. Медленная речь имеет свой ритм, в запинающейся речи пауза возникает чаще всего неожиданно, продолжительность пауз тоже меняется. Паузы могут быть вызваны неуверенностью, нервозностью, смущением. Иногда это указывает на неискренность. Но вероятна и обратная ситуация. Человек хочет высказаться более точно, он подыскивает слова, в результате возникает пауза.
Чтобы определить, чем обусловлена пауза, стоит присмотреться к языку тела. Человек может начать запинаться, если он взволнован или лжет. Желательно обратить внимание на его глаза, частоту дыхания, жесты. По этим признакам и надо судить о состоянии человека. Лгун будет не только запинаться, но и избегать взгляда собеседника, прикрывать ладонью рот или другие части лица.
Нервный человек сопровождает речь с паузами суетливыми движениями рук и ног. Если же человек всего лишь стремится точно выразить свою мысль, то его концентрированность должна проявиться в глазах и жестах.
Конечно, желание сконцентрировать свое внимание приводит к таким же паузам, которые часто возникают в речи очень болтливых людей. Но у последних пауза связана с потерей нити разговора, о чем очень выразительно говорят движения глаз.
В отдельных случаях медленная речь переходит в явное запинание, что, скорее всего, связано с большой нервозностью, а может быть, даже и с заболеванием.

У каждого из нас высота голоса во время разговора с другими людьми меняется. И на это есть вполне определенные причины.
В большинстве случаев голос становится выше от радости, страха, возбуждения и т. д. Голос «срывается» от большого эмоционального напряжения. Различные эмоциональные состояния подтверждаются языком тела, поведением людей.
Когда человек устал, загрустил, подавлен или желает произвести на других впечатление, то голос становится значительно ниже. Но и в этом случае необходимо обратить внимание на язык тела.

Речевые ударения

Надо внимательно прислушиваться к речевым ударениям. Желая подчеркнуть какое то слово и мысль, говорящий может использовать речевое ударение. Его легко распознать, если одновременно воспринимать язык тела. Например, одновременно с речевым ударением говорящий иногда наклоняется вперед, кивает головой, поднимает руку и т. д. Еще раз подтверждается правило, что желательно научиться замечать в поведении собеседника отклонение от стереотипности, привычного. Тогда удается понять как намерения человека, так и его характер.


Молодая женщина настаивала: «Вы слышите? У меня такой низкий голос, что по телефону меня принимают за мужчину. Ладно, я адвокат, и для работы это хорошо: я выигрываю почти все дела. Но в жизни этот голос мне мешает. И он не нравится моему другу!»

Кожаная куртка, короткая стрижка, угловатые движения… Женщина напоминала юношу еще и тем, что говорила низким голосом с легкой хрипотцой: такие голоса бывают у сильных личностей и заядлых курильщиков. Фониатр осмотрел ее голосовые связки и нашел лишь незначительный отек, который, впрочем, почти всегда наблюдается у тех, кто много курит. Но пациентка просила сделать ей операцию, чтобы сменить «мужской» тембр.

Жан Абитболь ей отказал: для операции не было медицинских показаний, к тому же он был уверен, что перемена голоса изменит личность пациентки. Абитболь - врач-отоларинголог, фониатр, первопроходец в области хирургии голоса. Он автор метода «Вокальное исследование в динамике». Услышав от врача, что ее личность и голос прекрасно подходят друг другу, женщина-адвокат разочарованно ушла.

Почти год спустя в кабинете доктора зазвучало звонкое сопрано - оно принадлежало девушке с волосами до плеч, в бежевом платье из муслина. Абитболь сперва даже не узнал свою прежнюю пациентку: она уговорила другого врача прооперировать ее, и специалист отлично справился с работой. Новый голос потребовал новой внешности - и облик женщины удивительно изменился. Она стала другой - более женственной и мягкой, но, как выяснилось, эти перемены оказались для нее катастрофой.

«Во сне я говорю своим прежним низким голосом, - печально призналась она. - А наяву начала проигрывать процессы. Я стала какой-то беспомощной, мне не хватает напора, иронии, и у меня такое ощущение, будто не я кого-то защищаю, а сама все время защищаюсь. Я просто себя не узнаю».

Рената Литвинова, сценарист, актриса, режиссер

Я очень хорошо отношусь к своему голосу. Пожалуй, это то немногое, что мне более или менее в себе нравится. Меняю ли я его? Да, невольно: когда я счастлива, то говорю более высоким тоном, а когда делаю над собой какие-то усилия, то голос вдруг уходит в бас. Но если в общественных местах меня в первую очередь узнают по голосу, то это мне не нравится. Думаю: «Господи, неужели я такая страшная, что меня только по интонациям и можно узнать?»

Итак, голос тесно связан с нашим физическим состоянием, внешностью, эмоциями и внутренним миром. «Голос - это алхимия духа и тела, - объясняет доктор Абитболь, - и на нем остаются шрамы, заработанные нами за всю жизнь. О них можно узнать по нашему дыханию, паузам и мелодике речи. Поэтому голос - не только отражение нашей личности, но и летопись ее развития. И когда кто-то говорит мне, что ему не нравится собственный голос, я, конечно, обследую гортань и голосовые связки, но параллельно интересуюсь биографией, профессией, характером и культурным окружением пациента».

Голос и темперамент

Увы, мучения при записи дежурной фразы на собственном автоответчике знакомы многим. Но при чем здесь культура? Алине 38 лет, она занимает ответственную должность в крупном PR-агентстве. Однажды, услышав себя на пленке, она ужаснулась: «Боже, что за писк! Не PR-директор, а детский сад какой-то!»

Жан Абитболь утверждает: вот явный пример влияния нашей культуры. Пятьдесят лет назад типично женским считался звонкий, высокий голос, как у звезды французского шансона и кино Арлетти или Любови Орловой. Актрисы с низким, хрипловатым голосом, как у Марлен Дитрих, воплощали загадочность и обольщение. «Сегодня женщине-руководителю лучше обладать более низким тембром, - объясняет фониатр. - Похоже, неравенство полов проявляется даже здесь! Чтобы жить в гармонии со своим голосом и самим собой, надо учитывать стандарты общества, которые порой заставляют нас идеализировать некоторые звуковые частоты».

Василий Ливанов, актер

В молодости голос у меня был другой. Я его сорвал 45 лет назад, во время съемок. Восстановился он уже таким, как сейчас. Я уверен, что голос - это биография человека, выражение его индивидуальности. Я могу менять голос, когда озвучиваю разных персонажей - Карлсона, Крокодила Гену, Удава, но это уже относится к моей профессии. Помогает ли мне легко узнаваемый голос? В жизни другое помогает - уважение и любовь к людям. И совсем неважно, каким голосом выражаются эти чувства.

Проблема Алины может показаться надуманной, но Абитболь напоминает: наш голос - это вторичный половой признак. Американские психологи под руководством доктора Сьюзан Хьюз из университета Олбани в недавнем исследовании доказали, что люди, чей голос воспринимается как эротичный, действительно ведут более активную половую жизнь. И, к примеру, если ваш голос чересчур инфантилен для вашего возраста, возможно, в период вашего взросления голосовые связки не получили должного количества соответствующих гормонов.

Бывает, что крупный, представительный мужчина, начальник, говорит совершенно детским, звонким голоском - с таким бы лучше озвучивать мультфильмы, нежели управлять предприятием. «Из-за тембра своего голоса такие мужчины нередко недовольны собой, не принимают свою личность, - продолжает доктор Абитболь. - Работа врача-фониатра или ортофониста заключается в том, чтобы помочь таким людям поставить голосовой аппарат и развить силу своего голоса. Через два-три месяца у них «прорезается» их подлинный голос, и, конечно, он нравится им гораздо больше».

как звучит ваш голос?

Еще одна распространенная претензия к собственному голосу - он «не звучит», человека не слышно. «Если в комнате собираются трое, мне и рот раскрывать уже бесполезно», - пожаловалась на консультации пациентка. «А вы действительно хотите, чтобы вас услышали?» - уточнил фониатр.

Вадим Степанцов, музыкант

Я и мой голос - мы подходим друг другу, мы в гармонии. Мне говорили про его необычные обертоны, сексуальность, особенно когда он звучит по телефону. Я об этом его свойстве знаю, но никогда не пользуюсь. Я мало занимался вокалом: в начале рок-н-ролльной карьеры я решил, что в необработанном голосе больше жизни, энергии и смысла. Но некоторым изменить свой голос стоит - у многих мужчин совсем неподходящие им голоса. У Ким Ки-Дука в одном из фильмов бандит все время молчит и только в финале произносит какую-то фразу. И у него оказывается такой тонкий и мерзкий голос, что сразу наступает катарсис.

Обратный случай: человек буквально глушит собеседников своим «трубным басом», специально опуская подбородок (для лучшего резонанса) и слушая, как у него получается. «Любой отоларинголог легко распознает искусственно форсированный голос, - говорит Абитболь. - Чаще к этому прибегают мужчины, которым необходимо продемонстрировать свою силу. Им приходится постоянно «подделывать» свой естественный тембр, и тот перестает им нравиться. Как следствие, и в отношениях с собой у них возникают проблемы».

Другой пример - люди, не отдающие себе отчета в том, что их голос становится для окружающих настоящей проблемой. Это «крикуны», которые, не обращая внимания на мольбы, ни на полтона не снижают громкость, или «трещотки», от чьей неукротимой болтовни, кажется, могут разболтаться даже ножки стула. «Часто эти люди хотят что-то доказать - самим себе или другим, - объясняет доктор Абитболь. - Не стесняйтесь сказать им правду: «Когда ты так говоришь, я тебя не понимаю» или «Извини, но твой голос меня утомляет».

Леонид Володарский, теле- и радиоведущий

Меня мой голос не интересует совсем. Было время, я занимался переводами фильмов, и теперь меня в первую очередь узнают по голосу, постоянно спрашивают про прищепку на носу. Мне это не нравится. Я не оперный певец, и голос не имеет никакого отношения к моей индивидуальности. Говорят, что он стал частью истории? Ну и хорошо. А я живу сегодня.

Громкие, пронзительные голоса действительно очень неудобны. В этом случае может помочь «вокальное перевоспитание» с участием отоларинголога, фониатра и ортофониста. А еще - занятия в актерской студии, где голос научат контролировать; хоровое пение, где учишься слушать других; занятия вокалом для постановки тембра и... поиска своей подлинной индивидуальности. «Какой бы ни была проблема, ее всегда можно решить, - уверен Жан Абитболь. - Конечная цель такой работы - буквально почувствовать себя «в голосе», то есть так же хорошо и естественно, как и в своем собственном теле».


Когда мы слышим другого человека, то интуитивно рисуем его образ: старый или молодой, толстый или худой, добрый или злой, скромный или заносчивый и так далее. А что делают другие люди по отношению к нам? То же самое. Например,

Громкий голос может создать образ человека, который стремится доминировать, контролировать людей и ситуацию. Существует ошибочное мнение, что громкая речь – признак уверенности. Часто таким способом просто пытаются привлечь к себе внимание.

Иногда громко разговаривают люди маленького роста или с плохим телосложением, стремясь компенсировать свои физические комплексы.

По-настоящему уверенные в себе люди редко разговаривают громко. А если и говорят, то это всегда получается уместно и, как правило, для оказания давления.

Спокойный, уверенный голос и четкая дикция рисует человека, который знает, как подать себя миру. Саморуководство и самодисциплина – его конек. Однако в общении с ним у вас может возникнуть ощущение некой театральности: слишком четкое выражение мыслей, лишенное чувств.

Если человек разговаривает четко, быстро, напористо, то он довольно энергичен и реактивен. Это тот человек, который сначала сделает, а потом подумает.

Если его речь медленная, он будто взвешивает слова, то этот человек нетороплив, обстоятелен и склонен к анализу.

Невнятная речь может свидетельствовать о том, что человек не умеет выражать свои мысли, тревожен, застенчив или устал. Он не является лидером, ему не хватает жизненных впечатлений, радости, энергии. Ему присущи слабые рукопожатия, вялые телодвижения.

Низкий голос вызывает ассоциации с уверенностью, самодостаточностью, интеллектом. Обладателя интуитивно воспринимают, как авторитетного и знающего. Чем ниже голос у мужчины, тем надежней и сильнее его считает женщина. И это правильно, т.к. связано с высоким уровнем гормонов.

Мы все с детства, еще не понимая значения слов, обучаемся по интонации оценивать эмоциональную окраску речи, звуков. Благодаря этой способности мы можем по голосу определять характер человека, судить об интеллекте, роде занятий, темпераменте.

Гораздо чаще, чем от болезней и перегрузок, голос страдает именно от них. И тогда мы чувствуем, что наш голос как бы пресекается, горло «перехватывает», зажимает, вплоть до ощущения боли, – но ничего не можем с этим поделать. Отчего это происходит?

Дело в том, что горловые зажимы – это психологические реакции тела на стресс. А если ваш голос зажат постоянно, это значит, что вы испытываете стресс, даже если вы его не ощущаете.

Наше тело привыкает и застывает в какой-то защитной реакции, и мы перестаем ощущать эту часть. И только когда все остальное тело расслаблено – тогда становится заметней сжатие, спазм в этой области. Вот почему мы так часто болеем в отпуске.

Как связаны голосовые зажимы с психологическими? Можно ли освободить от них свой голос так, чтобы он зазвучал в полную силу своей естественной, природной красоты? Да, конечно. Но для этого необходимо сделать некоторую работу над собой.

Обратите внимание, как мы, взрослые, воспитанные люди, реагируем на боль, душевную и телесную. Нам хочется заорать – от боли, от гнева, от обиды – а мы стискиваем губы, зубы, горло. В отличие от детей, которые сразу реагируют открытым, звонким криком.

Реакция ребенка мгновенна, безоценочна: импульс – реакция. У нас же – с заминкой на оценку (прилично или неприлично?). Поэтому ребенок выплескивает эмоцию через голос и быстро забывает про свою беду. А мы сдерживаем свои естественные реакции и годами пережевываем свои «неозвученные» проблемы.

А еще одно замечательное правило: «Плакать – неприлично!». И мы вместо того, чтобы «зареветь», как ревут дети – «глотаем слезы». Что болит и зажимается в этот момент? Правильно – горло. А еще зевать неприлично! Стонать от наслаждения – тоже неприлично (а вдруг соседи услышат?).

Мышцы гортани перестают работать, глотка закрывается, и голос, не находя себе другого пути, выходит либо через нос (гнусавый звук), либо «застревает в горле» (глухой тусклый звук, боль, першение).

А как мы улыбаемся? Губы притворно растягиваются в улыбку тогда, когда вам вовсе не хочется улыбаться. Это – «социальная улыбка» – наша защитная реакция на опасность. У зверей такая «улыбка» называется оскалом и означает – «лучше не подходи, я сильный, у меня – зубы острые».

И у нас такая «натянутая» улыбка неосознанно сигнализирует: «Я – сильный», или «Я – сильная». А также: «Не подходите слишком близко». Эта улыбка выдает наш страх: страх искренности, открытости, естественности. То есть, на самом деле, выявляет нашу слабость.

И для того, чтобы справиться со всеми этими зажимами – у нас существует специальный курс, называется «Свобода тела». На нем мы осознаем наши личные причины образования названных зажимов, учимся говорить о своих чувствах, озвучивать эмоции, дышать в стрессовых ситуациях, делаем специальные упражнения. Вы меняетесь изнутри и ваш голос меняется.

Я приглашаю вас на свой курс, а пока вот несколько рекомендаций:

  • Чтобы «разжать» зажим в области гортани, потренируйтесь открывать рот так, чтобы нижняя челюсть как бы «отстегнулась» от верхней и двигалась расслабленно.
  • Держите руку на подбородке и читайте вслух любой текст.
  • На каждой ударной А, О, Э опускайте челюсть (рукой!) как можно ниже, следите за тем, чтобы рот по вертикали раскрывался, как можно шире, – и вы удивитесь, насколько громче и свободнее зазвучит ваш голос!
  • Научитесь зевать во весь голос, как зевают дети, кошки и собаки. Попробуйте вызвать у себя зевоту искусственно и обратите внимание на то, как в это время двигается ваша гортань, глотка, где находится язык.
  • Еще одно упражнение, это упражнение – смех.
  • Вспомните как вы смеялись и не могли остановиться. Что у вас болело? Правильно – живот. А, точнее, диафрагма, которая активно работает при голосовой нагрузке. А горло в этот момент издает звонкие, объемные, громкие звуки. Если вы научитесь смеяться «по заказу», вы сможете моментально снять голосовой зажим, и быстро поднять себе настроение.
И еще маленький секрет – на самом деле звучит не горло и не связки, –голос резонирует во всем теле.

И где бы в нашем теле не возник зажим, это мгновенно отражается на звучании голоса.

Здравствуй, дорогой читатель!

Предлагаю твоему вниманию интересную и познавательную статью об отдельно взятом методе распознавания говорящего. Всего каких-то пару месяцев назад я наткнулся на о применении мел-кепстральных коэффициентов для распознавании речи. Она не нашла отклика, вероятно, из-за недостаточной структурированости, хотя материал в ней освещен очень интересный. Я возьму на себя ответственность донести этот материал в доступной форме и продолжить тему распознавания речи на Хабре.

Под катом я опишу весь процесс идентификации человека по голосу от записи и обработки звука до непосредственно определения личности говорящего.

Запись звука

Наша история начинается с записи аналогового сигнала с внешнего источника с помощью микрофона. В результате такой операции мы получим набор значений, которые соответствуют изменению амплитуды звука со временем. Такой принцип кодирования называется импульсно-кодовой модуляцией aka PCM (Pulse-code modulation). Как можно догадаться, «сырые» данные, полученные из аудио-потока, пока еще не годятся для наших целей. Первым делом нужно преобразовать непослушные биты в набор осмысленных значений — амплитуд сигнала. В качестве входных данных я буду использовать несжатый 16-битный знаковый (PCM-signed) wav-файл с частотой дискретизации 16 кГц.

Double readAmplitudeValues(bool isBigEndian) { int MSB, LSB; // старший и младший байты byte buffer = ReadDataFromExternalSource(); // читаем данные откуда-нибудь double data = new double; for (int i = 0; i < buffer.length; i += 2) { if(isBigEndian) // задает порядок байтов во входном сигнале { // первым байтом будет MSB MSB = buffer; // вторым байтом будет LSB LSB = buffer; } else { // наоборот LSB = buffer; MSB = buffer; } // склеиваем два байта, чтобы получить 16-битное вещественное число // все значения делятся на максимально возможное - 2^15 data[i] = ((MSB << 8) || LSB) / 32768; } return data; }
Освежить знания про порядок байтов можно на википедии .

Обработка звука

Полученные значения амплитуд могут не совпадать даже для двух одинаковых записей из-за внешнего шума, разных громкостей входного сигнала и других факторов. Для приведения звуков к «общему знаменателю» используется нормализация . Идея пиковой нормализации проста: разделить все значения амплитуд на максимальную (в рамках данного звукового файла). Таким образом мы уравняли образцы речи, записанные с разной громкостью, уложив все в шкалу от -1 до 1. Важно, что после такой трансформации любой звук полностью заполняет заданный промежуток.

Нормализация, на мой взгляд, — самый простой и эффективный алгоритм предварительной обработки звука. Существуют также масса других: «отрезающие» частоты выше или ниже заданной, сглаживающие и др.

Разделяй и властвуй

Даже при работе со звуком с минимально достаточной частотой дискретизации (16 кГц) размер уникальных характеристик для секундного образца звука просто огромен — 16000 значений амплитуд. Производить сколь-нибудь сложные операции над такими объемами данных не представляется возможным. Кроме того, не совсем понятно, как сравнивать объекты с разным количеством уникальных черт.

Для начала снизим вычислительную сложность задачи, разбив ее на меньшие по сложности подзадачи. Этим ходом убиваем сразу двух зайцев, ведь установив фиксированный размер подзадачи и усреднив результаты вычислений по всем задачам, получим наперед заданное количество признаков для классификации.


На рисунке изображена «порезка» звукового сигнала на кадры длины N с половинным перекрытием. Необходимость в перекрытии вызвана искажением звука в случае, если бы кадры были расположены рядом. Хотя на практике этим приемом часто принебрегают для экономии вычислительных ресурсов. Следуя рекоммендациям , выберем длину кадра равной 128 мс, как компромисс между точностью (длинные кадры) и скоростью (короткие кадры). Остаток речи, который не занимает полный кадр, можно заполнить нулями до желаемого размера или просто отбросить.

Для устранения нежелаетльных эффектов при дальнейшей обработке кадров, умножим каждый элемент кадра на особую весовую функцию («окно»). Результатом станет выделение центральной части кадра и плавное затухание амплитуд на его краях. Это необходимо для достижения лучших результатов при прогонке преобразования Фурье , поскольку оно ориентировано на бесконечно повторяющийся сигнал. Соответственно, наш кадр должен стыковаться сам с собой и как можно более плавно. Окон существует великое множество . Мы же будем использовать окно Хэмминга.

n - порядковый номер элемента в кадре, для которого вычисляется новое значение амплитуды
N - как и ранее, длина кадра (количество значений сигнала, измеренных за период)

Дискретное преобразование Фурье

Следующим шагом будет получение кратковременной спектрограммы каждого кадра в отдельности. Для этих целей используем дискретное преобразование Фурье .

N - как и ранее, длина кадра (количество значений сигнала, измеренных за период)
x n - амплитуда n-го сигнала
X k - N комплексных амплитуд синусоидальных сигналов, слагающих исходный сигнал

Кроме этого, возведем каждое значение X k в квадрат для дальнейшего логарифмирования.

Переход к мел-шкале

На сегодняшний день наиболее успешными являются системи распознавания голоса, использующие знания об устройстве слухового аппарата. Несколько слов об этом есть и на Хабре . Если говорить вкратце, то ухо интерпретирует звуки не линейно, а в логарифмическом масштабе. До сих пор все операции мы проделывали над «герцами», теперь перейдем к «мелам». Наглядно представить зависимость поможет рисунок.


Как видно, мел-шкала ведет себя линейно до 1000 Гц, а после проявляет логарифмическую природу. Переход к новой шкале описывается несложной зависимостью.

m - частота в мелах
f - частота в герцах

Получение вектора признаков

Сейчас мы как никогда близко к нашей цели. Вектор признаков будет состоять из тех самых мел-кепстральных коэффициентов. Вычисляем их по формуле

c n - мел-кепстральный коэффициент под номером n
S k - амплитуда k-го значения в кадре в мелах
K - наперед заданное количество мел-кепстральных коэффициэнтов
n ∈

Как правило, число K выбирают равным 20 и начинают отсчет с 1 из-за того, что коэффициент c 0 несет мало информации о говорящем, так как является, по сути, усреднением амплитуд входного сигнала.

Так кто же все-таки говорил?

Последней стадией является классификация говорящего. Классификация производится вычислением меры схожести пробных данных и уже известных. Мера схожести выражается расстоянием от вектора признаков пробного сигнала до вектора признаков уже классифицированного. Нас будет интересовать наиболее простое решение — расстояние городских кварталов .

Такое решение больше подходит для векторов дискретной природы, в отличие от расстояния Евклида.

Внимательный читатель наверняка помнит, что автор в начале статьи упоминал про усреднение признаков речевых кадров. Итак, восполняя этот пробел, завершаю статью описанием алгоритма нахождения усредненного вектора признаков для нескольких кадров и нескольких образцов речи.

Кластеризация

Нахождение вектора признаков для одного образца не составит труда: такой вектор представляется как среднее арифметическое векторов, характеризующих отдельные кадры речи. Для повышения точности распознавания просто необходимо усреднять результаты не только между кадрами, но и учитывать показатели нескольких речевых образцов. Имея несколько записей голоса, разумно не усреднять показатели к одному вектору, а провести кластеризацию, например с помощью метода k-средних .

Итоги

Таким образом, я рассказал о простой но эффективной системе идентификации человека по голосу. Резюмируя, процесс распознавания построен следующим образом:
  1. Собираем несколько тренировочных образцов речи, чем больше — тем лучше.
  2. Находим для каждого из них характеристический вектор признаков.
  3. Для образцов с известным автором проводим кластеризацию с одним центром (усреднение) или несколькими. Приемлемые результаты начинаются уже с использованием 4-х центров для каждого диктора.
  4. В режиме опознавания находим расстояние от пробного вектора до изученных во время тренировки центров кластеров. К какому кластеру пробная речь окажется ближе — к такому диктору и относим образец.
  5. Можно экспериментально установить даже некоторый доверительный интервал — максимальное расстояние, на котором может находиться пробный образец от центра кластера. В случае превышения этого значения — классифицировать образец как неизвестный.

Я всегда рад полезным комментариям по поводу улучшения материала. Спасибо за внимание.

Похожие публикации