ПОЗНАВАТЕЛЬНОЕ Сила воли ведет к действию, а позитивные действия формируют позитивное отношение Как определить диапазон голоса - ваш вокал
Игровые автоматы с быстрым выводом Как цель узнает о ваших желаниях прежде, чем вы начнете действовать. Как компании прогнозируют привычки и манипулируют ими Целительная привычка Как самому избавиться от обидчивости Противоречивые взгляды на качества, присущие мужчинам Тренинг уверенности в себе Вкуснейший "Салат из свеклы с чесноком" Натюрморт и его изобразительные возможности Применение, как принимать мумие? Мумие для волос, лица, при переломах, при кровотечении и т.д. Как научиться брать на себя ответственность Зачем нужны границы в отношениях с детьми? Световозвращающие элементы на детской одежде Как победить свой возраст? Восемь уникальных способов, которые помогут достичь долголетия Как слышать голос Бога Классификация ожирения по ИМТ (ВОЗ) Глава 3. Завет мужчины с женщиной
Оси и плоскости тела человека - Тело человека состоит из определенных топографических частей и участков, в которых расположены органы, мышцы, сосуды, нервы и т.д. Отёска стен и прирубка косяков - Когда на доме не достаёт окон и дверей, красивое высокое крыльцо ещё только в воображении, приходится подниматься с улицы в дом по трапу. Дифференциальные уравнения второго порядка (модель рынка с прогнозируемыми ценами) - В простых моделях рынка спрос и предложение обычно полагают зависящими только от текущей цены на товар. | Средний уровень спектра речи и динамический диапазон разговорной речи Речевые сигналы ограничены частотным диапазоном 100 — 10000 Гц и уровнями от 50 до 80 дБ. При этом основные голосовые тоны составляют диапазон частот 100 — 250 Гц. Энергия гласных фонем сосредоточена главным образом в диапазоне 200 — 1500 Гц, а энергия согласных звуков — в диапазоне 1000 — 6000 Гц. На частотах 200—1000 Гц содержится максимальная энергия звуков речи (гласные звуки), которая уменьшается примерно по 5 — 8 дБ на октаву при расширении речевого диапазона частот от 100 до 6000 Гц (см. рис. 21). Фонемы отличаются не только по частотному составу, но и по уровню; гласные фонемы имеют большую интенсивность, чем согласные. Различия уровней гласных и согласных звуков достигают 25 — 30 дБ. Интенсивность речи обычно выражают через условный эквивалентный уровень, время суммирования которого составляет не менее 60 с (Р. Герлих, 1960). Средний или эквивалентный уровень речи может быть приближенно определен с помощью прецизионного шумомера измерением в режиме «быстро» или «медленно» с усреднением регистрируемых максимальных значений (соответственно за вычетом 3 дБ или с добавлением 2 дБ). Пиковые амплитуды изменения речи приблизительно на 12 дБ выше, а минимальные «провалы» примерно на 18 дБ ниже среднего уровня речи. Диапазон изменения УЗД звуков речи в среднем равен 30 дБ. Наибольшие отклонения мгновенных пиковых значений обнаруживаются на более высоких частотах. Так, для области средних частот наибольшие различия между максимальными и минимальными мгновенными значениями уровня речи составля- 100 200 500 1000 2000 5000 10000 Частота, Гц :••- Рис. 21. Область звуков речи и средний уровень спектра речи "''''. ют приблизительно 14—16 дБ, а для частот 2000 — 4000 Гц они достигают 30 — 35 дБ (Г.Фант, 1970). Разборчивость речи Распознавание речи, как следует из многочисленных экспериментальных и теоретических исследований, по-видимому, происходит последовательно в два этапа. Сначала слуховая система осуществляет перевод простых физических или акустических признаков речевого сигнала в дискретный ряд фонем. На втором этапе происходит непосредственный перевод фонем в языковую единицу (А. И. Соловьева, 1972; Н.А-Позин и др., 1972; И.А.Вартанян, 1978). Чтобы речь была услышана, ее уровень должен быть выше порога слышимости или порога обнаружения. Только в этом случае слушающий начинает различать отдельные слова. Основным методом количественной оценки разборчивости речевых сигналов является артикуляционный метод, согласно которому определяют количество слогов, слов или предложений, произнесенных диктором или записанных на магнитный носитель и правильно повторенных слушателем. Разборчивость речи выражают через коэффициент разборчивости или в процентах. Многочисленными экспериментами установлено, что с повышением интенсивности речевых сигналов их разборчивость повышается. Пороги разборчивости зависят как от фонемного состава речевого материала и количества слогов в слове, так и от частоты их употребления, а также от наличия и характера шумовой помехи. Разборчивость речи зависит не только от морфологических, синтаксических и лингвистических особенностей речевого материала, но также и от акустических условий и других физических факторов, влияющих на качество звука и его воспроизведение. Оценка спектрального состава, а также амплитудных соотношений периодических звуков — наиболее важный ключ для распознавания речи. Хотя речевые сигналы содержат частоты от 500 до 10000 Гц, однако в реальных условиях человек обычно воспринимает их в более узком диапазоне частот. Так, при разгово-I ре по телефону достаточно высокая разборчивость речи обеспечивается при сохранении только части частотного диапазона, на-| пример от 300 до 3500 Гц. Эксперименты по разборчивости речи, пропущенной через I фильтры низких и высоких частот, позволили установить влияние различных участков частотного диапазона на качество звучания речи и разборчивость (Д. Ликлайдер, Д.Миллер, 1963; М.М.Эф-| русси, 1975). Результаты этих исследований показали, что частоты выше 3400 Гц практически не вносят вклада в разборчивость, поскольку диапазон частот от 100 до 3400 Гц обеспечивает более 90 % разборчивости речи. На разборчивость речи влияют также ее амплитудные ограничения. Типичным амплитудным искажением является клиппиро-вание звуковых сигналов. При этом если ограничение пиковых амплитуд сигнала составляет 0 —20 дБ от их максимальных значений, то разборчивость речи уменьшается незначительно и снижается до 90 — 96 % по сравнению с разборчивостью речи без клип-пирования. Если же амплитуды речевого сигнала ограничиваются от 20 до 50 дБ, то разборчивость речи снижается до 70 % и остается на этом уровне практически до бесконечного клиппирования (Д.Ликлайдер). При этом форма сигнала становится практически прямоугольной с различными длительностями и интервалами между импульсами. Один из видов амплитудных искажений — центральное ограничение речевого сигнала: форма пиковых значений сигнала сохраняется, но исключается информация о местах и времени пе- ресечения звуковой волны с центральной осью. Именно такие виды искажений вызывают резкое снижение разборчивости речи. Однако наибольшее ее снижение происходит при суммации разных видов амплитудных искажений. На форму речевого сигнала также влияет время реверберации, определяемое акустическими условиями помещений. С его повышением, начиная от 0,4 до 5 с, разборчивость речи снижается. Так, при увеличении времени реверберации от 2 до 8 с разборчивость речи понижается от 60 до 20 %. Помимо указанных факторов на разборчивость речи влияет также скорость воспроизведения или произнесения говорящим слогов или слов. Нормальная скорость воспроизведения речи составляет 100—140 слогов в минуту; разборчивость заметно снижается, если скорость воспроизведения достигает 180 — 200 слогов в минуту. Искажения возникают, если не совпадают скорость воспроизведения и скорость записи. При этом меняется тембровая окраска речевых звуков, что обусловлено изменением спектрального состава речи. Аналогичные искажения речи происходят и при сдвиге спектра речевого сигнала в сторону высоких или низких частот (Ю. В. Крылов и др., 1980; Д.Ликлайдер, Д.Миллер, 1963). Такой вид частотных искажений иногда наблюдается при передаче и приеме речевых сигналов через приемопередающие системы. Линейный сдвиг спектра речи приводит к резкому нарушению ее разборчивости. При этом потеря разборчивости пропорциональна величине сдвига спектра речи. Вопросы и задания 1. Дайте определение понятия «звук». 2. Какую форму имеет звуковая волна? 3. От чего зависят сила и интенсивность звука? 4. На какие группы можно разделить звуки? 5. Дайте определение понятия «область звукового восприятия». 6. В каких единицах принято выражать силу и частоту звука? 7. Дайте определение понятия «слуховая чувствительность». 8. Что такое маскировка? Какой звук является маскирующим? 9. Назовите преимущества бинаурального слуха. 10. Чем отличаются гласные звуки от согласных с точки зрения акустики? 11. Каков частотный диапазон речевых сигналов? Каков диапазон основных голосовых тонов. 12. В каких диапазонах сосредоточена энергия гласных фонем, энергия согласных звуков? 13. От чего зависит разборчивость речи? Глава 3 |