On F0 Declination Studies: History and Nature of the Phenomenon
Table of contents
Share
QR
Metrics
On F0 Declination Studies: History and Nature of the Phenomenon
Annotation
PII
S241377150017818-2-1
Publication type
Article
Status
Published
Authors
Alexander E. Kostyuk 
Occupation: PhD Student at the Philological Faculty
Affiliation: Moscow Lomonosov State University
Address: Russian Federation, Moscow
Pages
104-113
Abstract

The article is devoted to the history of the study of declination in speech since its first references in scientific literature. The article offers a description of some approaches to measuring and analyzing F0 declination. The two most common interpretations of this phenomenon are described, the physiological one and the psychological one.

Keywords
declination, declination line, declination phenomena, pitch, F0
Received
29.12.2021
Date of publication
29.12.2021
Number of purchasers
6
Views
4407
Readers community rating
0.0 (0 votes)
Cite Download pdf 100 RUB / 1.0 SU

To download PDF you should sign in

Full text is available to subscribers only
Subscribe right now
Only article and additional services
Whole issue and additional services
All issues and additional services for 2021
1

  • Введение
  • 2 История подробного изучения деклинационных явлений в речи (об этом термине подробнее см. ниже) в значительной степени связана с задачей автоматического синтеза звучащей речи. Уже в самых ранних подходах к решению этой задачи была поставлена проблема описания и моделирования интонационного контура во всей его полноте и со всеми его интегральными особенностями. Деклинация F0 от начала речевого сегмента к концу оказалась одним из перцептивно значимых для слушателя элементов.
    3 Практические задачи, тем не менее, оказались неразрывно связаны с вопросами теоретическими. Так, открытие и описание явления деклинации F0 в речи привело к возникновению целого ряда работ, посвященных его природе и универсальности. Несмотря на весьма высокую степень теоретической и практической проработанности данной области фонетических исследований, далеко не на все вопросы, связанные с явлением деклинации F0, на данный момент существует однозначный ответ. Тем не менее, рассмотреть хотя бы в общих чертах основные аспекты существующих на данный момент подходов к выделению, анализу и интерпретации деклинационных явлений в речи представляется важной и интересной задачей.
    4

  • Первые деклинационные исследования
  • 5 Первым общую тенденцию к понижению F0 с течением времени произнесения заметил К.Л. Пайк [1]. Пайк выделил более двадцати интонационных контуров для английского языка на основе четырех базовых уровней тона: low, medium, high и extrahigh. Уровень тона определялся на ударных слогах, причем фиксировались только те случаи, когда происходило изменение уровня тона (существенное повышение или понижение F0). В результате описания собранного материала в терминах своей теории Пайк обнаружил тенденцию к понижению уровня F0 от начала предложения к его концу, предложив для данного явления термин “drift”.
    6 В следующий раз к описанию и анализу данной тенденции обратились лишь спустя почти два десятилетия – в работе [2, c. 833–844] Д. Болинджер обратил внимание на “нисходящий интонационный паттернˮ и, на примере материала английского и испанского языков, предположил для него возможный статус языковой универсалии.
    7 В некотором смысле знаковой статьей для дальнейшей истории изучения данного явления можно считать работу [3, с.124–139]. В данной статье авторы не только зафиксировали постепенное понижение F0 от начальной точки сегмента к его концу, но и предложили для него термин деклинацияˮ (declination), в дальнейшем и закрепившийся за данным явлением. В их работе деклинация рассматривалась в первую очередь как удобный концепт в рамках создания мелодической модели нидерландского языка. Для ее описания было предложено ввести специальный конструкт, названный линия деклинацииˮ, который отражал бы общую тенденцию движения F0 от начала речевого отрезка к его концу. Основным и первоочередным вопросом в отношении интонационной модели языка вообще и деклинации в частности для авторов данной работы была перцептивная значимость колебаний F0: изначально предполагалось описывать изменение F0 без какой-либо оглядки на синтаксис или семантику, фиксировать интонацию как таковую и ее возможное восприятие.
    8 Первичность восприятия в процессе описания различных интонационных явлений естественным образом приводит к необходимости глубокого физического анализа описываемого материала. Попытка ограничиться исследованием тонального контура как такового, безусловно, не приведет к созданию полноценной модели, а изучение различных аспектов восприятия естественным образом приводит к исследованию физиологических аспектов и первопричин различных наблюдаемых явлений.
    9 Примерно в одно время с исследованиями [3] появились и первые попытки смоделировать естественное движение F0 искусственным путем, из которых наиболее естественный с точки зрения движения F0 результат был достигнут в работе [4, с. 91–113]. При моделировании интонации достаточно легко задать необходимые точки пиков и падений, которые однозначно релевантны перцептивно, но оставался вопрос: что делать в ситуации, когда на достаточно длительном сегменте высказывания нет никаких явных движений F0? Что представляет из себя “естественный уровень F0ˮ, относительно которого и формируются все перцептивно значимые изменения? Первые ранние модели предлагали в качестве “отправной точкиˮ горизонтальную линию, соответствующую средней естественной высоте F0 говорящего, но данное решение не позволило получить хоть сколь-нибудь удовлетворительный результат. Последовательное изучение различных интонационных контуров показало, что в среднем наблюдается постепенное снижение уровня F0 от начала сегмента к его концу: то самое явление, которое впервые было зафиксировано еще в работе [1]. Таким образом, за естественный “эталонный контурˮ была принята постепенно нисходящая линия, отражающая общее понижение уровня F0 с течением времени, которая в дальнейшем станет повсеместно обозначаться как baseline.
    10 Перцептивная значимость деклинационных явлений в речи становится более чем очевидной при любой попытке автоматического синтеза интонационных контуров: отсутствие склонения звучит очень неестественно. Это может объяснить, почему в ранних программах автоматического синтеза звучащей речи [4] уже были предприняты шаги по моделированию общего постепенного понижения уровня F0 в высказывании, хотя на тот момент концепция деклинации еще не была сформулирована и подробно описана. В программе И.Г. Мэттингли предлагаемый при синтезе аналог деклинации F0 реализуется двумя способами: падения уровня F0 охватывают больший интервал, чем предшествующие им подъемы, так что последовательные резкие пики и падения становятся все ниже от начала сегмента к его концу; а также в тех частях контура, где не происходит ни подъемов, ни спадов, уровень F0 падает очень постепенно. Заметим, что второе положение является перцептивно необходимым: когда нет значительных изменений уровня F0 на длительном отрезке произнесения, отсутствие постепенного снижения вызывает у слушающего тревогу и существенно понижает впечатление естественности.
    11 Таким образом, явление деклинации в современном виде изначально возникло как искусственный конструкт, необходимый исключительно в практических целях: соотнести локальное движение тона со средним уровнем F0 говорящего; однако деклинация быстро стала неотъемлемой частью многочисленных мелодических моделей, а затем и интонационных исследований вообще. Появился целый ряд работ ([5, c. 683-692]; [6]; [7, c. 363–369]; [8, с. 399–440]; [9, с. 1014–1030]), посвященных исследованию различных аспектов явления деклинации, ее корреляции с длительностью высказывания и его синтаксической структурой. В данных работах предполагается, что некоторые параметры деклинации (например, скорость падения или возвращение на базовый уровень тонального регистра, т. н. “resetting”) задаются еще на этапе планирования высказывания, в связи с наличием их корреляции с различными контролируемыми синтаксическими параметрами. Подобная гипотеза приводит к перемещению явления деклинации из категории естественных физиологических неконтролируемых механизмов (в данном случае – связанных с фонацией и уровнем подсвязочного давления) в раздел явлений хотя бы в некоторой мере контролируемых, а, следовательно, связанных с движениями мышечного аппарата гортани.
    12 С учетом наличия большой и когда-то весьма бурной дискуссии вокруг явления деклинации, многочисленных работ с интересными противоречивыми результатами, было бы странно по какой-либо причине продолжать воспринимать ее как прикладной конструкт, а не как сложное лингвистическое явление, заслуживающее подробного изучения. Несмотря на свою кажущуюся простоту, деклинация долгое время была предметом оживленных споров и весьма сложных экспериментальных исследований с целью поставить финальную точку в изучении ее природы.
    13

  • Подходы к измерению и анализу деклинации F0
  • 14 Еще до появления надежных способов измерить F0, общую тенденцию к понижению F0 от начала сегмента к его концу можно было определить даже перцептивно, без использования точных измерительных приборов [1]. Однако далеко не в каждом случае определить наличие деклинации возможно невооруженным глазом. В работе [10, с. 254–273] предлагается считать нижнюю линию деклинации за основу, “референсˮ, относительно которого выстраиваются остальные подъемы и падения F0 в интонационном контуре.
    15 В той или иной форме представление тонального контура в виде суперпозиции локальных подъемов и спадов F0 на нисходящей деклинационной линии (или между двумя нисходящими деклинационными линиями, в зависимости от используемой модели) оказалось применимо при изучении интонации на материале различных языков: американский английский [11]; [12, с. 985–995], британский английский [13, с. 54–58], французский [14, с. 236–263]; [15, с. 1319–1332], японский [16, с. 133–136], датский [9], шведский [17], русский [18, с. 1–5]. Еще в работе [19, с. 47–62] отмечалось, что в некоторых тоновых языках также наблюдается явление, названное автором “downdrift”, не связанное непосредственно с тоновой структурой языка и в целом весьма напоминающее деклинацию. В дальнейшем появились исследования на материале китайского языка [20, с. 67–74], в которых действительно было зафиксировано наличие ожидаемых деклинационных явлений.
    16 Вероятно, первая попытка установить эмпирическое правило для описания наклона (нижней) деклинационной линии была предпринята в работе [11]. Автор отметил, что для одного диктора конечный уровень F0 в каждом из его высказываний приблизительно идентичен. Далее он заметил, что разница между начальными и конечными значениями F0 (т.н. “onset” и “offset” соответственно) примерно постоянна независимо от длительности произнесенного фрагмента (которая варьировалась между 1,7 и 2,8 с). Следовательно, уровень (r) деклинации становится больше при уменьшении длительности произносимого фрагмента. Формула, которую привел в своей работе С. Маэда, выглядит следующим образом:
    17 r = Δ̅F/t,
    18 где Δ̅F – среднее значение для каждого диктора (около 20–30 Гц для большинства мужских голосов). До этого в работе по синтезу интонации [21, с. 53–60] были предложены две формулы, которые не вычисляют уровень деклинации отдельно, но, тем не менее, включают уровень деклинации в общее описание тонального контура. В уже упоминавшейся статье [22, с. 177–192] использовался простой подсчет процента падения уровня F0 за единицу времени.
    19

  • Физиологические механизмы деклинационных явлений
  • 20 Ранее в ряде работ утверждалось, что явление деклинации представляет собой, в сущности, искусственный конструкт, не присутствующий непосредственно в человеческой речи – движение F0 в большинстве случаев можно описать как колебания между двух пограничных линий деклинации, ограничивающих подъем тона на пиках и падения на безударных слогах, но в абсолютном большинстве случаев интонационные контуры не бывают линейными. Выше мы уже разобрали наиболее значимые контраргументы к этой позиции, наиболее ранним и подробным из которых, по мнению автора, может служить монография [11]. Отметим, однако, что помимо систематического наблюдения деклинационных явлений в человеческой речи, линия деклинации может быть найдена даже в звуковых последовательностях, издаваемых приматами – это явление было обнаружено и описано в работе [23, с. 363–369]. Данное открытие является весомым аргументом для дальнейшего изучения деклинационных явлений, однако причина возникновения подобных явлений в речи до сих пор является предметом оживленной научной дискуссии.
    21 Естественная тенденция уровня F0 к постепенному падению с течением времени должна проистекать из какого-то особого свойства механизма, который регулирует скорость вибрации голосовых складок. Можно предположить, что это свойство является особым в том смысле, что его эффект проявляется независимо от действия тех компонентов механизма, которые отвечают за локальные подъемы и спады F0.
    22 По сравнению с обычным дыханием речепорождение требует увеличения продолжительности выдоха. Это возможно благодаря активности внешних межреберных мышц, необходимой для предотвращения обычно довольно быстрого уменьшения размеров грудной полости [24, с. 141–151]. Однако из-за расхода воздуха уровень подсвязочного давления PS быстро понижается, так что фонация становится невозможной. В качестве контрмеры говорящий уменьшает грудную полость, просто расслабляя внешние межреберные мышцы. Очевидно, баланс между уменьшением PS и данной контрмерой таков, что постепенное понижение уровня PS остается, однако скорость его существенно замедляется. Поскольку, при прочих равных условиях, уровень F0 пропорционален падению давления в надгортанной области, а давление внутри ротовой полости при этом постоянно (при усреднении по сотням миллисекунд), уровень F0 пропорционален PS.
    23 Согласно имеющимся физиологическим данным, этот компонент контроля уровня F0 и другой, т.е. степень напряжения голосовых складок, имеют уникальные, не пересекающиеся обязанности: В первом приближении, постепенное снижение Ps отвечает за феномен деклинации, тогда как мускулатура гортани регулирует контролируемое напряжение голосовых складок, которое вызывает резкие подъемы и падения F0.
    24 Хотя неясно, почему в речи баланс, упомянутый выше, таков, что уровень F0 все же медленно понижается (в конце концов, человек во время пения может легко поддерживать постоянную высоту тона в течение значительного времени), данная модель все же достаточно проста. Тем не менее, она объясняет наблюдения, отмеченные в работе [25, с. 249–255]: в двух фрагментах, содержащих относительно длинный отрезок несущего тона, скорость падения уровня F0 хорошо коррелировала со скоростью снижения PS, поскольку отношение ΔPS / ΔF0 соответствовало общепринятому значению 1/5 [24]. Мышечная активность гортани в этих высказываниях не коррелировала каким-либо прямым образом с наблюдаемым уровнем деклинации.
    25 Остановимся подробнее на исследованиях Р. Коллье. В своей работе [25] он предлагает подробный анализ физиологической стороны интонационных явлений в речи, при этом значительная часть работа посвящена поиску физиологического коррелята деклинационных явлений.
    26 Эксперимент Коллье по изучению влияния уровня подсвязочного давления и активности мышечного аппарата гортани на частоту вибрации голосовых связок выглядел следующим образом: подсвязочное давление измерялось напрямую с помощью катетера между перстневидным и щитовидным хрящами; активность сокращения перстнещитовидной мышцы (а также грудино-подъязычной, грудино-щитовидной и щитоподъязычной мышц) измерялась с помощью подключенных эл щитовидным хрящами; активность сокращения перстнещитовидной мышцы (а также грудино-подъязычной, грудино-щитовидной и щитоподъязычной мышц) измерялась путем подключения специальных электродов. Согласно полученным в результате измерений данным, изменение F0 наиболее явным образом коррелировало именно с изменением активности сокращения перстнещитовидной мышцы: ее сокращение вызывало повышение F0, в то время как при ее расслаблении наблюдалось общее понижение F0. Следует отметить, однако, что подсвязочное давление Коллье назвал именно тем фактором, который отвечает за характер движения bottom line и плавное понижение F0 от начала сегмента к концу, т.е., фактически, отвечает за деклинацию.
    27 Взаимосвязь двух основных физиологических коррелятов интонации при речепорождении была сформулирована Коллье в следующим образом: постепенное понижение F0 определяется плавным понижением подсвязочного давления, в то время как все контролируемые отклонения от деклинационной линии (подъемы и падения F0) вызваны сокращениями перстнещитовидной мышцы. Коллье отмечал, что, несмотря на отсутствие у него каких-либо данных о влиянии других мышц гортани на интонационный контур (в исследовании [25] экспериментальным путем их влияние зарегистрировано не было), он не отрицает возможность их участия в формировании интонационного контура; кроме того, потенциально возможны и другие модели порождения интонации, которые не были зафиксированы ввиду отсутствия соответствующего исходного материала. Тем не менее, комбинация подсвязочного давления и сокращения перстнещитовидной мышцы считаются основными физиологическими коррелятами изменения F0.
    28 Схожий результат был зафиксирован в работе [11], где С. Маэда предложил свой вариант простой модели речепорождения, учитывающей существование деклинационных явлений. В его данных скорость понижения F0 была больше, чем можно было объяснить предполагаемым (но не измеренным) снижением PS. Поэтому Маэда предположил дополнительную, механическую связь между уменьшением объема легких и деклинацией: сокращающиеся легкие постепенно оттягивают вниз трахею, и это движение трахеи вызывает поворот перстневидного хряща, что приводит к постепенному сокращению голосовых складок и, следовательно, к постепенному снижению скорости их вибрации. Маэда проверил свою гипотезу об оттягивании трахеи на двух различных высказываниях и не нашел причин от нее отказаться.
    29 Гипотезы в [25] и [11] сходятся в том, что феномен деклинации приписывается особенностям дыхательной системы. Электромиографические данные, полученные этими авторами в данных исследованиях, не содержат никаких указаний на то, что мускулатура гортани каким-либо образом участвует в контроле явления деклинации.
    30 Однако изучение физиологической основы деклинационных явлений было далеко от своего завершения. Дальнейшие исследования Коллье привели к появлению работы [26, с. 354–360], которая целиком посвящена исследованию непосредственно тех физиологических явлений и закономерностей, которые обуславливают наличие деклинационных явлений в речи. Следует отметить, что к этому моменту “деклинацияˮ вполне устойчиво закрепилась в многочисленных работах не только как термин, обозначающий некоторый удобный рабочий конструкт в прикладных исследованиях, но и как вполне естественная особенность речепорождения, присущая каждому интонационному контуру [10]. В связи с этим возникла необходимость исследования и описания физиологической природы данного явления, дать объяснение причинам его появления.
    31 На тот момент большая часть работ (включая [25]) основное внимание уделяла исследованию контролируемых изменений F0 в интонационном контуре, т.е. подъемам и падениям, которые могут порождаться говорящим совершенно сознательно. Данные изменения, как было неоднократно показано ранее [24], обусловлены изменением напряжения голосовых связок, что, в свою очередь, реализуется путем сокращения или расслабления перстнещитовидной мышцы (а также ряда других мышц гортани, хотя и в значительно меньшей степени [25]). При этом изменение подсвязочного давления играет крайне малую роль в резких скачкообразных изменениях F0 [27, с. 211–222]; [28, с. 5–39]. С другой стороны, постепенное снижение F0 от начала сегмента к его концу могло объясняться в первую очередь именно динамикой изменения подсвязочного давления, хотя работ, посвященных изучению физиологической стороны именно деклинационных явлений в речи, на тот момент не было. Работа [26] целиком направлена на исследование и заполнение этой лакуны в области фонетических исследований.
    32 Исследование проводилось на материале сконструированных отдельных высказываний длинной от 5 до 18 слогов (длительность каждого сегмента, таким образом, варьировалась в диапазоне от 0.7 до 3 секунд). В каждом высказывании было не более двух акцентов (маркированных восходяще-нисходящим тоном), остальная часть должна была быть максимально близка к деклинационной линии F0. При произнесении стимульного материала у испытуемого измеряли следующие показатели: подсвязочное давление Ps (с помощью пункции трахеи над первым трахейным кольцом), мышечную активность перстнещитовидной и грудино-подъязычной мышц (с помощью электродов) по алгоритму [29, с. 70–83].
    33 В результате исследования Коллье была получена строгая корреляция F0 и Ps: на всех высказываниях наблюдалось практически идентичное изменение значений за исключением участков с резкими скачкообразными изменениями (т.е. с сознательной акцентуацией). Таким образом, взаимосвязь подсвязочного давления и деклинации F0 была однозначно подтверждена, а изменение подсвязочного давления оказалось основным физиологическим фактором, отвечающим за изменение F0.
    34 Однако полученные Коллье точные значения Ps свидетельствовали о том, что, являясь основной причиной деклинационных явлений, уровень подсвязочного давления при этом не мог быть причиной единственной. Согласно вычислениям, представленным в [30, с. 1271–1275], величина Ps/F0 должна лежать в диапазоне между 1/3 и 1/7, если это единственный влияющий на деклинацию фактор, при этом в части результатов из [26] значения доходят до 1/11. Таким образом, необходимо найти другие факторы, которые могут быть причиной возникновения деклинационных явлений. Сокращение или расслабление перстнещитовидной и грудино-подъязычной мышц при деклинационных изменениях F0 наблюдалось, но недостаточно последовательно. Коллье предположил, что деклинация возникает не только как побочный продукт дыхательного процесса в результате изменения давления, но и частично обусловлена сокращениями мышечного аппарата гортани, однако однозначно определить все ответственные за это факторы ему не удалось.
    35

  • Психологическая мотивация деклинационных явлений в речи
  • 36 В 1977 году в работе [31] постулируется гипотеза, что деклинация регулируется все-таки именно мышечным аппаратом гортани. Предлагаемые там рассуждения выглядят следующим образом: скорость деклинации F0 заранее запрограммирована говорящим, который использует стратегию предвосхищения, принимая во внимание длину высказывания и его синтаксическую структуру; следовательно, деклинация является частью лингвистического кода. Поскольку все лингвистически значимые различия уровня F0 осуществляются с помощью мышц гортани, склонение также должно контролироваться этими мышцами. Эта гипотеза, безусловно, противоречит наблюдениям о взаимосвязи постепенного понижения уровня подсвязочного давления PS и уровня F0, однако гипотеза о программировании деклинации и ее лингвистической природе не лишена смысла.
    37 Ряд исследований, видимо, подтверждает гипотезу о том, что уровень деклинации заранее программируется говорящим. В работе [32] было обнаружено, что для перцептивной идентичности уровня F0 на двух пиках в одном интонационном контуре, содержащем ровно два таких пика, второй должен быть несколько ниже первого; только тогда они воспринимаются слушающим как одинаковые. Это может быть интерпретировано как указание на наличие общего знания у говорящего и слушающего о постепенном снижении уровня пиков для произвольного высказывания. Результаты в [9] указывают на очень специфическую форму предварительного программирования: в датском языке угол наклона линии деклинации зависит от категории предложения. Он наиболее большой для утвердительных предложений, меньше в синтаксически маркированных вопросах и практически нулевой в синтаксически немаркированных вопросах. Поскольку такие лингвистические различия, по-видимому, закодированы в самой деклинации, трудно понять, как их можно объяснить автоматическим побочным продуктом регуляции дыхания во время речи.
    38 Не обращая внимания на причины явления деклинация, и принимая во внимание деклинацию только на акустическом и перцептивном уровне, в [8] из связи между уровнем наклона деклинационных линий и длительностью произносимого фрагмента выводится психологический подтекст о наличии механизма предвосхищения со стороны говорящего. По их мнению, отличному от гипотезы С. Маэда [11], от длительности произнесения зависит не только угол наклона деклинационных линий, но и начальное значение F0 (onset): при длинном предложении говорящий начинает с более высокого уровня F0, чем при произнесении короткого предложения. В работе, однако, есть замечание, что механизм предвосхищения не всегда работает безупречно в спонтанной речи.
    39 Другое следствие вырисовывается, если, как это сделано в работе [8], задаться вопросом, в какой области говорящий применяет деклинацию. Учитывая, что синтаксическая единица, на которую распространяется деклинация, не обязательно должна быть полным предложением, можно предположить, что особенно длинные предложения делятся на две или более частей, каждая из которых имеет свою собственную деклинационную линию. Наиболее подходящими кандидатами на такие части являются клаузы. Поэтому на границах клауз следует ожидать наличие ресета (“reset”, деклинационный сброс). В [5] высказывается более конкретное предположение, что это может произойти на границе двух клауз, соединенных сочинительной связью, но не между основной и вложенной клаузами. Тогда авторы не нашли никаких доказательств этой гипотезы, но в работе [8] они постарались проверить ее валидность.
    40 Сначала они определяют “полный сбросˮ (“complete resetting”) как случай, когда все клаузы имеют идентичную деклинационную линию, с одинаковым углом наклона и начальными значениями вершин. Это было бы наиболее очевидно при сравнении значений уровня F0 пика перед границей (Pk) и пика на слове, следующем за границей (Pk+i). Последний должен быть значительно выше первого, фактически на том же уровне, что и самый первый пик в предшествующей клаузе. Купер и Соренсен заметили, что при соединении клауз сочинительной связью они действительно наблюдали это свидетельство сброса верхней деклинационной линии. Однако при этом они отмечали, что более высокое значение уровня F0 для Pk+i может быть вызвано дополнительной акцентуацией этого слова и в отсутствие сброса.
    41 Кроме того, может произойти “частичный сбросˮ (“partial resetting”): во второй клаузе начинается новая деклинационная линия, но с меньшим углом наклона и/или меньшим начальным значением. В последнем случае также прогнозируется, что Pk+i будет выше, чем Pk, но ниже, чем первый пик в первой клаузе.
    42 В [8] также предлагается улучшенный тест на сброс: несколько пиков перед границей основной клаузы должны быть сравнены с их аналогами после границы, и в каждой подобранной паре второй пик должен быть таким же высоким, как и первый. В работе [6] проводится вариант такого улучшенного теста с двумя совпадающими парами предложений. В одном предложении четыре последовательных пика принадлежат одной и той же синтаксической составляющей; в другом первый пик возникает перед границей главной клаузы, тогда как три следующих – в начале второй. Согласно гипотезе, последние три пика должны быть систематически выше своих аналогов. Предсказание подтвердилось для первых двух пиков, следующих за границей, но не для третьего. Поэтому Купер и Соренсен отвергли сильную версию своей гипотезы.
    43 В работе [33, с. 187–220] на датском материале была показана зависимость угла наклона линии деклинации от типа высказывания: наиболее ярко ее падение было заметно в повествовательных предложениях, в то время как для вопросов она зачастую была практически горизонтальной. Наличие вариативности в значениях угла наклона деклинационной линии позволяет поставить под сомнение ее исключительно физиологическую природу и предположить наличие возможного контроля над деклинационными явлениями со стороны говорящего (в том числе и несознательного). В дальнейшем в работе [34, с. 403–321] была продемонстрирована корреляция некоторых параметров линии деклинации с различными языковыми явлениями: так, например, наклон линии деклинации зависит от длины высказывания, “обнуляясьˮ на границе синтаксической составляющей (т.е. нижняя точка линии деклинации обнаруживается на последнем слоге составляющей, и для каждой составляющей методологически верно строить новую линию деклинации, явление Reset). Таким образом, согласно Коллье, можно говорить о формировании линии деклинации на этапе планирования высказывания.
    44 Следует заметить, что в большинстве работ, посвященных изучению деклинационных явлений, использовалось в качестве материала так называемая подготовленная звучащая речь, т.е. подготовленное чтение текста. Однако исследования на материале спонтанной звучащей речи (т.е. неподготовленного речепорождения) также показали наличие в ней соответствующих деклинационных явлений [35, с. 838].
    45 Среди более современных исследований подготовленного речепорождения можно отметить работу [20], посвященную изучению деклинации F0 в речи дикторов новостных программ на английском и китайском (мандаринском) языке. Результаты подтверждают наличие зависимости между длиной высказывания и углом наклона линии деклинации (впервые отмеченной еще в работе [33]): для коротких высказываний характерно более резкое падение, даже если не учитывать начальный подъем и конечное падение (так называемые краевые явления, описанные еще в работе [36]). Начальная (максимальная) точка деклинационной линии расположена тем выше, чем длиннее предложение, в то время как уровень конечной (минимальной) точки не зависит от длины предложения [37, с. 71–82]. Кроме того, деклинация проявляется как на bottom line, так и на top line. Отдельно следует заметить, что, в то время как для английского языка характерна схожая структура верхней и нижней деклинационных линий, для китайского (мандаринского) языка обнаруживаются некоторые различия. Кроме того, угол наклона для китайского (мандаринского) языка больше (т.е. более резкое падение), чем для английского, а тональный диапазон говорящего более широкий. Как следствие, авторы данного исследования предполагают, что деклинационные явления обусловлены не только физическими и физиологическими явлениями, но также контролируются лингвистически, т.е. являются в определенной степени произвольными и варьируются в зависимости от языка говорящего.
    46 Еще одно свидетельство в пользу лингвистического контроля явления деклинации F0 приводится в работе [18]. Данная работа была выполнена на материале русскоязычного корпуса CORPRES (Сorpus of Russian Professionally Read Speech), который включает в себя более 60 часов записанной звучащей речи 8 информантов в различных разговорных стилях, аннотированной на шести различных уровнях просодической и фонетической разметки (включая различные дополнительные метаданные). В результате анализа корпусных данных было получено статистическое подтверждение зависимости между углом наклона линии деклинации F0 и длиной высказывания для русского языка: чем короче высказывание, тем больше угол наклона. Кроме того, была обнаружена последовательная корреляция между углом наклона линии деклинации и интонационной структурой высказывания: так, на финитных единицах угол наклона был больше, чем на нефинитных; для общих вопросов с повышением тона в ядерной части характерно отсутствие деклинации в преядерной части. Также имеющийся материал позволил выдвинуть гипотезу о наличии индивидуальных стратегий выбора угла наклона линии деклинации на этапе планирования высказывания. Данные результаты представляют собой дополнительный аргумент против исключительно физиологического подхода к анализу деклинационных явлений в интонации. Следует отдельно заметить, что в работе [18] в качестве линии деклинации использовалась top line (“линия платоˮ), в отличие от большинства других исследований.
    47 В исследовании [38] были построены линии деклинации для детской речи в возрасте 9 месяцев (переходная стадия от детского лепета к первым словам) и 36 месяцев (стадия усвоения грамматики и построения простых предложений) для одних и тех же детей. В эксперименте использовались независимые переменные “возрастˮ и “коммуникативная ситуацияˮ. В качестве значений для второй переменной использовались ситуации произвольного лепетания и “речепорожденияˮ при контакте со взрослыми. В качестве гипотезы было выдвинуто предположение, что в свободном детском лепете явление деклинации будет отсутствовать в связи с полной его произвольностью и отсутствием каких-либо ограничений, в том числе и по фонации, так как зачастую совершенно естественным является переход от скрипучего голоса к крику; в свою очередь, при контакте со взрослыми должны были быть зафиксированы некоторые случаи появления деклинационных явлений. Кроме того, предполагалось, что деклинационные явления связаны с усвоением языка ребенком, и поэтому непосредственно коррелируют с возрастом, проявляясь все отчетливее у более взрослых детей. В целом гипотеза статистически подтвердилась – наличие и отчетливость деклинационных явлений оказались напрямую связаны как с параметром возраста, так и с текущей коммуникативной ситуацией. Таким образом, была сформулирована следующая зависимость: чем больше ребенку требуется контроля над своим речепорождением (коммуникативная ситуация), или чем выше его собственный уровень контроля речепорождения (повышающийся непосредственно при усвоении языка), тем более частотны в его речи деклинационные явления. В дальнейшем, данные предположения также подтвердились в работе [39], где были исследованы группы детей в возрасте от 9 до 48 месяцев, и также была обнаружена зависимость между освоением просодических речевых стратегий и частотой деклинационных явлений в речи. Данный вывод также является важным аргументом в пользу “деклинационной теорииˮ.
    48

  • Заключение
  • 49 Независимо от нашей интерпретации природы явлений, обуславливающих наличие в речи тенденции к постепенной деклинации F0 от начала речевого отрезка к его концу, мы не можем отрицать их существование и, насколько это известно на данный момент, в определенной степени универсальный характер. Современная фонетика прошла долгий путь от первого упоминания термина “drift” до сложных компьютерных моделей синтеза речи, где деклинация F0 является неотъемлемой и очевидной частью относительно естественно звучащего речевого сигнала. На протяжении многих лет интерес к деклинационным явлениям независимо возникал в совершенно разных коллективах исследователей в связи с появлением новых теоретических задач и гипотез. Но, несмотря на уже весьма высокую степень проработанности данной области фонетической науки, деклинационные исследования все еще не достигли той степени завершенности и полноты, которую можно было бы назвать убедительным итогом. В этой области еще много вопросов, не только не получивших ответа, но и даже не поставленных, что позволяет надеяться на появление новых значительных исследований этой проблематики в будущем.

    References

    1. Pike K.L. The intonation of American English. University of Michigan. Ann Arbor, 1945. 200 p.

    2. Bolinger D.L. Intonation as a universal. Proc. IXth Int. Congr. Linguists, Cambridge, 1962. Pp. 833–844.

    3. Cohen A, ‘t Hart J. Perceptual analysis of intonation patterns. Proc. Vth ICA, Liège, 1965. V. 16. P. 124–139.

    4. Mattingly I.G. Synthesis by rule of prosodic features. Lang. Speech. 1966. V. 2. P. 91–113.

    5. Cooper W.E., Sorensen J.M. Fundamental frequency contours at syntactic boundaries. J. acoust. Soc. Am. 1977. V. 62. P. 683–692.

    6. Cooper W.E., Sorensen J.M. Fundamental frequency in sentence production. Springer, New York. 1981. 213 p.

    7. Pierrehumbert J. The perception of fundamental frequency declination. J. acoust. Soc. Am. 1979. V.66. P. 363–369.

    8. Sorensen J.M., Cooper W.E. Syntactic coding of fundamental frequency in speech production; in Cole Perception and production of fluent speech. Lawrence Erlbaum Ass., Hillsdale. 1980. P. 399–440.

    9. Thorsen N. A study of the perception of sentence intonation - evidence from Danish. J. acoust. Soc. Am. 1980. V. 67. P. 1014–1030.

    10. Cohen A., Collier R., 't Hart J. Declination: construct or intrinsic feature of speech pitch? Phonetica. 1982. V. 39. No. 4–5. R. 254–273.

    11. Maeda S. A characterization of American English intonation. PhD thesis MIT Cambridge. 1976. 334 p.

    12. Pierrehumbert J. Synthesizing intonation. J. acoust. Soc. Am. 1981. V.70. P. 985–995.

    13. de Pijper J.R. A melodical model of British English intonation. IPO Annu. Progr. Rep. 1980. No. 15. P. 54–58.

    14. Vaissière J. Perception of intonation. The handbook of speech perception. 2005. S. 236–263.

    15. Delgutte B. Technique for the perceptual investigation of F0 contours with application to French. J. acoust. Soc. Am. 1978. V. 64. P. 1319–1332.

    16. Fujisaki H., Sudo H. Synthesis by rule of prosodic features of connected Japanese. Akadémiai Kiadö, Budapest. 1971. V. 3. P. 133–136.

    17. Bruce G. Swedish word accents in sentence perspective. Glcerup, Lund. 1977. 163 p.

    18. Kocharov D., Volskaya N., Skrelin P. F0 declination in Russian revisited. Proceedings of the 18th International Congress of Phonetic Sciences, TSC for ICPhS. 2015. V. 293. P. 1–5.

    19. Meyers L. Tone patterns in Hausa: a re-analysis of Hausa downdrift. UCLA Working Papers in Phonet. 1974. No. 27. P. 47–62.

    20. Yuan J., Liberman M. F0 declination in English and Mandarin broadcast news speech. Speech Communication. 2014. V. 65. P. 67–74.

    21. Fujisaki H., Nagashima S. A model for synthesis of pitch contours of connected speech. Annu. Rep., Eng. Res. Inst., Fac. Eng., Univ. Tokyo. 1969. No. 28. P. 53–60.

    22. Cohen, A., 't Hart J. On the Anatomy of Intonation, Lingua. 1967. V.19. P. 177–192.

    23. Hauser M.D., Fowler C.A. Fundamental frequency declination is not unique to human speech: Evidence from nonhuman primates. The Journal of the Acoustical Society of America. 1992. V. 91. No. 1. P. 363–369.

    24. Ladefoged P. Linguistic Aspects of Respiratory Phenomena. Ann. N.Y. Acad. Sci. 968. V.155. P. 141–151.

    25. Collier R. Physiological correlates of intonation patterns. The Journal of the Acoustical Society of America. 1975. V. 58. No. 1. P. 249–255.

    26. Collier R., Geifer C.E. Physiological explanations of F0 declination // Proceedings of the Tenth International Congress of Phonetic Sciences. – 1984. – S. 354-360.

    27. Atkinson J.E. Correlation analysis of the physiological features controlling fundamental voice frequency. J. Acoust. Soc. Am. - 1978. - V.63. – P. 211-222.

    28. Ohala J. Production of tone // Tone: a linguistic survey. New York, Academic Press. - 1978. Pp. 5-39.

    29. Harris K.S. Electromyography as a technique for laryngeal investigation. In: C.L. Ludlow and M.O. Hart (Eds.), ASHA Reports: Proceedings of the Conference on the Iîsmîment of Vocal Pathology. 1981. P. 70–83.

    30. Baer T. Reflex activation of laryngeal muscles by sudden induced subglottal pressure changes. J. Acoust. Soc. Am. 1979. V. 65. P. 1271–1275.

    31. Breckenridge J. Declination as a phonological process. Murray Hill, NJ: Bell System Technical Memorandum. 1977.

    32. Breckenridge J., Liberman M.Y. The declination effect in perception. Unpublished paper, available from Bell Laboratories, Murray Hill, NJ. 1977.

    33. Thorsen N. Standard Danish sentence intonation – Phonetic data and their representation. Folia Linguistica. 1983. V. 17. No. 1–4. P. 187–220.

    34. Collier R. F0 declination: The control of its setting, resetting, and slope // Laryngeal function in phonation and respiration. 1991. P. 403–421.

    35. Remez RE., Rubin P.E., Ball S. Sentence intonation in spontaneous utterances and fluently spoken text. The Journal of the Acoustical Society of America. 1985. V. 77. No. S1. P. 838.

    36. Pierrehumbert J. The phonology and phonetics of English intonation. Massachusetts Institute of Technology. 1980. 401 p.

    37. Krivnova O.F. Sostavlyayuschaya nesuschego tona v strukture melodicheskoj krivoj frazy // Issledovaniya po strukturnoj i prikladnoj lingvistike. M.: Izd-vo Moskovskogo Universiteta, 1975. S. 71–82. [Krivnova, O.F. Sostavlyayushchaya nesushchego tona v strukture melodicheskoj krivoj frazy [F0 Baseline in the Structure of Melodic Curve of a Phrase]. Issledovaniya po strukturnoj i prikladnoj lingvistike [Studies on Structural and Applied Linguistics], Moscow, MSU Publ., 1975, pp. 71–82. (In Russ.)].

    38. Konopczynski G. F0 Declination Line: New Evidence From Infants and Children's Speech (9-36 Months), a Preliminary Research. Intonation: Theory, Models and Applications. 1997. P. 199–202.

    39. Dodane C. Fo declination line: more evidence from infants'and children's speech (9-48 months). San Francisco. 1999. P. 2161–2164.

    Comments

    No posts found

    Write a review
    Translate