Фольклор и упрек: опыт сентимент-анализа на базе конструкций
Фольклор и упрек: опыт сентимент-анализа на базе конструкций
Аннотация
Код статьи
S160578800021458-9-1
Тип публикации
Статья
Статус публикации
Опубликовано
Авторы
Шмурак Роман Ильич 
Аффилиация: Московский педагогический государственный университет
Адрес: 119991, РФ, Москва, улица Малая Пироговская, дом 1, строение 1
Выпуск
Страницы
70-80
Аннотация

Настоящая статья представляет собой пилотный опыт по выявлению упрека в фольклорном материале. Теоретическим ядром работы является представление о том, что упрек, как и все языковые явления, должен иметь формальное выражение в языке. Из чего следует, что упрек можно выявить в тексте на базе его формальных характеристик, опираясь на инструментарий грамматики конструкций, а не только с помощью семантики и контекста. На конкретных примерах демонстрируется эффективность метода, его достоверность и доказательность по сравнению с подходами, опирающимися на контекст и прагмалингвистическое содержание. Таким образом, перед исследованием стояло две задачи.

Во-первых, эксперимент по проведению сентимент-анализа в условиях отсутствия на момент написания статьи академического корпуса фольклорных текстов. Хотя объем фундаментальных изданий фольклорных текстов более чем значителен, закономерное отсутствие в таких текстах специализированной лексико-грамматической разметки, позволяющей создавать неоднородные по структуре корпусные запросы, возвращает исследователя к ручной обработке фольклорного материала без надежды на автоматизацию процедуры. В то же время, существование распознанных электронных текстов позволяет делать точные запросы с помощью интерфейса программ по редактированию и чтению документов в форматах PDF и DJVU.

Во-вторых, демонстрируется сам метод выявления упрека на базе конструкций и результаты применения этого метода в виде конкретных примеров реализации упрека в фольклорных текстах. Разбираются преимущества и недостатки работы с точными запросами на примере программ PDF-Xchange и DJVU-reader. Предлагается анализ полученных результатов, а также дискутируются “узкие&8j1; места и перспективы исследований подобного рода.

Ключевые слова
упрек, фольклор, анализ тональности текста, sentiment analysis, конструкция, грамматика конструкций, корпус
Классификатор
Получено
28.09.2022
Дата публикации
28.09.2022
Всего подписок
12
Всего просмотров
340
Оценка читателей
0.0 (0 голосов)
Цитировать Скачать pdf
Доступ к дополнительным сервисам
Дополнительные сервисы только на эту статью
Дополнительные сервисы на весь выпуск”
Дополнительные сервисы на все выпуски за 2022 год
1 I. Введение
2 Не вызывает сколь-нибудь сильного удивления, что, при упоминании конструкций в контексте фольклорного материала, первое, что приходит на ум, – это сказочные формулы, описанные В.Я. Проппом:
3 – “русским духом пахнет”, “пошел стрелок в путь-дорогу”, “стань к лесу задом”, [1, с. 6, 32, 45];
4 – “в некотором царстве”,“ехал близко ли, далеко ли, низко ли, высоко ли, не так скоро дело делается, как сказка сказывается”, “стань передо мной, как лист перед травой” [2, с. 199, 205, 215];
5 – “по щучьему велению”, “в некое время я тебе пригожусь”,“будь опять девицей” [3, с. 44, 51] и т.д.
6 Многие из сказочных формул-клише действительно имеют в своей основе конструкции, в том числе и конструкции упрека, о котором пойдет речь в статье:
7 – “Ах ты, волчья сыть да травяной мешок! Али ты идти не хошь, али нести не можь?” [4, с. 45];
8 – “Куда тебе дураку! Знал бы сидел на печи!” [5, с. 232];
9 – “Эх ты, старая ведьма! Не накормила, не напоила прохожего человека, а уж вестей спрашиваешь!” [6, с. 200];
10 – “Поделом вору и мука!” [7, с. 162] и т.д.
11 Тем не менее, термин “конструкция” используется нами в его грамматическом понимании и речь в работе пойдет не о сказочных формулах-клише.
12 Как явствует из названия, в фокусе внимания статьи находятся конструктивная природа языка, рассматриваемая в контексте взаимоотношений фольклора и упрека. В теоретическом аспекте статья стремится ответить на вопрос, насколько в контексте фольклорного материала применим анализ тональности текста (англ. sentiment analysis), то есть может ли исследователь фольклора при необходимости поставить себе задачу выявить определенный вид эмоций, а в широком смысле и любые семантические поля, и возможно ли это в принципе в условиях отсутствия на момент написания статьи специализированного корпуса русского фольклора. В практическом плане статья демонстрирует возможность решения поставленной задачи инструментарием грамматики конструкций на примере семантического поля упрека. При этом, в задачу настоящей работы не входит изучение фольклора как такового, он представляет собой материал, на базе которого происходит апробация. Упрощенно говоря, мы попытаемся извлечь упрек из массива различных фольклорных текстов с помощью методов грамматики конструкций.
13 Фольклор как разносторонне изученный концепт не нуждается в специальном представлении, в то время как понятия “конструкция” и “упрек” в рамках работы требуют четкой дефиниции во избежание дальнейших терминологических разночтений.
14 II. Конструкция
15 Термин “конструкция”принадлежит понятийному аппарату“грамматики конструкций” (англ. – “construction grammar”), см. [8]; [9]; [10], а также на русском [11]. Мы разделяем точку зрения многих авторитетных лингвистов, рассматривающих язык не как набор отдельных лексем, а как результат сложного взаимодействия различных конструкций между собой [12, с. 48]. Вот как метафорически описывает понятие конструкции О.Н. Ляшевская: «Подобно тому как можно судить о форме и структуре поверхности объекта по тени, которую отбрасывает этот объект, компьютерные лингвисты судят о семантике лексики. Они говорят: “Мы не знаем, что такое значение, но можем предположить, что присутствие тех или иных словоформ в контексте или их конфигураций соотносится с определенным типом значения”» [13, с. 261]. Идея, что существуют некие абстрактные модели, имеющие в языке свои реальные воплощения, позволяет, в свою очередь, предположить возможность выявления в тексте определенных семантических полей на формальной основе, с той или иной степенью автоматизации, без обращения собственно к семантике и контексту. Речь притом идет не о фразеологизированных сочетаниях и их вариантах, а о полноценных конструкциях, реализуемых множеством модификаций, далеко выходящих за пределы вариативности фразеологических единиц. В качестве примера рассмотрим конструкцию упрека “куда + тебе + инфинитив + !”. При самом поверхностном поиске по фольклорным текстам, мы получим следующие ее реализации:
16 – “Куда тебе отнять! Мой муж дюже сильный, с двенадцатью головами!” [5, с. 296]
17 – “Да куда тебе со мной взапуски бегать! Мой маленький брат Заинька и тот тебя далеко за собой оставит!” [5, с. 336]
18 – “Куда тебе мою крепость пробовать? Ты муха передо мной!” [5, с. 282]
19 – “Куда тебе, старому черту, жениться, разве мне, молодцу!” [5, с. 284]
20 – “Куда тебе идти, отвечал убогий, ты еще мал и глуп!” [6, с. 311]
21 – “Куда тебе, дураку, воевать; тебе впору свиньям корм давать!” [7, с. 241]
22 – “Ну, куда тебе еще странствовать! Денег у нас и так нет, что ж ты с собой возьмешь?” [14, с.251].
23 Как можно видеть из представленного примера, концепция конструктивной природы языка действительно позволяет автоматизировать поиск необходимой семантики на начальном этапе, делает этот поиск полностью автономным от контекста, значительно повышает его эффективность. В то же время неизбежно возникает ряд вопросов, без ответа на которые описание метода представляется неполным:
24 1. Как была найдена сама конструкция, по которой осуществляется поиск?
25 2. Какие параметры лежат в основе поиска?
26 3. Каковы ограничения поиска?
27 4. Что понимается в работе под термином “упрек”?
28 Вопросы 1–3 соотносятся с методологией исследования и будут рассмотрены в соответствующем параграфе “Методы”, а сейчас обратимся к упреку как языковому феномену.
29 III. Упрек
30 На настоящее время в отечественной лингвистике не существует однозначного толкования упрека как языкового феномена. Причина этого кроется, во-первых, в большом количестве работ, посвященных упреку и выполненных учеными разных школ и направлений, а во-вторых, в традиционном подходе к упреку с позиций семантики, при котором игнорируются формальные характеристики явления.
31 Поскольку наша работа посвящена “визуализации” упрека через формальную сторону, дефиниция его семантики не является ключевой задачей статьи. Однако, отдавая дань академической традиции, диктующей четко формулировать объект исследования, мы полагаем необходимым выразить нашу точку зрения по этому вопросу.
32 Учитывая разнообразие и значительную конкуренцию существующих определений упрека, мы не считаем целесообразным в рамках статьи ни защищать какое-то одно из них, ни создавать еще одно авторское. В том или ином ключе каждое из этих определений ориентируется на три базовых характеристики: коммуникативную цель, контекст и субъектно-объектные отношения. Основываясь на этих характеристиках, в пределах работы мы будем считать упреком высказывание двухкомпонентной структуры, содержащее в себе обвинительную составляющую (1) и трансляцию субъектом своей эмоциональной уязвленности (2) от вымышленных или реальных действий объекта.
33 Как известно, одной из самых больших слабостей семантического анализа является проблема интерпретации. Проведем в качестве примера мысленный эксперимент. Группа интерпретаторов оценивает семантику одного высказывания. Интерпретатор А говорит, что высказывание является упреком. Интерпретатор B предполагает, что высказывание может быть как упреком, так и другой формой речевой агрессии, например, обвинением. Интерпретатор C абсолютно убежден, что высказывание представляет собой ярко выраженное обвинение. И, наконец, интерпретатор Dсчитает высказывание лишенным семантики упрека и других видов речевой агрессии. Кто же прав? Очевидно, что в условиях эксперимента ответ просто не существует. Для успешной реализации коммуникативной ситуации упрека необходимы не только желание субъекта обвинять и транслировать свою эмоциональную “уязвленность”, но и акцепция – интерпретирование высказывания объектом в качестве упрека. Подход к упреку с позиций грамматики конструкций помогает отчасти нивелировать субъективность интерпретации, но только отчасти. Конечное решение, считать ли упреком пример, полученный в результате поиска по конструкции, остается все же на откуп исследователя-интерпретатора. Однако, даже с учетом погрешностей интерпретации, выдача на конструкцию 70–100% примеров, ассоциированных с упреком, будет доказательством ее регулярности. Выдачи именно таких конструкций мы будем считать упреками в рамках статьи. Подробнее об этом см. [15]; [16]; [17].
34 IV. Методы
35 Как было упомянуто выше, ключевыми вопросами для решения поставленной задачи являются следующие:
36 1. Как была найдена сама конструкция, по которой осуществляется поиск?
37 2. Какие параметры лежат в основе поиска?
38 3. Каковы ограничения поиска?
39 Поскольку описываемый метод является ядром практической части работы, необходимо тезисно остановиться на его базовых положениях.
40 1.
41 Создание конструкции представляет собой классический пример процесса научного поиска. В начале этого пути исследователь не имеет никаких предвзятых представлений о том, как будет выглядеть будущий список конструкций. Исследователь может опираться лишь на чувство языка, присущее ему как носителю. Погружаясь в материал (в нашем случае былины и сказки) исследователь не стремится выписывать упреки, но старается увидеть закономерности тех локусов, в которых были найдены упреки. С течением времени и увеличением опыта это поиск сужается и становится более таргетным. В распоряжении исследователя оказываются фрагменты текста, которые с той или иной степенью достоверности указывают на наличие в исследуемом материале упрека. Эти сигнальные фрагменты – маркеры упрека (выделено нами – Р.Ш.). По аналогии с медицинским пониманием маркера такой фрагмент не гарантирует 100% наличие упрека, а лишь позволяет исследователю “заподозрить” это наличие. Чем надежнее (“специфичнее”) маркер, тем меньше ложноположительных результатов будет в выдаче примеров, и наоборот. Эти характеристики маркера упрека делают его субъективной единицей поиска, в отличие от конструкции, в состав которой такие маркеры обычно и входят. Так, например, в описанной ранее конструкции упрека “куда + тебе + инфинитив + !” маркером в общем виде является “вопросительно-относительное местоимение / наречие + личное местоимение 2 л. ед. ч. Д. п.”. Это не особо специфичный маркер для упрека, кроме того, вне корпуса с лексико-грамматической разметкой задать его параметры невозможно. Но даже сузив маркер до сочетания “куда + тебе”, при вводе в материал мы все равно получим вместе с упреками ряд ложноположительных результатов – примеров с иной семантикой:
42 – “Садись скорей на меня, сказала жар-птица, и полетим, куда тебе надобно; а то баба-яга съест тебя!” [6, с. 229]
43 – “Ну, сынок, вот тебе ключи от всех палат; всюду ходи куда тебе захочется, только не смей заглядывать в одну палату, что заперта двумя замками, золотым да серебряным” [6, с. 252]
44 Следующим шагом будет обнаружение в полученной выдаче закономерности, что “куда + тебе” в сочетании с инфинитивом и восклицательным знаком передает минимум в 90% случаев семантику упрека. Таким образом, на основе выдачи по маркеру может быть спрогнозирована конструкция упрека, которая будет объективной единицей поиска, поскольку в отличие от маркера, порожденного интуицией исследователя, при вводе в лексико-грамматический поиск корпуса, например, НКРЯ [18], такая конструкция позволяет получить конкретные реализации упрека в русском языке. Например:
45 I. Поисковый запрос:
46 куда + тебе + инфинитив + !(куда на расстоянии 1 до 3 от ты, dat на расстоянии 1 до 3 от inf, bexcl) (дата обращения: 14.02.2022)
47 II. Лексико-грамматический поиск:
48 Основной корпус: 20 документов, 20 вхождений / 1 вне семантики упрека
49 Газетный корпус: 3 документа, 3 вхождения / 0 вне семантики упрека
50 Поэтический корпус: 1 документ, 1 вхождение / 0 вне семантики упрека
51 Остальные корпуса: 0 документов.
52 III. Пример реализации в корпусе:
53 Погляди на себя, куда тебе сейчас пить!” [С.Ф. Буданцев. Отчий дом (1928)]
54 IV. Количествовхождений / количествовне семантики упрека:
55 24 вхождения / 1 вне семантики упрека
56 V. Всего упреков:
57 95,8%
58 Представляется, что такой высокий процент упреков в выдаче корпуса доказывает, что перед нами действительно конструкция упрека.
59 2.
60 В основе поиска, представленного в практической части работы, лежат следующие параметры:
61 1) Список маркеров и конструкций упрека, разработанный автором в процессе написания диссертации [22];
62 2) Дефиниция семантики упрека и научные установки, представленные в статье;
63 3) Основным материалом исследования послужили русские былины [4] и сказки [5]; [6]; [7], в качестве дополнительных источников использовались сказки братьев Гримм [14]; [19] и некоторые другие издания.
64 3.
65 Серьезный отпечаток на работу накладывают следующие ограничения поиска:
66 1) Как было отмечено, в настоящее время не существует сколь-либо серьезного академического корпуса русского фольклора. Таким образом, в распоряжении исследователя оказывается относительно ограниченный (по сравнению, например, с массивами Национального корпуса русского языка) объем разрозненных источников. Учитывая исключительно электронный формат поиска, за границами этих источников оказываются материалы с нераспознанным текстом, то есть такие, в которых невозможно осуществлять внутритекстовый поиск. Определенное ограничение на поиск накладывает также авторский отказ от источников иных файловых форматов в пользу PDF и DJVU, программы для которых имеют наиболее продвинутый интерфейс и улучшенный функционал внутритекстового поиска.
67 2) Корпусный поиск, помимо преимущества в объеме и следовательно в репрезентативности данных, обладает для исследований подобного рода и еще одной ключевой характеристикой – возможностью практически в 100% случаев трансформировать искомую конструкцию в поисковый запрос. Это достигается за счет корпусной разметки текстов и поисковой машины корпуса, предоставляющей в распоряжение исследователя возможность создавать неоднородные по своей структуре запросы, учитывать семантические, грамматические, синтаксические и др. характеристики конструкции. Внутритекстовый поиск в программах для форматов PDF и DJVU возможен только по точным словам, что, конечно, значительно суживает поле исследования, не позволяя использовать конструкции как таковые, а лишь их составные части – маркеры упрека.
68 Несмотря на перечисленные ограничения, эффективность и достоверность исследования сложно подвергнуть сомнению.
69 Да, объем источников по сравнению с массивами корпуса не так велик. Однако о недостатке репрезентативности можно поспорить, поскольку речь идет о многотомных академических источниках, авторитетность которых самоочевидна. Кроме того, перед исследованием не стоит цель механически пересчитать все упреки в русском фольклоре. Задача состоит в том, чтобы продемонстрировать метод, с помощью которого упреки могут быть извлечены из фольклорного текста с определенной степенью автоматизации на базе грамматики конструкций. Для решения этой задачи объем не является столь уж ключевым параметром.
70 Да, поиск осуществляется фактически на основе маркеров, что увеличивает количество ложноположительных результатов и должно было бы значительно затруднить работу исследователя по ручному отсеиванию зерен (упреков) от плевел (высказываний с иной семантикой). Однако, во-первых, за счет относительно небольших по сравнению с корпусом выдач, такой отбор в принципе осуществим, а во-вторых, в любом случае представляется в разы более эффективным, чем ручной отбор с карандашом в руках по бумажным источникам, как это происходило до появления корпусов.
71 V. Представление результатов
72 Конструкция где уж + инфинитив
73 1. Реализация в фольклорных текстах
74 – “Ну, ребятушки, вот какова рысь кота да барана! Евстифейка-волка умудрились сшибить и изувечить с какого высокого пня, а нам где уж на земле устоять!” [5, с. 65]
75 – “Где уж нынче правдой жить? Правда-то в лаптях ходит, а кривда в сапогах!” [5, с. 202]
76 – “Где уж тут о работе думать? Лучше погуляем напоследки”. [5, с. 236]
77 – “И то правда, говорит волк, где уж тебе, сестрица, идти, садись на меня, я тебя довезу” [20, с.241]
78 2. Комментарии:
79 Упреки, полученные на конструкцию, делятся на 3 вида: самоупрек (1), “риторический” упрек (2) и упрек со стертым обвинительным компонентом (3).
80 (1) Вектор классического упрека идет от субъекта высказывания к его объекту. В случае самоупрека в качестве объекта упрека выступает сам субъект, другими словами упрек направлен “на себя”. Формально самоупрек легко определяется по наличию в составе высказывания личных местоимений 1-го и 2-го лица (я, мы во всех формах), что хорошо демонстрирует представленный пример “Ну, ребятушки, вот какова рысь кота да барана! Евстифейка-волка умудрились сшибить и изувечить с какого высокого пня, а нам где уж на земле устоять!”.
81 (2) “Риторический” упрек достаточно редкий вид упрека. Его особенностью является отсутствие очевидного объекта, это упрек “в воздух”, упрек-обращение к “высшим силам”, не предполагающий получение ответа: “За что мне все это?”, “Ну что же у меня за жизнь такая?”, “Почему они всегда в мою смену приходят?” и т.п. Еще одной чертой “риторического” упрека является генерализация – субъект как бы говорит “за всех”. “Где уж нынче правдой жить?” и “Где уж тут о работе думать?” – типичные примеры этого вида упрека, обладающие обоими из перечисленных признаков. Такой упрек, вероятно, довольно близок фольклорной речи, так как генерализация и обращение к высшим силам ей в полной мере свойственны.
82 (3) Стертость одного из компонентов упрека выводит его на периферию семантического поля и затрудняет определение значения высказывания. Типичные представители такой коммуникативной ситуации “ласковые упреки”. Пример “И то правда, говорит волк, где уж тебе, сестрица, идти, садись на меня, я тебя довезу” может быть понят и вне семантики упрека. Явственного обвинения здесь не прослеживается, тональность высказывания определенно положительная. Считать ли такое высказывание упреком остается на усмотрение интерпретатора. Наше отнесение примера к упреку мотивировано тем фактом, что, несмотря на общую положительную коннотацию высказывания (волк собирается помочь лисе), “где уж тебе, сестрица, идти” означает “плохо, что ты не можешь идти тебе стоило бы мочь из-за тебя у меня могут быть трудности”, что вполне попадает под семантику упрека, даже учитывая стертый характер обвинения.
83 Конструкция почто + глагол + ?
84 1. Реализация в фольклорных текстах
85 – “ Ах ты, эй, Добрынюшка Никитинец!
86 Ты, знать, порушил свою заповедь.
87 Зачем стоптал младыих змеенышей,
88 Почто выручал полоны да русские?” [4, с. 69]
89 – “Ай же ты, мое чадо милое
90 Молодой Василий да Буслаевич!
91 Что же ты ходишь по городу уродуешь?
92 Почто же хватаешь за руки,
93 Руку рвешь из плеча вон?
94 Почто хватаешь за ноги,
95 Ногу рвешь из ходилов вон?” [4, с. 114]
96 – “Почто вы губите себя? Разве вы можете перестоять нас? Если будете стоять и десять лет, то что сможете сделать нам?” [4, с. 383]
97 – “О милое мое чадо, петел! Почто ты такую речь говоришь? Почто я учиню так? Читывал ли ты притчу про мытаря и фарисея, как мытарь спасся, а фарисей погиб за гордость? Ты, мое милое чадо, без покаяния на высоцем древе погибнешь” [5, с. 26]
98 – “Детоньки, миленьки! Не вы ли скота-то пустили? Почто же, детоньки, пакостите? Не надо, миленьки!” [7, с. 181]
99 – “Ох ты гой еси, ладо немилое,
100 Немилый и постылый!
101 Ты почто убил моего брата любимого?
102 Своего шурина постылого?” [21, с. 570]
103 – “Ох ты ой есть, пресвята мать Богородица!
104 Ты почто это меня нынче повыдала?
105 Я за веру стоял да Христовую,
106 Я за церквы стоял да за соборные” [21, с. 88]
107 2. Комментарии
108 Упреки, маскирующиеся под причинный вопрос, не исчезли и в современной речи, и, как показывают примеры, очень характерны для фольклорных текстов. Конечно, не всегда возможно с уверенностью сказать, что упрек присутствует в таком вопросе. При работе с выдачей, семантика упрека на фоне очевидной причинности казалась нам настолько ускользающей, что, размышляя над полученными результатами, мы уже практически приняли решение не включатьпочто + глагол + ? в качестве конструкции упрека в статью. Но возникшее в ходе анализа соображение, представленное ниже, полностью нивелировало эти сомнения. Допустим, что все представленные примеры всего лишь вопросы причины, без намека на семантику упрека. Тогда получается, что субъект высказывания действительно желает знать именно причину событий, а не выражает обвинения и свою уязвленность действиями объекта? При такой интерпретации вопросы в примерах приобретают гротескную окраску. Змея, вопрошающая Добрыню, “зачем стоптал младыих змеенышей” и “почто выручал полоны да русские”, просто интересуется актуальной для нее информацией. Василия Буслаевича просят указать причины, по которым он ходит по городу, “уродует” и “рвет ноги из ходилов вон”.Исключительно, чтобы узнать причины и учесть ошибки, человек, который всю жизнь“за веру стоял да Христовую, за церквы стоял да за соборные”, любопытствует у Богородицы, почему она его “повыдала” и т.д. Прием доведения аргументации до абсурда позволяет хорошо продемонстрировать, что в представленных примерах ответ в виде перечисления причин совсем не ожидается и мы действительно имеем дело именно с семантикой упрека, а не причинностью в чистом виде.
109 Конструкция не + стыдно / совестно + инфинитив + ? / !
110 1. Реализация в фольклорных текстах
111 – “Да постыдитесь же, дрянные девчонки! Как вам не совестно бежать следом за этим молодым парнем? Разве так-то водится?” [19, с. 379]
112 – “Что, куманек, не стыдно ли свой грех на чужих сваливать? Отпирайся теперь, вор, а укоры-то верные” [5, с. 21]
113 – “Как не стыдно тебе, младой юноша, воровать! Да кто ты таков, и которыя земли, и какого отца сын, и как тебя по имени зовут?” [5, с. 417]
114 2. Комментарии
115 Категория “стыда” напрямую взаимосвязана с упреком. Лексемы, имеющие в своем составе корни “стыд-”, “совест-”, “срам-”, часто обнаруживаются в упреках, и не только в составе представленной конструкции. Любопытной деталью является, что упрек обычно встречается в высказываниях, где подобные лексемы входят в состав предложений с вопросительной, восклицательной интонацией и отрицательной формой, и совсем не характерен для утвердительных и невосклицательных предложений.
116 Конструкция что + личное местоимение 1, 2 л. Им. п. + наделал + ?
117 1. Реализация в фольклорных текстах
118 – “Ах, Иван-царевич, что же ты наделал! Если бы ты еще только три дня подождал, я бы вечно твоей была” [4, с. 173]
119 – “После бедный дворянин одумался и говорит сам себе: Что я наделал? Взялся узнать, а сам ничего не ведаю! [4, с. 297]
120 – “Отец перепугался: Что ты наделал! Ведь я теперь должен буду уплатить за топор, а чем я платить буду? В этом только и весь прок от твоей работы!” [14, с. 61]
121 – “Ах, Катерлизхен! Что ты наделала? Ведь это же не черепки были, а чистое золото, и в том было все наше состояние. Ты бы этого не должна была делать!” [19, с. 335]
122 – “Доченька, сказала мать, что ты наделала? Но теперь-то уж замолчи, чтобы никто этого не знал; ведь теперь уж этого не воротишь! Давай разварим его в студень” [19, с. 263]
123 – “Что ты, дурак, наделал? Зачем медведя в сарай притащил? Он всех коров у нас порешил!” [5, с. 333]
124 – “Ах, братец, что ж это мы наделали? Старичку поклона не отдали; давай нагоним его да поклонимся” [5, с. 350]
125 – “Что ты наделал, старый пес? Уходил ты моих дочек, моих кровных деточек, моих ненаглядных семечек, моих красных ягодок! Я тебя ухватом прибью, кочергой зашибу!” [5, с. 96]
126 – “Ах, Лебедь-птица, красная девица! Что я наделал: спьяну тобой похвалился, своей жизни лишился!” [7, с. 21]
127 – “Ах, батюшки! Что ж ты наделал; ведь это дочь нашего купца страшная ведьма! Не одного молодца свела она с белого свету” [7, с. 134]
128 – “Что ты наделал, собака? И нас упекёшь тут же!” [7, с. 188]
129 – “Эх, дурак! Что ты наделал? закричали братья. Сам пропадешь и нас загубишь! Куда теперь мертвое тело девать?” [7, с. 199]
130 2. Комментарии
131 Безусловно, смыслообразующим ядром данной конструкции является глагол “наделать”. Однако само по себе его наличие в тексте еще не означает появление семантики упрека. Ср.: “В одном городе был вороватый человек, и наделал уже много бед” [7, c. 270]. Важными элементами являются вопросительно-относительное местоимение что, личное местоимение ты и усилительная частица же. Все три являются маркерами упрека и часто сопровождают его в различных конструкция как вместе, так и по отдельности. Любопытно, что личное местоимение 2-го лица ед. ч. “ты” наиболее частотно из всех личных местоимений в упреке. Это косвенно подтверждает мысль некоторых авторов о том, что упрек, как правило, обращен к близким людям – с равным или более низким социальным статусом.
132 Конструкция из-за + тебя + сказуемое
133 1. Реализация в фольклорных текстах
134 – “Ах, сказал отец, какие мы тревоги из-за тебя вынесли!” [19, с. 222]
135 – «Вышел солдат из дворца, забрел в дремучий лес, сел под кустик, задумался-закручинился: Ах, дух нечистый! Все из-за тебя пропадаю» [6, с. 250]
136 – “Ты как сюда попал? Ведь говорил тебе: берегись, так нет! Не жалко мне, что тебя прутьями били, а жалко мне, что из-за тебя триста рублей даром пропали!” [7, с. 165]
137 2. Комментарии
138 Ядро конструкции “из-за тебя”, как и в случае с глаголом “наделать”, может встречаться в высказываниях и без семантики упрека. Однако появление в предложении глагола (особенно глагола в прошедшем времени) делает вероятность упрека очень высокой.
139 Конструкция напрасно + личное местоимение + сказуемое, пр. вр.
140 1. Реализация в фольклорных текстах
141 – “Совсем напрасно ты, Феодул Змеуланович, на свою силу понадеялся! Хвастал, что Русь повоюешь, богатырей русских полонишь. А вышло не по-твоему. Так не лучше ли нам замириться подобру-поздорову?” [4, с. 237]
142 – “Эх, совсем напрасно я тогда Данилу Белого в живых оставил! Землю он ел, клялся не воевать с королевством Картауса, я и поверил! А он вон чего натворил! Отплатил за мою доброту. Ну, погоди, рассчитаюсь с тобой! Теперь пощады не будет!” [4, с. 243]
143 – “Напрасно вы, братцы, ворчали на меня! Ведь и колодец, и яблоня, и ковер все это чудо-юдовы жены были” [4, с. 279]
144 2. Комментарии
145 Синонимичные лексемы “зря” и “напрасно” высокоспецифичны для упрека. Представленные примеры не отражают все многообразие вариантов выражений с семантикой упрека (или генетически родственной семантикой), полученные при работе с текстами.
146 За пределами конструкции остаются:
147 1) Примеры с тем же составом и инверсией:
148 – “Экой я дурак! Что ж я напрасно съел столько калачей. Мне бы надо сначала съесть одну баранку” [4, с. 346]
149 – “Нет, видно мы напрасно смеялись над женой Ивана-царевича, она не лягуша, а кака-нибудь хитра чародейка!” [6, с. 329],
150 В этих двух примерах мы не имеем дело с какой-то новой сущностью – это всего лишь инверсивный вариант изучаемой конструкции. Оба примера реализуются как ярко выраженные самоупреки, что только подтверждает их родство с конструкцией.
151 2) Примеры, где в составе конструкции отсутствует личное местоимение:
152 – «Журавль раздумался и сказал: Напрасно не взял за себя цаплю: ведь одному-то скучно. Пойду теперь и возьму ее замуж» [4, с. 145]
153 – “Но только напрасно считают нас первыми красавицами. Вот в Вахрамеевом царстве царевна, дочь царя Вахрамея, та настоящая красавица” [4, с. 238]
154 Здесь мы также имеем дело с вариантами все той же конструкции “напрасно + личное местоимение + сказуемое, пр. вр.”. Отсутствие местоимения (легко, впрочем, восстанавливаемого) объясняется синтаксической структурой этих примеров, это односоставные предложения определенно-личного и неопределенно-личного типа соответственно.
155 3) Примеры, сказуемое которых глагол не в прошедшем времени:
156 – “Это похвально, Еруслан Лазаревич, что ты своих близких в горе-беде не покинул, выручил, а теперь поехал живую воду для них доставать. Но скажу тебе: напрасно ты туда поедешь [4, с. 246]
157 То, что данный пример, несмотря на явную родственность, является вариантом конструкции, вопрос дискуссионный, поскольку семантика упрека за счет еще не совершенного действия здесь не так уж и очевидна.
158 Почему подобные случаи вынесены за границы конструкции, хотя, как минимум два из них бесспорные ее варианты? Причина этому лежит в необходимости соблюдения баланса между “количеством” и “качеством” конструкции. Излишнее расширение границ конструкции приведет не только к взрывному росту количества примеров, но и к росту ложноположительных результатов, а сверхстрогое регламентирование, хотя и уменьшит риск примеров, не попадающих под семантику упрека, приведет также к серьезному уменьшению выдачи в целом и потере интересных примеров в частности. Поскольку статья представляет собой пилотный опыт работы с фольклорным материалом, в целях большей наглядности и сохранения “качества”, мы жертвуем “количеством” выдачи и рядом ценных примеров. Сказанное верно не только для данной конструкции, но и остальных конструкций, представленных в работе.
159 Конструкция ты+ небось + сказуемое, пр. вр.
160 1. Реализация в фольклорных текстах
161 – “А ты небось думал, что у меня ноги-то лошадиные, как у тебя? возразил ему солдат. А с коих пор ты стал таким скрягой?” [14, с. 422]
162 – “Мало ли что! отвечал ему малютка. Ты небось наелся досыта, а я вот хочу повеселиться! И опять стал кричать во все горло” [19, с. 222]
163 – “Э-э, господин лис! крикнула опять кошка. Где же твое уменье и хитрости? Кабы ты умел так лазать по деревьям, как я, так небось не поплатился бы шкурою” [19, с. 420]
164 2. Комментарии
165 “Небось” еще одна лексема-маркер упрека. В реальности при расширении конструкции можно получить гораздо больше интересных примеров с неизбежным при этом ростом ложноположительных срабатываний:
166 – «“Люди добрые землю пашут, а ты без просыпу спишь! А ты небось хочешь, чтоб я на тебя пахал? И не думай!”» [5, с. 437]
167 Пример с настолько очевидной семантикой упрека, что кажется невозможным не включить его в состав работы. Однако включение в конструкцию помимо прошедшего настоящего времени немедленно даст и результаты вне семантики упрека или с очень смазанной семантикой:
168 – «“Ты небось сидишь над кладом? сказал мужичонка. Конечно, над кладом, отвечал чертенок, и в том кладе больше найдется серебра и золота, чем тебе на всем твоем веку видеть пришлось”» [14, с. 340]
169 – «Вот он однажды вечером и говорит королю: Ты небось думаешь, что к тебе поступило на службу двенадцать егерей? Ну, да! Конечно, двенадцать егерей! отвечал король» [19, с. 392]
170 Примеры хорошо демонстрируют, как сказанное выше о балансе “количества” и “качества”, так и некоторую условность создаваемых конструкций. Условность состоит в том, что структура конструкций будет зависеть от опыта и интуиции исследователя, от инструментов поиска, которые исследователь может использовать, от задач, которые стоят перед исследованием и т.д.
171 VI. Выводы
172 Как заявлено выше, задача исследования подразделялась на два аспекта:
173 – эксперимент по выделению упрека в фольклорном материале на базе конструкций;
174 – доказательство эффективности используемого метода.
175 Можно сказать, что в той или иной мере обе цели были достигнуты. Прежде всего, были полученные конкретные реализации конструкций упрека в фольклорных текстах. Несмотря на технические ограничения и невозможность использовать лексико-грамматическую разметку, данные, полученные исключительно с помощью внутритекстового поиска программ Windjview и PDF-Xchange по разным источникам, представляются в целом (с поправками на неизбежную погрешность и техническое несовершенство) достоверным и заслуживающими внимания.
176 Нет сомнения, что поиск, поэтапно осуществляемый по маркерам и конструкциям упрека в состоянии обеспечить определенный уровень автоматизации при работе с фольклорными источниками, сделать работу исследователя с большими массивами данных более продуктивной и системной. Основным преимуществом такого сентимент-анализа является его более высокая (по сравнению с классической ручной обработкой данных) объективность, достигаемая алгоритмизацией действий исследователя, автоматизацией процедуры поиска и регулярной природой конструкций. Впрочем, и продемонстрированный уровень объективности не может быть признан полностью удовлетворяющим. Следующим этапом, который мог бы поднять объективность подобных исследований на недостижимую в настоящее время высоту, является запуск специализированного корпуса русского фольклора.
177 Следует также добавить, что использованный в статье метод поиска по конструкциям не привязан именно к упреку. Это дарит надежду на его применение при работе с широким спектром семантических полей, помимо собственно упрека, на базе которого был проведен описанный опыт.

Библиография

1. Пропп В.Я. Исторические корни волшебной сказки / Научная редакция, текстологический комментарий И.В. Пешкова. М.: Лабиринт, 2000. 336 с.

2. Пропп В.Я. Русская сказка (Собрание трудов В.Я. Проппа) / Научная редакция, комментарии Ю.С. Рассказова. М.: Лабиринт, 2000. 416 с.

3. Пропп В.Я. Морфология волшебной сказки / Научная редакция, текстологический комментарий И.В. Пешкова. М.: Лабиринт, 2001. 192 с.

4. Былины. Русские народные сказки. Древнерусские повести / Авторы вступит. статей, сост. и коммент. В.П. Аникин, Д.С. Лихачев и Т.Н. Михельсон; Переизд. М.: Дет. лит., 1989. 638 с.

5. Народные русские сказки А.Н. Афанасьева / Подготовка текста, предисловие и примечания В.Я. Проппа. В 3 т. М.: Государственное Издательство Художественной литературы (Гослитиздат), 1957. Т. 1. 516 с.

6. Народные русские сказки А.Н. Афанасьева / Подготовка текста, предисловие и примечания В.Я. Проппа. В 3 т. М.: Государственное Издательство Художественной литературы (Гослитиздат), 1957. Т. 2. 511 с.

7. Народные русские сказки А.Н. Афанасьева / Подготовка текста, предисловие и примечания В.Я. Проппа. В 3 т. М.: Государственное Издательство Художественной литературы (Гослитиздат), 1957. Т. 3. 573 с.

8. Fillmore Ch.J., Kay P. Construction grammar course book. Berkeley: University of California, 1992. 113 p.

9. Goldberg A.E. Constructions: A Construction Grammar Approach to Argument Structure. Chicago: University of Chicago Press, 1995. 265 p.

10. Goldberg A.E. Constructions at work: The nature of generalization in language. Oxford: Oxford Univ. Press, 2006. 280 p.

11. Рахилина Е.В. Лингвистика конструкций / Отв. ред. Е.В. Рахилина. М.: Издательский центр “Азбуковник”, 2010. 584 с.

12. Рахилина Е.В., Плунгян В.А. Конструкция анекдота с точки зрения грамматики конструкций // Известия РАН. Серия литературы и языка. 2009. Т. 68. № 5. С. 47–54.

13. Ляшевская О.Н. Корпусные инструменты в грамматических исследованиях русского языка. М.: Издательский дом ЯСК, Рукописные памятники Древней Руси, 2016. 520 с.

14. Братья Гримм. Собрание сказок / Пер. под ред. П. Полевогo. В 2 т. М.: Литература, Престиж Бук, 2007. Т. 2: Сказки; Детские легенды. 464 с.

15. Шмурак Р.И. К уточнению понятия упрека с помощью корпусных инструментов // Известия Российской академии наук. Серия литературы и языка. 2020. Т. 79. № 3. С. 24–48.

16. Шмурак Р.И. Формальные средства выражения упрека в русском дискурсе // Слово.ру: Балтийский акцент. 2020. Т. 11. № 4. С. 65–79.

17. Шмурак Р.И. Формальные средства выражения упрека в русском языке: к процедуре корпусного поиска (на материале конструкции “сам + небось + V”) // Вестник Московского университета. Серия 9. Филология. 2021. № 2. С. 83–92.

18. НКРЯ [Национальный корпус русского языка: [сайт]. URL: http://www.ruscorpora.ru

19. Братья Гримм. Собрание сказок / Пер. под ред. П. Полевогo; Вступ. ст. В. Неустроева. В 2 т. М.: Литература, Престиж Бук, 2007. Т. 1: Сказки. 480 с.

20. Русские народные сказки и былины. М.: ТЕРРА–Книжный клуб, 1999. 368 с.

21. Былины; Исторические песни; Баллады / сост. А. Калугиной, В. Ковпика. М.: Эксмо, 2008. 797 с.

22. Шмурак Р.И. Формальные средства выражения упрека в русском языке (корпусное исследование): диссертация на соискание ученой степени кандидата филологических наук: 10.02.01 / Шмурак Роман Ильич. М., 2021. 241 c.

Комментарии

Сообщения не найдены

Написать отзыв
Перевести