Цифровой корпус академических толковых словарей русского языка: алгоритм разработки и создания
Цифровой корпус академических толковых словарей русского языка: алгоритм разработки и создания
Аннотация
Код статьи
S241377150006108-1-1
Тип публикации
Статья
Статус публикации
Опубликовано
Авторы
Лесников Сергей Владимирович 
Аффилиация: Институт лингвистических исследований РАН
Адрес: Российская Федерация, Cанкт-Петербург
Выпуск
Страницы
13-24
Аннотация

В настоящей работе рассматриваются академические толковые словари русского языка как основа академического (автоматизированного, архивного) словарного (системного) корпуса (конкорданса, кортежа, компедиума) [11, с. 213–214]; [12, с. 111–114]; [15, с. 25–28]; [24, с. 226–257]; [30, с. 76–83]; [33, с. 98–102] РЯ, а также алгоритм, концепция и принципы разработки и создания цифрового корпуса академических толковых словарей русского языка. Корпус конструируется в форме гизауруса (гипертекстового тезауруса) [3, с. 119–125]; [22, с. 280–281] в нелинейной форме с учетом реляционных, иерархических и сетевых парадигматических связей, что позволит посредством соответствующей классификации и систематизации, дигитализации и ретродигитизации академических толковых словарей русского языка структурировать и объединить лексикографические материалы, обеспечив тем самым их оперативный ввод в научный оборот с целью оптимизации научных исследований в современной лексикографии.

Научная значимость словарного корпуса определяется необходимостью централизованного описания русской лексики, так как многочисленные разработки в исследуемой области каждая в отдельности имеют собственные задачи и направление исследования, что не позволяет увидеть полную языковую картину Российской Федерации, которую может показать информационно-поисковый словарный корпус. Для этой цели и создается работоспособный интерактивно пополняемый корпус, позволяющий объединить в единую базу различные лексикографические источники.

Ключевые слова
база данных, гизаурус, гипертекстовый тезаурус, метаязык, искусственный интеллект, корпус, лексикография, лингвистика, поиск, русский язык, словарь, справочник, текст, энциклопедия
Классификатор
Получено
11.09.2019
Дата публикации
25.09.2019
Всего подписок
89
Всего просмотров
2402
Оценка читателей
0.0 (0 голосов)
Цитировать Скачать pdf
Доступ к дополнительным сервисам
Дополнительные сервисы только на эту статью
Дополнительные сервисы на весь выпуск”
Дополнительные сервисы на все выпуски за 2019 год
1 Описание и репрезентация академических словарей и энциклопедий русского языка становится одной из актуальных задач корпусной лексикографии, так как многие культурные реалии уходят в прошлое и становятся частью истории. В связи с глобальной индустриализацией и урбанизацией лексика уходит в прошлое и уносит за собой огромный массив истории русского народа. Необходимость создания академического словарного корпуса русского языка для обобщающего исследования русской лексики как части исторической картины нашей страны очевидна. Кроме того, получение репрезентативного, оцифрованного академического словарного корпуса в форме гизауруса (гипертекстовый тезаурус) позволит предоставить интерактивный доступ к соответствующим лексикографическим источникам русского языка (в зависимости от запросов пользователей).
2 Под гизаурусом понимается гипертекстовая реляционная база данных с гиперссылками (цифровой идеографический словарь, отображающий семантические отношения между лексическими единицами и предназначенный для поиска слов по их значениям) [19, с. 268–269]; [31, с.29]. Один из основателей и идеологов Машинного фонда русского языка /МФРЯ/ Ю.Н. Караулов писал: “Гипертекст – или нелинейный текст, – такая организация записи отдельных отрывков, фрагментов множества текстов (контекстов), которая позволяет комбинировать их в том или ином порядке, основываясь на задаваемых заранее переменных связях между ними, с целью получения каждый раз разных линейных последовательностей (текстов)ˮ [8, с. 154]. В настоящее время наиболее представительным и востребованным лексикографами является Национальный корпус русского языка, создаваемый под руководством А.М. Молдована (“Электронный корпус русского языка: научно-исследовательский и обучающий Интернет-ресурсˮ, “Информационное наполнение банка данных о русском языке, его истории и современном состоянииˮ), А.Н. Плунгяна [37, с. 11–18] (“Формирование и метатекстовая разметка корпуса текстов второй половины XX и XXI вв.ˮ ), Л.А. Вербицкой и Н.Н. Казанского (РФФИ № 03-04-00226а), А.Я. Шайкевича (“Создание программного обеспечения для Национального корпуса текстов русского языкаˮ), Е. В. Рахилиной (“Подготовка окончательного варианта корпуса современного русского языка: коррекция баланса и редактированиеˮ) и др. (см. [ >>>> ]).  При этом академический словарно-грамматический фонд “должен состоять из нескольких подфондов, число которых не следует заранее ограничивать. Одним из таких подфондов станет свод академических словарей – наиважнейших источников зафиксированных на сегодняшний день знаний о русском языке. Такой свод должен образовать однородное семейство баз данных, в пределах которого каждый из словарей продолжал бы существование в качестве отдельной базы данных и в то же время был бы связан средствами системы управления базы данных и номенклатурой своих составляющих со всеми другими словарями. Этот объединенный словарь мог бы не только выполнять справочные функции, но и быть источников нового систематического изучения лексикиˮ [1, с. 32]. Машинный фонд русского языка [18, с. 58–60] формировался в виде нескольких систем комплексной автоматизации лингвистических исследований и предусматривал “накопление на машинных носителях всего лексического богатства русского языка, создание фонда лингвистических алгоритмов и программ, фонда полностью завершенных систем автоматического анализа и синтеза русского текста, нескольких информационно-справочных систем по языкознаниюˮ [2,  с. 8].
3 Л.В. Щерба утверждал, что в основе словарей академического типа “лежит единое (реальное) языковое сознание определенного человеческого коллектива в определенный момент времениˮ [40, с. 266–267], и словарь академического типа рассматривал как нормативный, описывающий лексическую систему современного языка, т.е. в нем не должно быть фактов, противоречащих современному употреблению: “к нормативному (или академическому) словарю обращаются для самопроверки, а иногда и для нахождения нужного в данном контексте словаˮ [40, с. 267].
4 “Словарь должен быть достаточно полным, включающим все богатство современного русского литературного языка. Словарь должен быть историческим… Словарь должен дать всестороннюю семантическую, стилистическую и грамматическую характеристику слов: правописания, всего многообразия значений, особенностей фразеологического и стилистического употребления слов, образующую роль слова в группах родственных слов… В научном отношении Академический Словарь русского языка должен представлять собою такой источник, на основе которого в дальнейшем мог бы быть создан ряд малых словарей-справочников разного типа… Полный охват Академическим Словарем всех слов русского языка оправдывает его многотомность…, но мы не должны бояться такого объема издания, так как по своей научной значимости Словарь в этом случае будет таким фундаментальным документом, в котором будет отражена история развития русского языка за 200 лет и зафиксировано полностью все богатство содержания современного русского литературного языкаˮ [38, с. 3–4]. “В Словарь включается лексика русского литературного языка от эпохи Пушкина до наших дней. Поскольку задача Словаря – охватить словарное богатство русского литературного языка указанного времени, в него включаются как устойчивый, так и подвижный словарный состав. К последнему относятся устаревшие теперь слова, но бывшие употребительными в тот или иной период за охватываемую Словарем эпоху, а также слова, вновь появившиеся и вошедшие в употребление в литературном языке. Включение в Словарь устаревшей лексики, стоящей вне пределов словарных норм современного литературного языка, но употреблявшейся в литературном языке XIX и начала XX в., прежде всего диктуется тем, что русская классическая литература является неотъемлемым достоянием современной культуры, читается и изучается широкими массами населения.
5 Помещение в Словаре новых слов совершенно необходимо в связи с бурным развитием … науки и техники, промышленности и сельского хозяйства и т. д., находящим свое отражение в непрерывном обогащении лексики современного литературного языка.
6 Новые слова, получающие общелитературное значение, нуждаются в филологическом объяснении и регистрации в академическом толковом словареˮ [7, с. 10].
7 “Академический словарь, как и любой словарь – это вид информационного справочного издания. Не случайно словарь, переведенный на ЭВМ, при наличии комплекса программ, быстро превращается в автоматизированную информационно-справочную систему.
8 И в этом отношении академический словарь представляет собой вторичный текст, вторичный документ по отношению к своему первичному объекту – текстам. Тексты первичны, словарь вторичен.
9 По самой своей специфике толковый академический словарь – это многогранное и, главное, разноаспектное, полипараметрическое описание языковых фактов текстов.
10 Слово в языке, слово в его употреблении и в текстах описывается в академическом словаре исходя из самых разных лингвистических дисциплин (лексикология, грамматика, стилистика, литературоведение), а иногда и с разных исследовательских позиций. Однако именно в этом и состоит главное достоинство такого словаря, таким он и должен быть. Любой алфавитный академический словарь – это своеобразная многосторонняя лингвистическая энциклопедия слова.
11 При этом и в зарубежной лексикографии наблюдается вполне закономерная тенденция к увеличению числа параметров описания слова в словаре; и это понятно – чем больше параметров, тем шире информационный диапазон словаря и круг потребителей самого словаряˮ [5 , с. 73].
12 В качестве основы корпуса используются оцифрованные нами к настоящему времени академические толковые словари русского языка, изданные Императорской АН, АН СССР, РАН (315 томов, выпусков, частей) (подробный список академических словарей см. [10, с. 38–47]; [24, с.226–257]). Здесь перечислим самые значительные и объёмные: Словарь Академии Российской (6 частей от А до Я. СПб. 1789–1794, 2-ое изд. 1806–1822), Словарь церковно-славянского и русского языка, составленный II Отделением Академии Наук (4 тома от А до Я. СПб. 1847, 2-ое изд. 1867–1868), Словарь русского языка (Грото-Шахматовский 1891–1937, 53 вып.), Толковый словарь русского языка (под ред. Д.Н.Ушакова, 1934–1940, 4 тт.), Словарь современного русского литературного языка (1948–1965, т.1 издавался два раза: 1948 и 1950 гг., 18 тт.; 1991–1994, 6 тт.; 2004–2017, 24 тт.); Словарь русского языка (Ожегов С.И., гл. ред. С.П. Обнорский, 1949), Словарь русского языка (под ред. А. П. Евгеньевой, 1957–1961, 1981–1984, 1985–1988, 4  тт.), Словарь русских народных говоров (1965–2018, 51 вып.) [23, с. 148–149]; Словарь русского языка XI–XVII (1975–2015, 30 вып.); Новые слова и значения (1977–2014, 24 тт.); Словарь русского языка XVIII века (1984–2013, 20 вып.) [17, с. 34–42].
13 Основной задачей создания академического словарного корпуса русского языка на основе академических толковых словарей является развернутое описание употребления русской лексики, а также показ лексического и семантического богатства русского языка во всем его многообразии за последние несколько веков. За этот период значительная часть нормативной лексики русского литературного языка изменялась и парадигматически и семантически. Корпус позволяет прослеживать эти исторические изменения современному пользователю, что безусловно будет способствовать повышению культуры русской речи и качеству исследований в области русского литературного языка. Поэтому авторы-составители и редакторы академического словарного корпуса должны быть предельно ответственны в процессе отбора оцифровываемых толковых словарей  и конструирования информационно-поисковой системы в форме гизауруса.
14 В основе концепции, определяющей цель и содержание разработки и создания академического словарного корпуса, лежат следующие принципы:
15 1) при отборе лексикографического материала – максимально полный охват слов и выражений и их значений из разнообразных корпусов словарей и текстов с использованием современных информационных ресурсов; 2) на уровне макроструктуры академического словарного корпуса – тезаурусный, тематический, идеографический и концептный принципы систематизации материалов по категориям, разделам и рубрикам; 3) на уровне микроструктуры академического словарного корпуса – расширенные зоны: вокабулы (заглавного слова, лемм, вариантов лексических единиц); значения (дефиниции, изъяснения, интерпретации) и полисемии (многозначности, оттенков значения, переносных значений, отсылочных значений); комментариев и иллюстраций семантики лексических единиц русского языка.
16 Академический словарный корпус предполагает гипертекстовое, интегральное, всестороннее, единообразное и кумулятивное описание и представление лексических единиц русского языка.
17 В основе разработки и создания корпуса лежит идея комплексного многоаспектного лексикографического описания системы русского языка, включающей предметный, географический, грамматический, исторический, источниковедческий, прагматический, семантический, стилистический, фонетический, этимологический и другие аспекты и отражающей реальную лексико-грамматическую структуру лексических единиц во всем многообразии.
18 При формировании корпуса выдерживаются следующие принципы:  нормативность, системность [4, с. 64–91] и интегральность; актуальность, проверяемость и реальность источников лексических единиц; функциональность (совместное рассмотрение структуры и системы многоаспектного поиска с приоритетом функций над структурой); целенаправленность с выделением глобальной цели (оптимальность подсистем не является оптимумом для системы поиска); единство (совместное рассмотрение системы как целого и как совокупности частей; синхрония, диахрония и панхрония) и единообразие; развитие (учет изменяемости системы, ее способности к развитию, накапливанию информации с учетом динамики окружающей среды, напр., использование статистики пользовательских запросов и новых лексикографических источников); иерархичность (учет использования соподчинения и ранжирования частей, напр., систематизация по тематическому, хронологическому и частотному параметрам) и структурность (напр., структурные уровни языка: графический морфологический, семантический, синтаксический, фонетический, этимологический); агрегирование (объединение и укрупнение значений); децентрализация (распараллеливание запросов по распределенным на разных серверах лексическим базам данных).
19 Кратко алгоритм разработки и создания корпуса выглядит следующим образом:
20 1) Анализ современного состояния  корпусной лингвистики (анализ существующих словарных источников и потребностей адресата – конечного пользователя корпуса) [32, с. 6–10]. Выбор источников и кластеризация предметной области. При выборе источников учитывается: наиболее точное соответствие лексического материала предметной области [22, с.280–281]; технологическая насыщенность и важность источников. Разработка многоуровневой структуры (макроструктура – композиция, внутренняя организация, принципы отбора источников; микроструктура и мультимедиаструктура) и параметров корпуса [6, с. 64–70]. Конструирование интерактивного отображения словарных статей корпуса, т.е. интерфейса (напр., краткий свернутый, развернутый с иллюстрациями, контекстами и иллюстрациями, расширенный – полный, многоязычный).
21 Эксплицирование метаязыка корпуса [26, с. 155–170]; [34, с. 335–360].
22 2) Аналитико-теоретическая разработка  алфавитно-пермутационного, базового, генерального, предметного и др. словников (аскрипторы, дескрипторы, доминанты, лексические единицы, одиночные слова (существительные, прилагательные, глаголы, наречия); именные словосочетания; лексически значимые компоненты сложных слов; сокращения слов и словосочетаний; реляторы; термины и терминологизмы; фразеология и паремия) [29, с.37–45].
23 В Генеральный словник корпуса входят вокабулы (заголовки словарных статей) с указанием, в каких словарях можно найти информацию о том или ином слове, а также включается информация не столько по электронным версиям первоисточников, которые загружены в словарную базу данных, т. к. такие вокабулы и так найдутся по запросу “целиком словоˮ, сколько по словникам книжных (бумажных) словарей и словникам других словарных порталов.
24 Идея Генерального словника русского языка восходит к научной программе “Машинный фонд русского языкаˮ [2]; [18], главный конструктор которого Владислав Митрофанович Андрющенко предполагал, что первым компонентом Машинного фонда русского языка «является Генеральный словник русских словарей, который может быть создан как семейство однородных баз данных на основе Сводного словника, созданного в Словарном секторе Института русского языка АН СССР, и других “словнико подобныхˮ словарей, таких, как “Грамматический словарь русского языкаˮ А.А. Зализняка, Орфографический словарь и др. Объектом хранения в этой базе данных является вокабула, т.е. слово, являющееся потенциальным заголовком какой-либо словарной статьи и именем определенного лексического значения, а его атрибутами – номера или идентификаторы значений, а значениями атрибутов – имена и входы баз данных, в которых данное слово или его формы зафиксированы в качестве значений атрибутов каких-либо объектов – словарных статей, текстов, грамматических правил, статистических сводок, научных статей и т.п. Очевидно, что многоаспектный поиск по заданным значениям атрибутов с соответствующими логическими условиями может давать ответы на такие запросы, как: “Найти перечень словарных статей определенных словарей, для которых имеется информация в терминологической базе данныхˮ, “Найти значения вокабулы, стилистически маркированные в словаряхˮ, “Найти все глаголы с дефектными парадигмами и сопоставить структуры их словарных статейˮ и т.п.» [1, с. 31]. “Важная часть словарной работы – отбор лексики в толковый словарь… Поскольку словники различных, в том числе и толковых, словарей русского языка не совпадают, представляется целесообразным создание справочника, в котором бы все словники наиболее значительных словарей были объединены… Таким справочником является Сводный словник словарей русского языка… Сводный словник словарей русского языка может стать основой для Генерального словника в машинном фонде лексики, создаваемом на основе словарейˮ [39, с. 64–65].
25 3) Выявление семантических полей [35, с. 84–89]; использование фреймового подхода [28, с. 51–54]; [35, с. 84–89] для реализации гизауруса (гипертекстового тезауруса [27]). Распределение лексических единиц по семантическим, тематическим, идеографическим полям (зонам, параметрам). 4) Установление парадигматических (способы выражения: аналитический, графический, лексикографический, табличный), иерархических, ассоциативных, грамматических, межъязыковых, семантических… связей [13, с. 269–279]. Исследование денотативно-сигнификативных, синтагматических и экпрессивно-прагматических характеристик лексических единиц. 5) Автоматизирование процесса создания словарных статей и лексико-систематических (тематические, категориальные, смешанные), пермутационных, иерархических и др. указателей и списков специальных категорий лексических единиц (общие категории: названия дисциплин и отраслей деятельности; предметы, материалы; методы, процессы, операции, явления; свойства, величины, параметры, характеристики; отношения, структуры, модели, законы, правила, абстрактные понятия) [21, с. 190–203]. 6) Автоматизация процессов построения корпуса: а) частотный, статистический, компьютерный, математический анализ; б) коррекция словарных статей; в) сортировка словников; г) проверка взаимности и непротиворечивости ссылок; д) составление указателей; е) конвертация в требуемых форматах и кодировках [9, с. 622–630]. Построение гизауруса с использованием компьютеров [16, с. 200–202] позволяет автоматизировать следующие процессы построения гизауруса [17, с. 39–53]: частотный анализ, коррекция статей, алфавитная сортировка словника, проверка взаимности и непротиворечивости ссылок, составление указателей, распечатка в требуемых формах [20, с. 30-34]. Рефакторинг программного, методического, технического и организационных обеспечений корпуса [36, с. 107–119]. 7) Экспертиза, регистрация, ввод корпуса в научный оборот и технологическое внедрение [25, с. 66–69].
26 При моделировании корпуса предполагается учесть следующие обстоятельства: 1) Компьютерные словари (наследуя недостатки книжных словарей) имеют следующие особенности и проблемы: неполнота генерального словника и в целом словаря; трудности поддержания словаря в актуальном состоянии; требуют наличие специфичных программных и аппаратных средств. При этом одним из главных достоинств электронных версий словарей является то, что электронные словари многофункциональны, доступны, и неуклонно становятся дешевле, чем их бумажные аналоги. 2) Словник и содержимое книжных словарей в процессе постепенного и длительного их издания требует значительного дополнения, расширения и уточнения. В период моделирования корпуса будут появляться новые словари русского языка, а также множество аспектных, терминологических словарей и энциклопедий, которые могут существенно обогатить корпус. 3) Дифференциальный принцип отбора словников (нормативный, терминологический, аспектный и др.) для академических словарей, оказавшийся продуктивным при описании лексики в книжных версиях, для цифровой версии корпуса не является принципиальным, т.к. в компьютерной форме лексическая база данных автоматически становится полной и зависит лишь от полноты введенных источников (текстов записей информантов, картотек и любых источников лексикографических материалов), что позволяет в компьютерной форме конструировать корпус в тезаурусной (наиболее полной) форме. 4) Порядок расположения фразеологизмов и устойчивых словосочетаний в академических словарях, как правило, подчинен избранному для лексики словаря алфавитному или гнездовому принципам, что затрудняет поиск нужного словосочетания не только в объемных вокабулах, но и в словаре или энциклопедии в целом. Именно поэтому в корпусе реализуются несколько входов: авторский, алфавитный, библиографический, через веб-интерфейс, посредством генерального словника, географический и территориальный, гнездовой, источниковедческий, систематический и пермутационный, тематический, предметный, хронологический, а также, по ключевым словам, и словосочетания и др., что безусловно по возможностям отличает словарный корпус от книжных версий академических толковых словарей русского языка.
27 Среди областей применения словарного корпуса можно выделить следующие: составление, уточнение и оптимизация поисковых запросов; автоматическое выделение из текстов документов наиболее содержательных фрагментов, обеспечивающее пользователю возможность быстро просматривать массивы документов больших объемов; установление гипертекстовых ссылок (связей) между похожими документами и/или их фрагментами, что дает возможность пользователю, найдя один релевантный документ, запросить похожие на него документы; реферирование и аннотирование, редактирование текстов; повышение полноты и точности поиска в полнотекстовых базах данных на естественном языке; автоматизированное индексирование текстов, документов и запросов; анализ терминологического состава той или иной отрасли знания; терминологический контроль и нормализация лексики конкретной отрасли знания, обеспечение единого и формализованного представления информации в информационно-поисковой системе и базе данных/банке знаний; эксплицитное, явное выражение парадигматических отношений, существующих между лексическими единицами.
28 Кроме этого, словарный корпус может быть использован как средство: описания (инвентаризации) существующего уровня знаний в той или отрасли наук; описания истории развития специальных знаний в определенной предметной области; исследования особенностей развития отраслевых знаний, включая количественное исследование вклада отдельных ученых и научных школ в развитие общей теории с учетом как количества, так и новизны (в зависимости от статуса вводимого термина – основной термин или синоним уже существующего наименования понятия) и иерархического статуса понятий, вводимых соответствующим термином; систематизации терминологии (в тезаурусе, где система понятий эксплицитна, т.е. явно выражена, иерархия понятий всегда представлена наглядно); стимулирования развития знаний (напр., выявить пробелы (пропуски, лакуны), малоизученные понятия и “точки сгущенияˮ в терминологических и понятийных системах, что может служить ориентиром в последующих исследованиях и позволит выявить аналогии подсистем понятий, а также определить тенденции выделения подсистем понятий и рубежи знаний, от которых возможно дальнейшее развитие данной области).
29 Академический словарный корпус русского языка, фактически являясь информационно-поисковой лексикографической системой, даст богатый материал для различного рода научных исследований не только в области русского языка, но и других современных языков, что в перспективе позволит на основе цифровых технологий при соответствующей классификации и систематизации словарей объединить лексикографические материалы, обеспечить их оперативный ввод в научный оборот с целью оптимизации научных исследований в современной лексикографии. В итоге академический корпус станет гипертекстовым, облачным, реляционно-распределенным, агрегированным репозитарием словарей, справочников, глоссариев, лексиконов, энциклопедий русского языка. Корпус, учитывая академические первоисточники, фактически являясь нормативным, преследует цели справочного характера, помогая пользователям находить справки о лексических единицах русского языка, ранее эксплицитно зафиксированных в академических толковых словарях.
30 Практическая значимость и ценность академического словарного корпуса толковых словарей русского языка определяется следующими факторами и потенциальными возможностями:
31 а) возможность в интерактивном режиме составлять, уточнять, тем самым оптимизировать поисковые запросы;
32 б) автоматически/автоматизированно/интерактивно выделять из корпуса наиболее содержательные фрагменты, выборки и проекции, обеспечивающие пользователю возможность быстро просматривать массивы больших объемов лексикографических материалов (в частности, по некоторым параметрам, зонам и полям словарных статей или их комбинациям);
33 в) использовать установленные гипертекстовые ссылки (связи) между похожими (снятие омонимии и разделение многозначности) словарными статьями и/или их фрагментами, что дает возможность пользователю, найдя одну релевантную лексическую единицу, запросить похожие на неё лексемы;
34 г) возможность реферирования и аннотирования, создания и редактирования словарных статей корпуса (с фиксацией истории авторского комментирования и модификации) в интерактивном режиме в Интернете.

Библиография

1. Андрющенко В.М. Машинный фонд русского языка: идеи и суждения / Концепция и архитектура Машинного фонда русского языка. М.: Наука, 1986. С. 26–44.

2. Андрющенко В.М. Концепция и архитектура Машинного фонда русского языка. М.: Наука, 1989. 196 с.

3. Булыгина Д.С., Лесников С.В. Алгоритм автоматизированного конструирования гипертекстового тезауруса (гизауруса) русского языка на основе оцифрованных словарей и справочников новых слов и значений для интерактивного лексикографического корпуса “Лексико-семантическая неология в русском языке начала XXI века? // Достижения вузовской науки 2019: сборник статей IX Международного научно-исследовательского конкурса (20 мая 2019 г. в г. Пенза). В 2 ч. Ч. 1. Пенза: МЦНС “Наука и Просвещение?. 2019. С. 119–125.

4. Булыгина Д.С., Лесников С.В. Предпосылки систематизации терминов русского языка // Сопоставительная лингвистика в современном мире: материалы Международной научно-практической конференции (Иркутск, 29-30 ноября 2012). Иркутск: Изд-во ИрГТУ, 2012. С. 64–91.

5. Герд А.С. Из размышлений на пути к новому академическому словарю современного русского языка // Язык – система. Язык – текст. Язык – способность. М.: ИРЯз РААН, 1995. С. 72–79.

6. Загоровская О.В., Лесников С.В. Виды лексикографической информации в автоматическом словаре русских говоров Коми АССР и сопредельных областей // Машинный фонд русского языка: Предпроектные исследования. М.: ИРЯз АН СССР, 1988. С. 64–70.

7. Инструкция для составления “Словаря современного русского литературного языка? (в пятнадцати томах). М.-Л.: АН СССР, 1958. 87 с.

8. Караулов Ю.Н. Активная грамматика и ассоциативно-вербальная сеть. М.: ИРЯ РАН, 1999. 180 с.

9. Лесников С.В. Автоматизированная информационно-справочная система поиска лексико-семантических вариантов вокабул русского языка // Проблемы истории, филологии, культуры. 2009. № 24. Магнитогорск: Магнитогорский ГУ, 2009. С. 622–630.

10. Лесников С.В. Академические толковые словари русского языка как ядро академического словарного корпуса русского языка // Сборник научных статей по итогам работы Международного научного форума “Наука и инновации: современные концепции? (г. Москва, 5 апреля 2019 г.). Ч.1. М.: Инфинити, 2019. С. 38–47.

11. Лесников С.В. Академический словарный корпус /АСК/ русского языка // Русский язык: исторические судьбы и современность. МГУ, 2019. С. 213–214.

12. Лесников С.В. Академический словарный корпус (АСК) русского языка // Слово и словарь = Vocabulum et vocabularium: сборник научных статей. Минск: Беларуская навука, 2019. Вып. 16. С.111–114.

13. Лесников С.В. Анализ парадигматических отношений лингвистической терминосистемы // Памяти Анатолия Анатольевича Поликарпова. МГУ, 2015. С. 269–279.

14. Лесников С.В. Аналитический реферативно-аннотированный обзор оцифрованных словарей и справочников новых слов и значений для цифрового лексикографического корпуса “Лексико-семантическая неология в русском языке начала XXI века // Сборник научных статей по итогам работы Международного научного форума “Наука и инновации: современные концепции? (г. Москва, 3 мая 2019 г.). Т.3. М.: Инфинити, 2019. С. 34–42.

15. Лесников С.В. Архитектура и суть информационно-поискового корпуса академических словарей русского языка // Научный обозреватель. Научно-аналитический журнал. № 3 (99) / 2019. С. 25–28. ISSN 2220-329X.

16. Лесников С.В. Базовые блоки автоматизированной лексикографической системы // Вестник Челябинского гос. университета. Серия: филология, искусствоведение. Вып. 60. № 33 (248). Челябинск: ЧелГУ, 2011. С. 200–202.

17. Лесников С.В. Базовые операторы языка поисковых запросов тезауруса метаязыка лингвистики // В мире научных открытий. Красноярск: НИЦ, 2012. № 7.2 (31)). С. 39–53.

18. Лесников С.В. Владислав Митрофанович Андрющенко - научный руководитель и консультант, главный конструктор Машинного фонда русского языка /МФРЯ/ // Тезисы всероссийской конференции “От языковых машинных фондов к лингвистическим корпусам: памяти В.М. Андрющенко?. МГУ, ИРЯз РАН, 2018. С. 58–60.

19. Лесников С.В. Гипертекстовый информационно-поисковый тезаурус (гизаурус) “Метаязык науки? (структура; математическое, лингвистическое и программное обеспечения; разделы лингвистика, математика, экономика) // Русский язык: исторические судьбы и современность. МГУ, 2014. С. 268–269.

20. Лесников С.В. Гипертекстовый тезаурус метаязыка науки // Проблемы истории, филологии, культуры. № 3 (33) 2011. Москва-Магнитогорск-Новосибирск: РАН; Аналитик, 2011. С. 30–34.

21. Лесников С.В. К вопросу о содержании словарной статьи тезауруса метаязыка лингвистики // Обыденное метаязыковое сознание: онтологические и гносеологические аспекты. Ч.IV. Кемерово: КГУ, 2012. С. 190–203.

22. Лесников С.В. Конструирование гипертекстового генерального свода лексики русского языка: русский гизаурус / Международная научная конференция “Язык и культура?. 14-17 сентября 2001. М.: ОЛЯ РАН, научн. журнал “Вопросы филологии?, Инст. иностранных языков, 2001. С. 280–281.

23. Лесников С.В. Конструирование гипертекстового свода лексики народных говоров русского языка // Актуальные проблемы русской диалектологии. Материалы международной конференции 26-28 октября 2018 г. М.: ИРЯз им.В.В. Виноградова РАН, 2018. С. 148–149.

24. Лесников С.В. Конструирование информационно-поискового свода академических словарей русского языка (Свод АСРЯ) // Лексический атлас русских народных говоров (Материалы и исследования) 2018. СПб.: ИЛИ РАН, 2018. С. 226–257. DOI: 10.30842/26586150201820

25. Лесников С.В. Конструирование словаря терминов метаязыка СМИ с помощью методики вычисления веса базисных терминов // Слова ў кантэксце часу: матэрыялы IV Міжнар. навук.-практ. канф., прысвеч. 90-годдзю з дня нараджэння д-ра філал. навук праф. А.І. Наркевіча, Мінск, 14–15 сак. 2019 г. Мінск: БДУ 2019. С. 66–69.

26. Лесников С.В. Конструирование словника словаря терминов метаязыка лингвистики с помощью методики вычисления веса базисных терминов метаязыка лингвистики // Социально-когнитивное функционирование языка. Кемерово: КГУ, 2017. С. 155–170.

27. Лесников С.В. Лингвистические основы информатики (теория, алгоритмы и лингвистические программы): учебное пособие. Часть 1 Сыктывкар: Изд-во Сыктыкарского гос. ун-та, 2009. 292 с.

28. Лесников С.В. Моделирование тезауруса метаязыка лингвистики на базе гипертекстовых фреймов // Вестник Вятского гос. гуманитарного ун-та. Филология и искусствоведение. № 3 (2). Киров: ВятГГУ, 2011. С. 51–54.

29. Лесников С.В. Основные латинские терминоэлементы и термины метаязыка лингвистики // Научные ведомости БелГУ. Сер. Гуманитарные науки. Белгород: БелГУ, 2011. № 12 (107). Вып.10. С.37–45.

30. Лесников С.В. Предпосылки конструирования и базовые первоисточники академического словарного корпуса русского языка // Сборник научных статей по итогам работы Международного научного форума “Наука и инновации - современные концепции? (г. Москва, 22 марта 2019 г.). Т.2. М.: Изд-во Инфинити, 2019. С.76–83.

31. Лесников С.В. Словарь русских словарей. М.: Азбуковник, 2002. 334 с.

32. Лесников С.В. Типология русских словарей лингвистической терминологии // Мир науки, культуры, образования. № 6 (31). 2011. Часть 2, декабрь 2011. С.6–10.

33. Лесников С.В. Формирование терминологического фонда русского языка // Наука сегодня: вызовы и решения: материалы международной научно-практической конференции, г. Вологда, 30 января 2019 г. Вологда: ООО “Маркер?, 2019. С.98–102.

34. Лесников С.В. Фрагмент словаря базовых терминов метаязыка лингвистики // Лексический атлас русских народных говоров (Материалы и исследования) 2017. СПб., 2017. С.335–360.

35. Лесников С.В. Фреймовое конструирование тезауруса метаязыка лингвистики // Вестник Поморского университета. Сер. Гуманитарные и социальные науки. № 4. Архангельск: ПГУ, 2011. С.84–89.

36. Лесников С.В., Загоровская О.В. Формальная грамматика словарной статьи автоматического словаря русских говоров Коми АССР и сопредельных областей /АСРГКА/ // Вторая Всесоюзная конференция по созданию Машинного фонда русского языка: Материалы конференции. М.: ИРЯз АН СССР, 1988. С. 107–119.

37. Плунгян В.А. Национальный корпус русского языка: 10 лет проекту (Предисловие) // Труды Института русского языка им. В.В. Виноградова. 2015. Т. 6. С. 11–18.

38. Проект словаря современного русского литературного языка. М.-Л.: АН СССР, 1938. 98 с.

39. Рогожникова Р.П. МФРЯ и словарное дело // МФРЯ: идеи и суждения. М.: Наука, 1986. С. 58-67.

40. Щерба Л.В. Опыт общей теории лексикографии // Изв. АН СССР. Отд. лит-ры и языка. 1940. № 3. (Переизд.: Щерба Л.В. Опыт общей теории лексикографии // Языковая система и речевая деятельность. Л., 1974).

Комментарии

Сообщения не найдены

Написать отзыв
Перевести