Цифровой корпус академических толковых словарей русского языка: алгоритм разработки и создания

Лесников Сергей В.

doi:10.31857/S241377150006108-1

Русский

Войти Регистрация

Главная>Номер 4>Цифровой корпус академических толковых словарей русского языка: алгоритм разработки и создания

Цифровой корпус академических толковых словарей русского языка: алгоритм разработки и создания

Оглавление

Аннотация Оценить Содержание публикации

Библиография Комментарии

Цифровой корпус академических толковых словарей русского языка: алгоритм разработки и создания

Аннотация

Код статьи

S241377150006108-1-1

DOI

10.31857/S241377150006108-1

Тип публикации

Статья

Статус публикации

Опубликовано

Авторы

Лесников Сергей Владимирович Связаться с автором

ORCID: 0000-0001-5816-0996

Аффилиация: Институт лингвистических исследований РАН
Адрес: Российская Федерация, Cанкт-Петербург

Выпуск

Том 78 Номер 4

Страницы

13-24

Аннотация

В настоящей работе рассматриваются академические толковые словари русского языка как основа академического (автоматизированного, архивного) словарного (системного) корпуса (конкорданса, кортежа, компедиума) [11, с. 213–214]; [12, с. 111–114]; [15, с. 25–28]; [24, с. 226–257]; [30, с. 76–83]; [33, с. 98–102] РЯ, а также алгоритм, концепция и принципы разработки и создания цифрового корпуса академических толковых словарей русского языка. Корпус конструируется в форме гизауруса (гипертекстового тезауруса) [3, с. 119–125]; [22, с. 280–281] в нелинейной форме с учетом реляционных, иерархических и сетевых парадигматических связей, что позволит посредством соответствующей классификации и систематизации, дигитализации и ретродигитизации академических толковых словарей русского языка структурировать и объединить лексикографические материалы, обеспечив тем самым их оперативный ввод в научный оборот с целью оптимизации научных исследований в современной лексикографии.

Научная значимость словарного корпуса определяется необходимостью централизованного описания русской лексики, так как многочисленные разработки в исследуемой области каждая в отдельности имеют собственные задачи и направление исследования, что не позволяет увидеть полную языковую картину Российской Федерации, которую может показать информационно-поисковый словарный корпус. Для этой цели и создается работоспособный интерактивно пополняемый корпус, позволяющий объединить в единую базу различные лексикографические источники.

Ключевые слова

база данных, гизаурус, гипертекстовый тезаурус, метаязык, искусственный интеллект, корпус, лексикография, лингвистика, поиск, русский язык, словарь, справочник, текст, энциклопедия

Классификатор

Получено

11.09.2019

Дата публикации

25.09.2019

Всего подписок

Всего просмотров

2402

Оценка читателей

0.0 (0 голосов)

Цитировать Скачать pdf

ГОСТ	Лесников С. В. Цифровой корпус академических толковых словарей русского языка: алгоритм разработки и создания // Известия Российской Академии наук. Серия литературы и языка. – 2019. – T. 78. – Номер 4 C. 13-24 . URL: https://izv-oifn.ru/s241377150006108-1-1/. DOI: 10.31857/S241377150006108-1
MLA	Lesnikov, Serg "A digital database of the russian academic explanatory dictionaries: an algorithm of development and creation." Izvestiia Rossiiskoi akademii nauk. Seriia literatury i iazyka. 78.4 (2019).:13-24. DOI: 10.31857/S241377150006108-1
APA	Lesnikov S. (2019). A digital database of the russian academic explanatory dictionaries: an algorithm of development and creation. Izvestiia Rossiiskoi akademii nauk. Seriia literatury i iazyka. vol. 78, no. 4, pp.13-24 DOI: 10.31857/S241377150006108-1

Доступ к дополнительным сервисам

Дополнительные сервисы только на эту статью

Преимущества сервисов

100 руб. / 1.0 SU

Дополнительные сервисы на весь выпуск”

Преимущества сервисов

800 руб. / 16.0 SU

Дополнительные сервисы на все выпуски за 2019 год

Преимущества сервисов

4224 руб. / 30.0 SU

Библиография

1. Андрющенко В.М. Машинный фонд русского языка: идеи и суждения / Концепция и архитектура Машинного фонда русского языка. М.: Наука, 1986. С. 26–44.

2. Андрющенко В.М. Концепция и архитектура Машинного фонда русского языка. М.: Наука, 1989. 196 с.

3. Булыгина Д.С., Лесников С.В. Алгоритм автоматизированного конструирования гипертекстового тезауруса (гизауруса) русского языка на основе оцифрованных словарей и справочников новых слов и значений для интерактивного лексикографического корпуса “Лексико-семантическая неология в русском языке начала XXI века? // Достижения вузовской науки 2019: сборник статей IX Международного научно-исследовательского конкурса (20 мая 2019 г. в г. Пенза). В 2 ч. Ч. 1. Пенза: МЦНС “Наука и Просвещение?. 2019. С. 119–125.

4. Булыгина Д.С., Лесников С.В. Предпосылки систематизации терминов русского языка // Сопоставительная лингвистика в современном мире: материалы Международной научно-практической конференции (Иркутск, 29-30 ноября 2012). Иркутск: Изд-во ИрГТУ, 2012. С. 64–91.

5. Герд А.С. Из размышлений на пути к новому академическому словарю современного русского языка // Язык – система. Язык – текст. Язык – способность. М.: ИРЯз РААН, 1995. С. 72–79.

6. Загоровская О.В., Лесников С.В. Виды лексикографической информации в автоматическом словаре русских говоров Коми АССР и сопредельных областей // Машинный фонд русского языка: Предпроектные исследования. М.: ИРЯз АН СССР, 1988. С. 64–70.

7. Инструкция для составления “Словаря современного русского литературного языка? (в пятнадцати томах). М.-Л.: АН СССР, 1958. 87 с.

8. Караулов Ю.Н. Активная грамматика и ассоциативно-вербальная сеть. М.: ИРЯ РАН, 1999. 180 с.

9. Лесников С.В. Автоматизированная информационно-справочная система поиска лексико-семантических вариантов вокабул русского языка // Проблемы истории, филологии, культуры. 2009. № 24. Магнитогорск: Магнитогорский ГУ, 2009. С. 622–630.

10. Лесников С.В. Академические толковые словари русского языка как ядро академического словарного корпуса русского языка // Сборник научных статей по итогам работы Международного научного форума “Наука и инновации: современные концепции? (г. Москва, 5 апреля 2019 г.). Ч.1. М.: Инфинити, 2019. С. 38–47.

11. Лесников С.В. Академический словарный корпус /АСК/ русского языка // Русский язык: исторические судьбы и современность. МГУ, 2019. С. 213–214.

12. Лесников С.В. Академический словарный корпус (АСК) русского языка // Слово и словарь = Vocabulum et vocabularium: сборник научных статей. Минск: Беларуская навука, 2019. Вып. 16. С.111–114.

13. Лесников С.В. Анализ парадигматических отношений лингвистической терминосистемы // Памяти Анатолия Анатольевича Поликарпова. МГУ, 2015. С. 269–279.

14. Лесников С.В. Аналитический реферативно-аннотированный обзор оцифрованных словарей и справочников новых слов и значений для цифрового лексикографического корпуса “Лексико-семантическая неология в русском языке начала XXI века // Сборник научных статей по итогам работы Международного научного форума “Наука и инновации: современные концепции? (г. Москва, 3 мая 2019 г.). Т.3. М.: Инфинити, 2019. С. 34–42.

15. Лесников С.В. Архитектура и суть информационно-поискового корпуса академических словарей русского языка // Научный обозреватель. Научно-аналитический журнал. № 3 (99) / 2019. С. 25–28. ISSN 2220-329X.

16. Лесников С.В. Базовые блоки автоматизированной лексикографической системы // Вестник Челябинского гос. университета. Серия: филология, искусствоведение. Вып. 60. № 33 (248). Челябинск: ЧелГУ, 2011. С. 200–202.

17. Лесников С.В. Базовые операторы языка поисковых запросов тезауруса метаязыка лингвистики // В мире научных открытий. Красноярск: НИЦ, 2012. № 7.2 (31)). С. 39–53.

18. Лесников С.В. Владислав Митрофанович Андрющенко - научный руководитель и консультант, главный конструктор Машинного фонда русского языка /МФРЯ/ // Тезисы всероссийской конференции “От языковых машинных фондов к лингвистическим корпусам: памяти В.М. Андрющенко?. МГУ, ИРЯз РАН, 2018. С. 58–60.

19. Лесников С.В. Гипертекстовый информационно-поисковый тезаурус (гизаурус) “Метаязык науки? (структура; математическое, лингвистическое и программное обеспечения; разделы лингвистика, математика, экономика) // Русский язык: исторические судьбы и современность. МГУ, 2014. С. 268–269.

20. Лесников С.В. Гипертекстовый тезаурус метаязыка науки // Проблемы истории, филологии, культуры. № 3 (33) 2011. Москва-Магнитогорск-Новосибирск: РАН; Аналитик, 2011. С. 30–34.

21. Лесников С.В. К вопросу о содержании словарной статьи тезауруса метаязыка лингвистики // Обыденное метаязыковое сознание: онтологические и гносеологические аспекты. Ч.IV. Кемерово: КГУ, 2012. С. 190–203.

22. Лесников С.В. Конструирование гипертекстового генерального свода лексики русского языка: русский гизаурус / Международная научная конференция “Язык и культура?. 14-17 сентября 2001. М.: ОЛЯ РАН, научн. журнал “Вопросы филологии?, Инст. иностранных языков, 2001. С. 280–281.

23. Лесников С.В. Конструирование гипертекстового свода лексики народных говоров русского языка // Актуальные проблемы русской диалектологии. Материалы международной конференции 26-28 октября 2018 г. М.: ИРЯз им.В.В. Виноградова РАН, 2018. С. 148–149.

24. Лесников С.В. Конструирование информационно-поискового свода академических словарей русского языка (Свод АСРЯ) // Лексический атлас русских народных говоров (Материалы и исследования) 2018. СПб.: ИЛИ РАН, 2018. С. 226–257. DOI: 10.30842/26586150201820

25. Лесников С.В. Конструирование словаря терминов метаязыка СМИ с помощью методики вычисления веса базисных терминов // Слова ў кантэксце часу: матэрыялы IV Міжнар. навук.-практ. канф., прысвеч. 90-годдзю з дня нараджэння д-ра філал. навук праф. А.І. Наркевіча, Мінск, 14–15 сак. 2019 г. Мінск: БДУ 2019. С. 66–69.

26. Лесников С.В. Конструирование словника словаря терминов метаязыка лингвистики с помощью методики вычисления веса базисных терминов метаязыка лингвистики // Социально-когнитивное функционирование языка. Кемерово: КГУ, 2017. С. 155–170.

27. Лесников С.В. Лингвистические основы информатики (теория, алгоритмы и лингвистические программы): учебное пособие. Часть 1 Сыктывкар: Изд-во Сыктыкарского гос. ун-та, 2009. 292 с.

28. Лесников С.В. Моделирование тезауруса метаязыка лингвистики на базе гипертекстовых фреймов // Вестник Вятского гос. гуманитарного ун-та. Филология и искусствоведение. № 3 (2). Киров: ВятГГУ, 2011. С. 51–54.

29. Лесников С.В. Основные латинские терминоэлементы и термины метаязыка лингвистики // Научные ведомости БелГУ. Сер. Гуманитарные науки. Белгород: БелГУ, 2011. № 12 (107). Вып.10. С.37–45.

30. Лесников С.В. Предпосылки конструирования и базовые первоисточники академического словарного корпуса русского языка // Сборник научных статей по итогам работы Международного научного форума “Наука и инновации - современные концепции? (г. Москва, 22 марта 2019 г.). Т.2. М.: Изд-во Инфинити, 2019. С.76–83.

31. Лесников С.В. Словарь русских словарей. М.: Азбуковник, 2002. 334 с.

32. Лесников С.В. Типология русских словарей лингвистической терминологии // Мир науки, культуры, образования. № 6 (31). 2011. Часть 2, декабрь 2011. С.6–10.

33. Лесников С.В. Формирование терминологического фонда русского языка // Наука сегодня: вызовы и решения: материалы международной научно-практической конференции, г. Вологда, 30 января 2019 г. Вологда: ООО “Маркер?, 2019. С.98–102.

34. Лесников С.В. Фрагмент словаря базовых терминов метаязыка лингвистики // Лексический атлас русских народных говоров (Материалы и исследования) 2017. СПб., 2017. С.335–360.

35. Лесников С.В. Фреймовое конструирование тезауруса метаязыка лингвистики // Вестник Поморского университета. Сер. Гуманитарные и социальные науки. № 4. Архангельск: ПГУ, 2011. С.84–89.

36. Лесников С.В., Загоровская О.В. Формальная грамматика словарной статьи автоматического словаря русских говоров Коми АССР и сопредельных областей /АСРГКА/ // Вторая Всесоюзная конференция по созданию Машинного фонда русского языка: Материалы конференции. М.: ИРЯз АН СССР, 1988. С. 107–119.

37. Плунгян В.А. Национальный корпус русского языка: 10 лет проекту (Предисловие) // Труды Института русского языка им. В.В. Виноградова. 2015. Т. 6. С. 11–18.

38. Проект словаря современного русского литературного языка. М.-Л.: АН СССР, 1938. 98 с.

39. Рогожникова Р.П. МФРЯ и словарное дело // МФРЯ: идеи и суждения. М.: Наука, 1986. С. 58-67.

40. Щерба Л.В. Опыт общей теории лексикографии // Изв. АН СССР. Отд. лит-ры и языка. 1940. № 3. (Переизд.: Щерба Л.В. Опыт общей теории лексикографии // Языковая система и речевая деятельность. Л., 1974).


1	Описание и репрезентация академических словарей и энциклопедий русского языка становится одной из актуальных задач корпусной лексикографии, так как многие культурные реалии уходят в прошлое и становятся частью истории. В связи с глобальной индустриализацией и урбанизацией лексика уходит в прошлое и уносит за собой огромный массив истории русского народа. Необходимость создания академического словарного корпуса русского языка для обобщающего исследования русской лексики как части исторической картины нашей страны очевидна. Кроме того, получение репрезентативного, оцифрованного академического словарного корпуса в форме гизауруса (гипертекстовый тезаурус) позволит предоставить интерактивный доступ к соответствующим лексикографическим источникам русского языка (в зависимости от запросов пользователей).	Описание и репрезентация академических словарей и энциклопедий русского языка становится одной из актуальных задач корпусной лексикографии, так как многие культурные реалии уходят в прошлое и становятся частью истории. В связи с глобальной индустриализацией и урбанизацией лексика уходит в прошлое и уносит за собой огромный массив истории русского народа. Необходимость создания академического словарного корпуса русского языка для обобщающего исследования русской лексики как части исторической картины нашей страны очевидна. Кроме того, получение репрезентативного, оцифрованного академического словарного корпуса в форме гизауруса (гипертекстовый тезаурус) позволит предоставить интерактивный доступ к соответствующим лексикографическим источникам русского языка (в зависимости от запросов пользователей). Описание и репрезентация академических словарей и энциклопедий русского языка становится одной из актуальных задач корпусной лексикографии, так как многие культурные реалии уходят в прошлое и становятся частью истории. В связи с глобальной индустриализацией и урбанизацией лексика уходит в прошлое и уносит за собой огромный массив истории русского народа. Необходимость создания академического словарного корпуса русского языка для обобщающего исследования русской лексики как части исторической картины нашей страны очевидна. Кроме того, получение репрезентативного, оцифрованного академического словарного корпуса в форме гизауруса (гипертекстовый тезаурус) позволит предоставить интерактивный доступ к соответствующим лексикографическим источникам русского языка (в зависимости от запросов пользователей).

2	Под гизаурусом понимается гипертекстовая реляционная база данных с гиперссылками (цифровой идеографический словарь, отображающий семантические отношения между лексическими единицами и предназначенный для поиска слов по их значениям) [19, с. 268–269]; [31, с.29]. Один из основателей и идеологов Машинного фонда русского языка /МФРЯ/ Ю.Н. Караулов писал: “Гипертекст – или нелинейный текст, – такая организация записи отдельных отрывков, фрагментов множества текстов (контекстов), которая позволяет комбинировать их в том или ином порядке, основываясь на задаваемых заранее переменных связях между ними, с целью получения каждый раз разных линейных последовательностей (текстов)ˮ [8, с. 154]. В настоящее время наиболее представительным и востребованным лексикографами является Национальный корпус русского языка, создаваемый под руководством А.М. Молдована (“Электронный корпус русского языка: научно-исследовательский и обучающий Интернет-ресурсˮ, “Информационное наполнение банка данных о русском языке, его истории и современном состоянииˮ), А.Н. Плунгяна [37, с. 11–18] (“Формирование и метатекстовая разметка корпуса текстов второй половины XX и XXI вв.ˮ ), Л.А. Вербицкой и Н.Н. Казанского (РФФИ № 03-04-00226а), А.Я. Шайкевича (“Создание программного обеспечения для Национального корпуса текстов русского языкаˮ), Е. В. Рахилиной (“Подготовка окончательного варианта корпуса современного русского языка: коррекция баланса и редактированиеˮ) и др. (см. [ >>>> ]). При этом академический словарно-грамматический фонд “должен состоять из нескольких подфондов, число которых не следует заранее ограничивать. Одним из таких подфондов станет свод академических словарей – наиважнейших источников зафиксированных на сегодняшний день знаний о русском языке. Такой свод должен образовать однородное семейство баз данных, в пределах которого каждый из словарей продолжал бы существование в качестве отдельной базы данных и в то же время был бы связан средствами системы управления базы данных и номенклатурой своих составляющих со всеми другими словарями. Этот объединенный словарь мог бы не только выполнять справочные функции, но и быть источников нового систематического изучения лексикиˮ [1, с. 32]. Машинный фонд русского языка [18, с. 58–60] формировался в виде нескольких систем комплексной автоматизации лингвистических исследований и предусматривал “накопление на машинных носителях всего лексического богатства русского языка, создание фонда лингвистических алгоритмов и программ, фонда полностью завершенных систем автоматического анализа и синтеза русского текста, нескольких информационно-справочных систем по языкознаниюˮ [2, с. 8].	Под гизаурусом понимается гипертекстовая реляционная база данных с гиперссылками (цифровой идеографический словарь, отображающий семантические отношения между лексическими единицами и предназначенный для поиска слов по их значениям) [19, с. 268–269]; [31, с.29]. Один из основателей и идеологов Машинного фонда русского языка /МФРЯ/ Ю.Н. Караулов писал: “Гипертекст – или нелинейный текст, – такая организация записи отдельных отрывков, фрагментов множества текстов (контекстов), которая позволяет комбинировать их в том или ином порядке, основываясь на задаваемых заранее переменных связях между ними, с целью получения каждый раз разных линейных последовательностей (текстов)ˮ [8, с. 154]. В настоящее время наиболее представительным и востребованным лексикографами является Национальный корпус русского языка, создаваемый под руководством А.М. Молдована (“Электронный корпус русского языка: научно-исследовательский и обучающий Интернет-ресурсˮ, “Информационное наполнение банка данных о русском языке, его истории и современном состоянииˮ), А.Н. Плунгяна [37, с. 11–18] (“Формирование и метатекстовая разметка корпуса текстов второй половины XX и XXI вв.ˮ ), Л.А. Вербицкой и Н.Н. Казанского (РФФИ № 03-04-00226а), А.Я. Шайкевича (“Создание программного обеспечения для Национального корпуса текстов русского языкаˮ), Е. В. Рахилиной (“Подготовка окончательного варианта корпуса современного русского языка: коррекция баланса и редактированиеˮ) и др. (см. [ <a target=_blank href="http://www.ruscorpora.ru/corpora-about.html">>>>></a> ]). При этом академический словарно-грамматический фонд “должен состоять из нескольких подфондов, число которых не следует заранее ограничивать. Одним из таких подфондов станет свод академических словарей – наиважнейших источников зафиксированных на сегодняшний день знаний о русском языке. Такой свод должен образовать однородное семейство баз данных, в пределах которого каждый из словарей продолжал бы существование в качестве отдельной базы данных и в то же время был бы связан средствами системы управления базы данных и номенклатурой своих составляющих со всеми другими словарями. Этот объединенный словарь мог бы не только выполнять справочные функции, но и быть источников нового систематического изучения лексикиˮ [1, с. 32]. Машинный фонд русского языка [18, с. 58–60] формировался в виде нескольких систем комплексной автоматизации лингвистических исследований и предусматривал “накопление на машинных носителях всего лексического богатства русского языка, создание фонда лингвистических алгоритмов и программ, фонда полностью завершенных систем автоматического анализа и синтеза русского текста, нескольких информационно-справочных систем по языкознаниюˮ [2, с. 8]. Под гизаурусом понимается гипертекстовая реляционная база данных с гиперссылками (цифровой идеографический словарь, отображающий семантические отношения между лексическими единицами и предназначенный для поиска слов по их значениям) [19, с. 268–269]; [31, с.29]. Один из основателей и идеологов Машинного фонда русского языка /МФРЯ/ Ю.Н. Караулов писал: “Гипертекст – или нелинейный текст, – такая организация записи отдельных отрывков, фрагментов множества текстов (контекстов), которая позволяет комбинировать их в том или ином порядке, основываясь на задаваемых заранее переменных связях между ними, с целью получения каждый раз разных линейных последовательностей (текстов)ˮ [8, с. 154]. В настоящее время наиболее представительным и востребованным лексикографами является Национальный корпус русского языка, создаваемый под руководством А.М. Молдована (“Электронный корпус русского языка: научно-исследовательский и обучающий Интернет-ресурсˮ, “Информационное наполнение банка данных о русском языке, его истории и современном состоянииˮ), А.Н. Плунгяна [37, с. 11–18] (“Формирование и метатекстовая разметка корпуса текстов второй половины XX и XXI вв.ˮ ), Л.А. Вербицкой и Н.Н. Казанского (РФФИ № 03-04-00226а), А.Я. Шайкевича (“Создание программного обеспечения для Национального корпуса текстов русского языкаˮ), Е. В. Рахилиной (“Подготовка окончательного варианта корпуса современного русского языка: коррекция баланса и редактированиеˮ) и др. (см. [ <a target=_blank href="http://www.ruscorpora.ru/corpora-about.html">>>>></a> ]). При этом академический словарно-грамматический фонд “должен состоять из нескольких подфондов, число которых не следует заранее ограничивать. Одним из таких подфондов станет свод академических словарей – наиважнейших источников зафиксированных на сегодняшний день знаний о русском языке. Такой свод должен образовать однородное семейство баз данных, в пределах которого каждый из словарей продолжал бы существование в качестве отдельной базы данных и в то же время был бы связан средствами системы управления базы данных и номенклатурой своих составляющих со всеми другими словарями. Этот объединенный словарь мог бы не только выполнять справочные функции, но и быть источников нового систематического изучения лексикиˮ [1, с. 32]. Машинный фонд русского языка [18, с. 58–60] формировался в виде нескольких систем комплексной автоматизации лингвистических исследований и предусматривал “накопление на машинных носителях всего лексического богатства русского языка, создание фонда лингвистических алгоритмов и программ, фонда полностью завершенных систем автоматического анализа и синтеза русского текста, нескольких информационно-справочных систем по языкознаниюˮ [2, с. 8].

3	Л.В. Щерба утверждал, что в основе словарей академического типа “лежит единое (реальное) языковое сознание определенного человеческого коллектива в определенный момент времениˮ [40, с. 266–267], и словарь академического типа рассматривал как нормативный, описывающий лексическую систему современного языка, т.е. в нем не должно быть фактов, противоречащих современному употреблению: “к нормативному (или академическому) словарю обращаются для самопроверки, а иногда и для нахождения нужного в данном контексте словаˮ [40, с. 267].	Л.В. Щерба утверждал, что в основе словарей академического типа “лежит единое (реальное) языковое сознание определенного человеческого коллектива в определенный момент времениˮ [40, с. 266–267], и словарь академического типа рассматривал как нормативный, описывающий лексическую систему современного языка, т.е. в нем не должно быть фактов, противоречащих современному употреблению: “к нормативному (или академическому) словарю обращаются для самопроверки, а иногда и для нахождения нужного в данном контексте словаˮ [40, с. 267]. Л.В. Щерба утверждал, что в основе словарей академического типа “лежит единое (реальное) языковое сознание определенного человеческого коллектива в определенный момент времениˮ [40, с. 266–267], и словарь академического типа рассматривал как нормативный, описывающий лексическую систему современного языка, т.е. в нем не должно быть фактов, противоречащих современному употреблению: “к нормативному (или академическому) словарю обращаются для самопроверки, а иногда и для нахождения нужного в данном контексте словаˮ [40, с. 267].

4	“Словарь должен быть достаточно полным, включающим все богатство современного русского литературного языка. Словарь должен быть историческим… Словарь должен дать всестороннюю семантическую, стилистическую и грамматическую характеристику слов: правописания, всего многообразия значений, особенностей фразеологического и стилистического употребления слов, образующую роль слова в группах родственных слов… В научном отношении Академический Словарь русского языка должен представлять собою такой источник, на основе которого в дальнейшем мог бы быть создан ряд малых словарей-справочников разного типа… Полный охват Академическим Словарем всех слов русского языка оправдывает его многотомность…, но мы не должны бояться такого объема издания, так как по своей научной значимости Словарь в этом случае будет таким фундаментальным документом, в котором будет отражена история развития русского языка за 200 лет и зафиксировано полностью все богатство содержания современного русского литературного языкаˮ [38, с. 3–4]. “В Словарь включается лексика русского литературного языка от эпохи Пушкина до наших дней. Поскольку задача Словаря – охватить словарное богатство русского литературного языка указанного времени, в него включаются как устойчивый, так и подвижный словарный состав. К последнему относятся устаревшие теперь слова, но бывшие употребительными в тот или иной период за охватываемую Словарем эпоху, а также слова, вновь появившиеся и вошедшие в употребление в литературном языке. Включение в Словарь устаревшей лексики, стоящей вне пределов словарных норм современного литературного языка, но употреблявшейся в литературном языке XIX и начала XX в., прежде всего диктуется тем, что русская классическая литература является неотъемлемым достоянием современной культуры, читается и изучается широкими массами населения.	“Словарь должен быть достаточно полным, включающим все богатство современного русского литературного языка. Словарь должен быть историческим… Словарь должен дать всестороннюю семантическую, стилистическую и грамматическую характеристику слов: правописания, всего многообразия значений, особенностей фразеологического и стилистического употребления слов, образующую роль слова в группах родственных слов… В научном отношении Академический Словарь русского языка должен представлять собою такой источник, на основе которого в дальнейшем мог бы быть создан ряд малых словарей-справочников разного типа… Полный охват Академическим Словарем всех слов русского языка оправдывает его многотомность…, но мы не должны бояться такого объема издания, так как по своей научной значимости Словарь в этом случае будет таким фундаментальным документом, в котором будет отражена история развития русского языка за 200 лет и зафиксировано полностью все богатство содержания современного русского литературного языкаˮ [38, с. 3–4]. “В Словарь включается лексика русского литературного языка от эпохи Пушкина до наших дней. Поскольку задача Словаря – охватить словарное богатство русского литературного языка указанного времени, в него включаются как устойчивый, так и подвижный словарный состав. К последнему относятся устаревшие теперь слова, но бывшие употребительными в тот или иной период за охватываемую Словарем эпоху, а также слова, вновь появившиеся и вошедшие в употребление в литературном языке. Включение в Словарь устаревшей лексики, стоящей вне пределов словарных норм современного литературного языка, но употреблявшейся в литературном языке XIX и начала XX в., прежде всего диктуется тем, что русская классическая литература является неотъемлемым достоянием современной культуры, читается и изучается широкими массами населения. “Словарь должен быть достаточно полным, включающим все богатство современного русского литературного языка. Словарь должен быть историческим… Словарь должен дать всестороннюю семантическую, стилистическую и грамматическую характеристику слов: правописания, всего многообразия значений, особенностей фразеологического и стилистического употребления слов, образующую роль слова в группах родственных слов… В научном отношении Академический Словарь русского языка должен представлять собою такой источник, на основе которого в дальнейшем мог бы быть создан ряд малых словарей-справочников разного типа… Полный охват Академическим Словарем всех слов русского языка оправдывает его многотомность…, но мы не должны бояться такого объема издания, так как по своей научной значимости Словарь в этом случае будет таким фундаментальным документом, в котором будет отражена история развития русского языка за 200 лет и зафиксировано полностью все богатство содержания современного русского литературного языкаˮ [38, с. 3–4]. “В Словарь включается лексика русского литературного языка от эпохи Пушкина до наших дней. Поскольку задача Словаря – охватить словарное богатство русского литературного языка указанного времени, в него включаются как устойчивый, так и подвижный словарный состав. К последнему относятся устаревшие теперь слова, но бывшие употребительными в тот или иной период за охватываемую Словарем эпоху, а также слова, вновь появившиеся и вошедшие в употребление в литературном языке. Включение в Словарь устаревшей лексики, стоящей вне пределов словарных норм современного литературного языка, но употреблявшейся в литературном языке XIX и начала XX в., прежде всего диктуется тем, что русская классическая литература является неотъемлемым достоянием современной культуры, читается и изучается широкими массами населения.

5	Помещение в Словаре новых слов совершенно необходимо в связи с бурным развитием … науки и техники, промышленности и сельского хозяйства и т. д., находящим свое отражение в непрерывном обогащении лексики современного литературного языка.	Помещение в Словаре новых слов совершенно необходимо в связи с бурным развитием … науки и техники, промышленности и сельского хозяйства и т. д., находящим свое отражение в непрерывном обогащении лексики современного литературного языка. Помещение в Словаре новых слов совершенно необходимо в связи с бурным развитием … науки и техники, промышленности и сельского хозяйства и т. д., находящим свое отражение в непрерывном обогащении лексики современного литературного языка.

6	Новые слова, получающие общелитературное значение, нуждаются в филологическом объяснении и регистрации в академическом толковом словареˮ [7, с. 10].	Новые слова, получающие общелитературное значение, нуждаются в филологическом объяснении и регистрации в академическом толковом словареˮ [7, с. 10]. Новые слова, получающие общелитературное значение, нуждаются в филологическом объяснении и регистрации в академическом толковом словареˮ [7, с. 10].

7	“Академический словарь, как и любой словарь – это вид информационного справочного издания. Не случайно словарь, переведенный на ЭВМ, при наличии комплекса программ, быстро превращается в автоматизированную информационно-справочную систему.	“Академический словарь, как и любой словарь – это вид информационного справочного издания. Не случайно словарь, переведенный на ЭВМ, при наличии комплекса программ, быстро превращается в автоматизированную информационно-справочную систему. “Академический словарь, как и любой словарь – это вид информационного справочного издания. Не случайно словарь, переведенный на ЭВМ, при наличии комплекса программ, быстро превращается в автоматизированную информационно-справочную систему.

8	И в этом отношении академический словарь представляет собой вторичный текст, вторичный документ по отношению к своему первичному объекту – текстам. Тексты первичны, словарь вторичен.	И в этом отношении академический словарь представляет собой вторичный текст, вторичный документ по отношению к своему первичному объекту – текстам. Тексты первичны, словарь вторичен. И в этом отношении академический словарь представляет собой вторичный текст, вторичный документ по отношению к своему первичному объекту – текстам. Тексты первичны, словарь вторичен.

9	По самой своей специфике толковый академический словарь – это многогранное и, главное, разноаспектное, полипараметрическое описание языковых фактов текстов.	По самой своей специфике толковый академический словарь – это многогранное и, главное, разноаспектное, полипараметрическое описание языковых фактов текстов. По самой своей специфике толковый академический словарь – это многогранное и, главное, разноаспектное, полипараметрическое описание языковых фактов текстов.

10	Слово в языке, слово в его употреблении и в текстах описывается в академическом словаре исходя из самых разных лингвистических дисциплин (лексикология, грамматика, стилистика, литературоведение), а иногда и с разных исследовательских позиций. Однако именно в этом и состоит главное достоинство такого словаря, таким он и должен быть. Любой алфавитный академический словарь – это своеобразная многосторонняя лингвистическая энциклопедия слова.	Слово в языке, слово в его употреблении и в текстах описывается в академическом словаре исходя из самых разных лингвистических дисциплин (лексикология, грамматика, стилистика, литературоведение), а иногда и с разных исследовательских позиций. Однако именно в этом и состоит главное достоинство такого словаря, таким он и должен быть. Любой алфавитный академический словарь – это своеобразная многосторонняя лингвистическая энциклопедия слова. Слово в языке, слово в его употреблении и в текстах описывается в академическом словаре исходя из самых разных лингвистических дисциплин (лексикология, грамматика, стилистика, литературоведение), а иногда и с разных исследовательских позиций. Однако именно в этом и состоит главное достоинство такого словаря, таким он и должен быть. Любой алфавитный академический словарь – это своеобразная многосторонняя лингвистическая энциклопедия слова.

11	При этом и в зарубежной лексикографии наблюдается вполне закономерная тенденция к увеличению числа параметров описания слова в словаре; и это понятно – чем больше параметров, тем шире информационный диапазон словаря и круг потребителей самого словаряˮ [5 , с. 73].	При этом и в зарубежной лексикографии наблюдается вполне закономерная тенденция к увеличению числа параметров описания слова в словаре; и это понятно – чем больше параметров, тем шире информационный диапазон словаря и круг потребителей самого словаряˮ [5 , с. 73]. При этом и в зарубежной лексикографии наблюдается вполне закономерная тенденция к увеличению числа параметров описания слова в словаре; и это понятно – чем больше параметров, тем шире информационный диапазон словаря и круг потребителей самого словаряˮ [5 , с. 73].

12	В качестве основы корпуса используются оцифрованные нами к настоящему времени академические толковые словари русского языка, изданные Императорской АН, АН СССР, РАН (315 томов, выпусков, частей) (подробный список академических словарей см. [10, с. 38–47]; [24, с.226–257]). Здесь перечислим самые значительные и объёмные: Словарь Академии Российской (6 частей от А до Я. СПб. 1789–1794, 2-ое изд. 1806–1822), Словарь церковно-славянского и русского языка, составленный II Отделением Академии Наук (4 тома от А до Я. СПб. 1847, 2-ое изд. 1867–1868), Словарь русского языка (Грото-Шахматовский 1891–1937, 53 вып.), Толковый словарь русского языка (под ред. Д.Н.Ушакова, 1934–1940, 4 тт.), Словарь современного русского литературного языка (1948–1965, т.1 издавался два раза: 1948 и 1950 гг., 18 тт.; 1991–1994, 6 тт.; 2004–2017, 24 тт.); Словарь русского языка (Ожегов С.И., гл. ред. С.П. Обнорский, 1949), Словарь русского языка (под ред. А. П. Евгеньевой, 1957–1961, 1981–1984, 1985–1988, 4 тт.), Словарь русских народных говоров (1965–2018, 51 вып.) [23, с. 148–149]; Словарь русского языка XI–XVII (1975–2015, 30 вып.); Новые слова и значения (1977–2014, 24 тт.); Словарь русского языка XVIII века (1984–2013, 20 вып.) [17, с. 34–42].	В качестве основы корпуса используются оцифрованные нами к настоящему времени академические толковые словари русского языка, изданные Императорской АН, АН СССР, РАН (315 томов, выпусков, частей) (подробный список академических словарей см. [10, с. 38–47]; [24, с.226–257]). Здесь перечислим самые значительные и объёмные: Словарь Академии Российской (6 частей от А до Я. СПб. 1789–1794, 2-ое изд. 1806–1822), Словарь церковно-славянского и русского языка, составленный II Отделением Академии Наук (4 тома от А до Я. СПб. 1847, 2-ое изд. 1867–1868), Словарь русского языка (Грото-Шахматовский 1891–1937, 53 вып.), Толковый словарь русского языка (под ред. Д.Н.Ушакова, 1934–1940, 4 тт.), Словарь современного русского литературного языка (1948–1965, т.1 издавался два раза: 1948 и 1950 гг., 18 тт.; 1991–1994, 6 тт.; 2004–2017, 24 тт.); Словарь русского языка (Ожегов С.И., гл. ред. С.П. Обнорский, 1949), Словарь русского языка (под ред. А. П. Евгеньевой, 1957–1961, 1981–1984, 1985–1988, 4 тт.), Словарь русских народных говоров (1965–2018, 51 вып.) [23, с. 148–149]; Словарь русского языка XI–XVII (1975–2015, 30 вып.); Новые слова и значения (1977–2014, 24 тт.); Словарь русского языка XVIII века (1984–2013, 20 вып.) [17, с. 34–42]. В качестве основы корпуса используются оцифрованные нами к настоящему времени академические толковые словари русского языка, изданные Императорской АН, АН СССР, РАН (315 томов, выпусков, частей) (подробный список академических словарей см. [10, с. 38–47]; [24, с.226–257]). Здесь перечислим самые значительные и объёмные: Словарь Академии Российской (6 частей от А до Я. СПб. 1789–1794, 2-ое изд. 1806–1822), Словарь церковно-славянского и русского языка, составленный II Отделением Академии Наук (4 тома от А до Я. СПб. 1847, 2-ое изд. 1867–1868), Словарь русского языка (Грото-Шахматовский 1891–1937, 53 вып.), Толковый словарь русского языка (под ред. Д.Н.Ушакова, 1934–1940, 4 тт.), Словарь современного русского литературного языка (1948–1965, т.1 издавался два раза: 1948 и 1950 гг., 18 тт.; 1991–1994, 6 тт.; 2004–2017, 24 тт.); Словарь русского языка (Ожегов С.И., гл. ред. С.П. Обнорский, 1949), Словарь русского языка (под ред. А. П. Евгеньевой, 1957–1961, 1981–1984, 1985–1988, 4 тт.), Словарь русских народных говоров (1965–2018, 51 вып.) [23, с. 148–149]; Словарь русского языка XI–XVII (1975–2015, 30 вып.); Новые слова и значения (1977–2014, 24 тт.); Словарь русского языка XVIII века (1984–2013, 20 вып.) [17, с. 34–42].

13	Основной задачей создания академического словарного корпуса русского языка на основе академических толковых словарей является развернутое описание употребления русской лексики, а также показ лексического и семантического богатства русского языка во всем его многообразии за последние несколько веков. За этот период значительная часть нормативной лексики русского литературного языка изменялась и парадигматически и семантически. Корпус позволяет прослеживать эти исторические изменения современному пользователю, что безусловно будет способствовать повышению культуры русской речи и качеству исследований в области русского литературного языка. Поэтому авторы-составители и редакторы академического словарного корпуса должны быть предельно ответственны в процессе отбора оцифровываемых толковых словарей и конструирования информационно-поисковой системы в форме гизауруса.	Основной задачей создания академического словарного корпуса русского языка на основе академических толковых словарей является развернутое описание употребления русской лексики, а также показ лексического и семантического богатства русского языка во всем его многообразии за последние несколько веков. За этот период значительная часть нормативной лексики русского литературного языка изменялась и парадигматически и семантически. Корпус позволяет прослеживать эти исторические изменения современному пользователю, что безусловно будет способствовать повышению культуры русской речи и качеству исследований в области русского литературного языка. Поэтому авторы-составители и редакторы академического словарного корпуса должны быть предельно ответственны в процессе отбора оцифровываемых толковых словарей и конструирования информационно-поисковой системы в форме гизауруса. Основной задачей создания академического словарного корпуса русского языка на основе академических толковых словарей является развернутое описание употребления русской лексики, а также показ лексического и семантического богатства русского языка во всем его многообразии за последние несколько веков. За этот период значительная часть нормативной лексики русского литературного языка изменялась и парадигматически и семантически. Корпус позволяет прослеживать эти исторические изменения современному пользователю, что безусловно будет способствовать повышению культуры русской речи и качеству исследований в области русского литературного языка. Поэтому авторы-составители и редакторы академического словарного корпуса должны быть предельно ответственны в процессе отбора оцифровываемых толковых словарей и конструирования информационно-поисковой системы в форме гизауруса.

14	В основе концепции, определяющей цель и содержание разработки и создания академического словарного корпуса, лежат следующие принципы:	В основе концепции, определяющей цель и содержание разработки и создания академического словарного корпуса, лежат следующие принципы: В основе концепции, определяющей цель и содержание разработки и создания академического словарного корпуса, лежат следующие принципы:

15	1) при отборе лексикографического материала – максимально полный охват слов и выражений и их значений из разнообразных корпусов словарей и текстов с использованием современных информационных ресурсов; 2) на уровне макроструктуры академического словарного корпуса – тезаурусный, тематический, идеографический и концептный принципы систематизации материалов по категориям, разделам и рубрикам; 3) на уровне микроструктуры академического словарного корпуса – расширенные зоны: вокабулы (заглавного слова, лемм, вариантов лексических единиц); значения (дефиниции, изъяснения, интерпретации) и полисемии (многозначности, оттенков значения, переносных значений, отсылочных значений); комментариев и иллюстраций семантики лексических единиц русского языка.	1) при отборе лексикографического материала – максимально полный охват слов и выражений и их значений из разнообразных корпусов словарей и текстов с использованием современных информационных ресурсов; 2) на уровне макроструктуры академического словарного корпуса – тезаурусный, тематический, идеографический и концептный принципы систематизации материалов по категориям, разделам и рубрикам; 3) на уровне микроструктуры академического словарного корпуса – расширенные зоны: вокабулы (заглавного слова, лемм, вариантов лексических единиц); значения (дефиниции, изъяснения, интерпретации) и полисемии (многозначности, оттенков значения, переносных значений, отсылочных значений); комментариев и иллюстраций семантики лексических единиц русского языка. 1) при отборе лексикографического материала – максимально полный охват слов и выражений и их значений из разнообразных корпусов словарей и текстов с использованием современных информационных ресурсов; 2) на уровне макроструктуры академического словарного корпуса – тезаурусный, тематический, идеографический и концептный принципы систематизации материалов по категориям, разделам и рубрикам; 3) на уровне микроструктуры академического словарного корпуса – расширенные зоны: вокабулы (заглавного слова, лемм, вариантов лексических единиц); значения (дефиниции, изъяснения, интерпретации) и полисемии (многозначности, оттенков значения, переносных значений, отсылочных значений); комментариев и иллюстраций семантики лексических единиц русского языка.

16	Академический словарный корпус предполагает гипертекстовое, интегральное, всестороннее, единообразное и кумулятивное описание и представление лексических единиц русского языка.	Академический словарный корпус предполагает гипертекстовое, интегральное, всестороннее, единообразное и кумулятивное описание и представление лексических единиц русского языка. Академический словарный корпус предполагает гипертекстовое, интегральное, всестороннее, единообразное и кумулятивное описание и представление лексических единиц русского языка.

17	В основе разработки и создания корпуса лежит идея комплексного многоаспектного лексикографического описания системы русского языка, включающей предметный, географический, грамматический, исторический, источниковедческий, прагматический, семантический, стилистический, фонетический, этимологический и другие аспекты и отражающей реальную лексико-грамматическую структуру лексических единиц во всем многообразии.	В основе разработки и создания корпуса лежит идея комплексного многоаспектного лексикографического описания системы русского языка, включающей предметный, географический, грамматический, исторический, источниковедческий, прагматический, семантический, стилистический, фонетический, этимологический и другие аспекты и отражающей реальную лексико-грамматическую структуру лексических единиц во всем многообразии. В основе разработки и создания корпуса лежит идея комплексного многоаспектного лексикографического описания системы русского языка, включающей предметный, географический, грамматический, исторический, источниковедческий, прагматический, семантический, стилистический, фонетический, этимологический и другие аспекты и отражающей реальную лексико-грамматическую структуру лексических единиц во всем многообразии.

18	При формировании корпуса выдерживаются следующие принципы: нормативность, системность [4, с. 64–91] и интегральность; актуальность, проверяемость и реальность источников лексических единиц; функциональность (совместное рассмотрение структуры и системы многоаспектного поиска с приоритетом функций над структурой); целенаправленность с выделением глобальной цели (оптимальность подсистем не является оптимумом для системы поиска); единство (совместное рассмотрение системы как целого и как совокупности частей; синхрония, диахрония и панхрония) и единообразие; развитие (учет изменяемости системы, ее способности к развитию, накапливанию информации с учетом динамики окружающей среды, напр., использование статистики пользовательских запросов и новых лексикографических источников); иерархичность (учет использования соподчинения и ранжирования частей, напр., систематизация по тематическому, хронологическому и частотному параметрам) и структурность (напр., структурные уровни языка: графический морфологический, семантический, синтаксический, фонетический, этимологический); агрегирование (объединение и укрупнение значений); децентрализация (распараллеливание запросов по распределенным на разных серверах лексическим базам данных).	При формировании корпуса выдерживаются следующие принципы: нормативность, системность [4, с. 64–91] и интегральность; актуальность, проверяемость и реальность источников лексических единиц; функциональность (совместное рассмотрение структуры и системы многоаспектного поиска с приоритетом функций над структурой); целенаправленность с выделением глобальной цели (оптимальность подсистем не является оптимумом для системы поиска); единство (совместное рассмотрение системы как целого и как совокупности частей; синхрония, диахрония и панхрония) и единообразие; развитие (учет изменяемости системы, ее способности к развитию, накапливанию информации с учетом динамики окружающей среды, напр., использование статистики пользовательских запросов и новых лексикографических источников); иерархичность (учет использования соподчинения и ранжирования частей, напр., систематизация по тематическому, хронологическому и частотному параметрам) и структурность (напр., структурные уровни языка: графический морфологический, семантический, синтаксический, фонетический, этимологический); агрегирование (объединение и укрупнение значений); децентрализация (распараллеливание запросов по распределенным на разных серверах лексическим базам данных). При формировании корпуса выдерживаются следующие принципы: нормативность, системность [4, с. 64–91] и интегральность; актуальность, проверяемость и реальность источников лексических единиц; функциональность (совместное рассмотрение структуры и системы многоаспектного поиска с приоритетом функций над структурой); целенаправленность с выделением глобальной цели (оптимальность подсистем не является оптимумом для системы поиска); единство (совместное рассмотрение системы как целого и как совокупности частей; синхрония, диахрония и панхрония) и единообразие; развитие (учет изменяемости системы, ее способности к развитию, накапливанию информации с учетом динамики окружающей среды, напр., использование статистики пользовательских запросов и новых лексикографических источников); иерархичность (учет использования соподчинения и ранжирования частей, напр., систематизация по тематическому, хронологическому и частотному параметрам) и структурность (напр., структурные уровни языка: графический морфологический, семантический, синтаксический, фонетический, этимологический); агрегирование (объединение и укрупнение значений); децентрализация (распараллеливание запросов по распределенным на разных серверах лексическим базам данных).

19	Кратко алгоритм разработки и создания корпуса выглядит следующим образом:	Кратко алгоритм разработки и создания корпуса выглядит следующим образом: Кратко алгоритм разработки и создания корпуса выглядит следующим образом:

20	1) Анализ современного состояния корпусной лингвистики (анализ существующих словарных источников и потребностей адресата – конечного пользователя корпуса) [32, с. 6–10]. Выбор источников и кластеризация предметной области. При выборе источников учитывается: наиболее точное соответствие лексического материала предметной области [22, с.280–281]; технологическая насыщенность и важность источников. Разработка многоуровневой структуры (макроструктура – композиция, внутренняя организация, принципы отбора источников; микроструктура и мультимедиаструктура) и параметров корпуса [6, с. 64–70]. Конструирование интерактивного отображения словарных статей корпуса, т.е. интерфейса (напр., краткий свернутый, развернутый с иллюстрациями, контекстами и иллюстрациями, расширенный – полный, многоязычный).	1) Анализ современного состояния корпусной лингвистики (анализ существующих словарных источников и потребностей адресата – конечного пользователя корпуса) [32, с. 6–10]. Выбор источников и кластеризация предметной области. При выборе источников учитывается: наиболее точное соответствие лексического материала предметной области [22, с.280–281]; технологическая насыщенность и важность источников. Разработка многоуровневой структуры (макроструктура – композиция, внутренняя организация, принципы отбора источников; микроструктура и мультимедиаструктура) и параметров корпуса [6, с. 64–70]. Конструирование интерактивного отображения словарных статей корпуса, т.е. интерфейса (напр., краткий свернутый, развернутый с иллюстрациями, контекстами и иллюстрациями, расширенный – полный, многоязычный). 1) Анализ современного состояния корпусной лингвистики (анализ существующих словарных источников и потребностей адресата – конечного пользователя корпуса) [32, с. 6–10]. Выбор источников и кластеризация предметной области. При выборе источников учитывается: наиболее точное соответствие лексического материала предметной области [22, с.280–281]; технологическая насыщенность и важность источников. Разработка многоуровневой структуры (макроструктура – композиция, внутренняя организация, принципы отбора источников; микроструктура и мультимедиаструктура) и параметров корпуса [6, с. 64–70]. Конструирование интерактивного отображения словарных статей корпуса, т.е. интерфейса (напр., краткий свернутый, развернутый с иллюстрациями, контекстами и иллюстрациями, расширенный – полный, многоязычный).

Библиография

Комментарии

Войти через