Metadata of Linguistic Resources: History and Current State

Antopolskii, Alexander

doi:10.31857/S160578800018917-4

English

Home>Issue 1>Metadata of Linguistic Resources: History and Current State

Metadata of Linguistic Resources: History and Current State

Table of contents

Annotation Estimate Publication content

References Comments

Metadata of Linguistic Resources: History and Current State

Annotation

PII

S160578800018917-4-1

DOI

10.31857/S160578800018917-4

Publication type

Article

Status

Published

Authors

Alexander Antopolskii Send message

Occupation: Head Researcher
Affiliation: The Institute of Scientific Information for Social Sciences of the RAS (INION RAN)
Address: 51-21 Nakhimovskiy Prospect, Moscow, 117997, Russia

Edition

Volume 81 Issue 1

Pages

21-36

Abstract

The main metadata projects for linguistic (language) resources developed over the past 20 years are described. These include the IMDI initiative, the OLAC metadata system. the META-SHARE meta-model, the International Standard Number of Language resources, the evaluation map of language resources, and the CLARIN component metadata model. The content of the ISO metadata standard is described. Projects for creating dictionaries, ontologies, and lexical databases for metadata of language resources are described.

Keywords

Metadata, linguistic resources, language resources, standards, dictionaries, ontologies

Received

15.06.2021

Date of publication

11.03.2022

Number of purchasers

Views

915

Readers community rating

0.0 (0 votes)

Cite Download pdf

GOST	Antopolskii A. Metadata of Linguistic Resources: History and Current State // Izvestiia Rossiiskoi akademii nauk. Seriia literatury i iazyka. – 2022. – V. 81. – Issue 1 C. 21-36 . URL: https://izv-oifn.ru/s160578800018917-4-1/. DOI: 10.31857/S160578800018917-4
MLA	Antopolskii, Alexander "Metadata of Linguistic Resources: History and Current State." Izvestiia Rossiiskoi akademii nauk. Seriia literatury i iazyka. 81.1 (2022).:21-36. DOI: 10.31857/S160578800018917-4
APA	Antopolskii A. (2022). Metadata of Linguistic Resources: History and Current State. Izvestiia Rossiiskoi akademii nauk. Seriia literatury i iazyka. vol. 81, no. 1, pp.21-36 DOI: 10.31857/S160578800018917-4

Additional services access

Additional services for the article

Services benefits

100 RUB / 1.0 SU

Additional services for the issue

Services benefits

920 RUB / 16.0 SU

Additional services for all issues for 2022

Services benefits

4365 RUB / 87.0 SU

References

1. A Proposal for a Meta Description Standard for Language Resources https://www.mpi.nl/ISLE/documents/papers/white_paper_11.pdf

2. Metadata Elements for Lexicon Descriptions https://www.mpi.nl/ISLE/documents/draft/ISLE_Lexicon_1.0.pdf

3. IMDI Team, (August 2001), Vocabulary Taxonomy and Structure, Version 1.1, MPI Nijmegen

4. Mapping IMDI Session Descriptions with OLAC Draft Proposal Version 1.0 August, 2001 IMDI Technical Report Max-Planck-Institute for Psycholinguistics NL, Nijmegen

5. Arbil for editing and managing IMDI metadata. Version 2.6. https://www.mpi.nl/corpus/html/arbil-imdi/index.html

6. IMDI Documents https://www.mpi.nl/ISLE/documents/docs_frame.html

7. OLAC Metadata http://olac.ldc.upenn.edu/OLAC/metadata.html

8. OLAC Metadata Usage Guidelines http://olac.ldc.upenn.edu/NOTE/usage.html

9. Dublin Core XML https://dcxml.readthedocs.io/en/latest/

10. Documentation and User Manual of the META-SHARE Metadata Model http://www.meta-net.eu/public_documents/t4me/META-NET-D7.2.4-Final.pdf

11. Gavrilidou, M., Labropoulou, P., Piperidis, S., Speranza, M., Monachini, M., Arranz, V., Francopoulo, G. META-NET Deliverable D7.2.1 – Specification of Metadata-Based Descriptions for Language Resources and Technologies, 2011, http://t4me.dfki.de/intranet/document_repository/deliverables/wp07-infrastructure-functional-and-technical-specification/meta-net-d7.2.1-final.pdf/view

12. Technologies for the Multilingual European Information Society. Specification of metadata-based descriptions for language resources and technologies. Penny Labropoulou, Maria Gavrilidou, Elina Desipri, Stelios, Piperidis (R.C. Athena. ILSP), Francesca Frontini, Monica Monachini (ILC. CNR), Victoria Arranz (ELDA), Gil Francopoulo (LIMSI). Final Report, 2012 http://www.meta-net.eu/public_documents/t4me/META-NET-D7.2.2-Final.pdf

13. International Standard Language Resource Number http://www.islrn.org/

14. LRE map http://www.elra.info/en/catalogues/lre-map/

15. Component Metadata https://www.clarin.eu/content/component-metadata

16. CMDI 1.2 specification Version 1 Date 2016-10-20 https://office.clarin.eu/v/CE-2016-0880-CMDI_12_specification.pdf

17. CMDI 1.2 https://www.clarin.eu/cmdi1.2

18. CMDI Best Practices Guide https://www.clarin.eu/content/cmdi-best-practices-guide

19. AP3-007-CMDI_and_granularity.pdf https://www.clarin.eu/media/1790

20. CMDI-first-aid-kit.pdf https://www.clarin.eu/sites/default/files/CMDI-first-aid-kit.pdf

21. Component Registry Documentation. Component Registry, Browser and Editor Reference Manual https://www.clarin.eu/content/component-registry-documentation

22. CLARIN Concept Registry https://www.clarin.eu/ccr

23. Virtual Language Observatory (VLO) https://www.clarin.eu/content/virtual-language-observatory-vlo

24. Poiskovye servisy i instrumenty Instituta Meertensa [Search Services and Tools of the Mertens Institute] https://www.meertens.knaw.nl/cmdi/search/#q=*%3A* (In Russ.)

25. Fedora_OAI_Konfiguration_v3.pdf https://www.clarin-d.net/images/ leipzig/Fedora_OAI_Konfiguration_v3.pdf

26. IDS Repository Architecture and Ingest Pipelines http://repos.ids-mannheim.de/reposdescription.html

27. Linguistic Data and NLP Tools. About metadata https://lindat.mff.cuni.cz/repository/xmlui/page/ metadata

28. ISO 24622-1:2015 Language resource management – Component Metadata Infrastructure (CMDI) – Part 1: The Component Metadata Model https://www.iso.org/ru/standard/37336.html

29. ISO 24622-2:2019 Language resource management – Component metadata infrasctructure (CMDI) – Part 2: Component metadata specification language https://www.iso.org/obp/ui/#iso:std:iso:24622:-2:ed-1:v1:en

30. ISO 12620:2009 Terminology and other language and content resources – Specification of data categories and management of a Data Category Registry for language resources https://www.iso.org/standard/37243.html

31. ISO 12620:2019 Management of terminology resources – Data category specifications https://www.iso.org/standard/69550.html

32. GOST R ISO 12620-2012 Terminologiya, drugie yazykovye resursy i resursy soderzhaniya. Spetsifikatsiya kategorij dannykh i vedenie reestra kategorij dannykh dlya yazykovykh resursov http://docs.cntd.ru/document/ 1200104401 [GOST R ISO 12620-2012 Terminologiya, drugie yazykovye resursy i resursy soderzhaniya. Specifikaciya kategorij dannyh i vedenie reestra kategorij dannyh dlya yazykovyh resursov [GOST R ISO 12620-2012 Terminology, Other Language Resources and Content Resources. Specification of Data Categories and Maintaining a Register of Data Categories for Language Resources] http://docs.cntd.ru/document/ 1200104401 (In Russ.)].

33. The Center for Sustainability of Linguistic Data (NaLiDa) http://www.sfs.uni-tuebingen.de/nalida/en/

34. Rational Reconstruction for TDG Metadata http://www.sfs.uni-tuebingen.de/nalida/images/isocat/isocat_hierarchy.html

35. Data Category Repository (DCR) http://datcatinfo.net/

36. TERMWEB https://datcatinfo.termweb.se/termweb/app

37. CLARIN Concept Registry Browser https://concepts.clarin.eu/ccr/browser/

38. Linguistic Metadata (LIME) vocabulary https://lod-cloud.net/dataset/lime

39. About the ontology. What is LexInfo? https://lexinfo.net/

40. Antopol'skij A.B., Savchuk S.O., Tameev A.A. O razrabotke ontologii poiskovykh terminov po lingvistike // Informatsionnye resursy Rossii. 2020. № 4. S. 2–7. [Antopolsky, A.B., Savchuk, S.O., Tameev, A.A. O razrabotke ontologii poiskovyh terminov po lingvistike [On the Development of an Ontology of Search Terms in Linguistics] Informacionnye resursy Rossii [Information Resources of Russia]. 2020, No. 4, pp. 2–7. (In Russ.)].

41. Ontologiya poiskovykh terminov po lingvistike http://db.inion.ru/optel/ [Ontologiya poiskovyh terminov po lingvistike [Ontology of Search Terms in Linguistics] http://db.inion.ru/optel/ (In Russ.)].

42. Antopol'skij A.B., Maksimov N.V., Tameev A.A. Ehksperimental'naya baza dannykh istochnikov dlya sozdaniya ontologii po lingvistike // Informatsionnye resursy Rossii. 2021. № 3. S. 24–30. DOI: 10.46920/0204-3653_2021_03181_24 [Antopolsky, A.B., Maksimov, N.V., Tameev, A.A. Eksperimentalnaya baza dannyh istochnikov dlya sozdaniya ontologii po lingvistike [Experimental Database of Sources for Creating an Ontology on Linguistics]. Informacionnye resursy Rossii [Information Resources of Russia]. 2021, No. 3, pp. 24–30. DOI: 10.46920/0204-3653_2021_03181_24 (In Russ.)].

Comments

No posts found

Write a review

Translate

Введение

Проект метаданных IMDI

Метаданные OLAC⁴

Метамодель META-SHARE

Основы модели

Онтологии META-SHARE

Таксономия ЛР

Основное содержание и структура модели

Структура представления и условные обозначения

Международный стандартный номер языковых ресурсов (ISLRN) [13]

Карта LRE [14]

Инфраструктура компонентов метаданных (CMDI) CLARIN [15]

Спецификация CMDI 1.2 [16]

Реестр понятий CLARIN [22]

Инструментальные средства CMDI

Поисковые инструменты

Использование CMDI в различных проектах

Стандартизация метаданных ЛР

Словари метаданных и реестры категорий данных

ISOcat [33].

База данных DatCatInfo [35].

Реестр понятий CLARIN [22]

Словарь лингвистических метаданных (LIME) [38]

LexInfo [39]

База данных лексики метаданных российских ЛР

Заключение

References

Comments


1	Введение	<h3><strong>Введение</strong></h3> <h3><strong>Введение</strong></h3>

2	Лингвистические (языковые) ресурсы (ЛР)¹ – это наборы данных, представляющие примеры использования языка, либо непосредственно, как в корпусах, либо в виде производных данных, как в лексиконах и онтологиях. ЛР используются в лингвистике и смежных областях, таких как язык жестов, антропология, компьютерная лингвистика, искусственный интеллект, фонетика, психология, распознавание речи, мультимодальные исследования и человеко-машинный интерфейс, дизайн. Лингвисты используют их для создания и проверки новых лингвистических гипотез; инженеры по распознаванию речи используют их для тестирования устройств распознавания речи и установки параметров распознавания. 1. В данной статье, в отличие от англоязычных аналогов, термины лингвистические и языковые ресурсы не различаются, и для них используется общая аббревиатура ЛР.	Лингвистические (языковые) ресурсы (ЛР)<sup>1</sup> – это наборы данных, представляющие примеры использования языка, либо непосредственно, как в корпусах, либо в виде производных данных, как в лексиконах и онтологиях. ЛР используются в лингвистике и смежных областях, таких как язык жестов, антропология, компьютерная лингвистика, искусственный интеллект, фонетика, психология, распознавание речи, мультимодальные исследования и человеко-машинный интерфейс, дизайн. Лингвисты используют их для создания и проверки новых лингвистических гипотез; инженеры по распознаванию речи используют их для тестирования устройств распознавания речи и установки параметров распознавания. Лингвистические (языковые) ресурсы (ЛР)<sup>1</sup> – это наборы данных, представляющие примеры использования языка, либо непосредственно, как в корпусах, либо в виде производных данных, как в лексиконах и онтологиях. ЛР используются в лингвистике и смежных областях, таких как язык жестов, антропология, компьютерная лингвистика, искусственный интеллект, фонетика, психология, распознавание речи, мультимодальные исследования и человеко-машинный интерфейс, дизайн. Лингвисты используют их для создания и проверки новых лингвистических гипотез; инженеры по распознаванию речи используют их для тестирования устройств распознавания речи и установки параметров распознавания.
	1. В данной статье, в отличие от англоязычных аналогов, термины лингвистические и языковые ресурсы не различаются, и для них используется общая аббревиатура ЛР.
3	Развитие Всемирной паутины с ее связанными веб-страницами открыло новые возможности для распространения и повторного использования ЛР, но и поставило новые задачи. Возникла потребность создать пространство связанных ЛР с информацией о них. Это пространство должно быть доступно через Интернет с соответствующими инструментами для просмотра и поиска. Иначе говоря, возникла необходимость в разработке системы метаданных для ЛР.	Развитие Всемирной паутины с ее связанными веб-страницами открыло новые возможности для распространения и повторного использования ЛР, но и поставило новые задачи. Возникла потребность создать пространство связанных ЛР с информацией о них. Это пространство должно быть доступно через Интернет с соответствующими инструментами для просмотра и поиска. Иначе говоря, возникла необходимость в разработке системы метаданных для ЛР. Развитие Всемирной паутины с ее связанными веб-страницами открыло новые возможности для распространения и повторного использования ЛР, но и поставило новые задачи. Возникла потребность создать пространство связанных ЛР с информацией о них. Это пространство должно быть доступно через Интернет с соответствующими инструментами для просмотра и поиска. Иначе говоря, возникла необходимость в разработке системы метаданных для ЛР.

4	Но ЛР значительно различаются, поэтому возникает вопрос, как такое разнообразие приложений может быть представлено одной системой метаданных. Дискуссии по этому поводу ведутся достаточно давно, первый проект системы метаданных для ЛР появился в 2001 г. Позже появилось еще несколько проектов, как опирающихся на стандартные системы метаданных, прежде всего на Дублинское ядро метаданных, так и развивающие специальные системы метаданных для ЛР. Одна из систем метаданных получила статус стандарта ISO.	Но ЛР значительно различаются, поэтому возникает вопрос, как такое разнообразие приложений может быть представлено одной системой метаданных. Дискуссии по этому поводу ведутся достаточно давно, первый проект системы метаданных для ЛР появился в 2001 г. Позже появилось еще несколько проектов, как опирающихся на стандартные системы метаданных, прежде всего на Дублинское ядро метаданных, так и развивающие специальные системы метаданных для ЛР. Одна из систем метаданных получила статус стандарта ISO. Но ЛР значительно различаются, поэтому возникает вопрос, как такое разнообразие приложений может быть представлено одной системой метаданных. Дискуссии по этому поводу ведутся достаточно давно, первый проект системы метаданных для ЛР появился в 2001 г. Позже появилось еще несколько проектов, как опирающихся на стандартные системы метаданных, прежде всего на Дублинское ядро метаданных, так и развивающие специальные системы метаданных для ЛР. Одна из систем метаданных получила статус стандарта ISO.

5	В настоящей статье предлагается обзор основных систем метаданных, применяемых в настоящее время для описания ЛР.	В настоящей статье предлагается обзор основных систем метаданных, применяемых в настоящее время для описания ЛР. В настоящей статье предлагается обзор основных систем метаданных, применяемых в настоящее время для описания ЛР.

6	Все системы метаданных в той или иной степени опираются на словари (регистры, онтологии) лингвистических категорий, которые также активно разрабатывались международным сообществом лингвистов в последние годы. Эти проекты описаны в отдельном разделе статьи.	Все системы метаданных в той или иной степени опираются на словари (регистры, онтологии) лингвистических категорий, которые также активно разрабатывались международным сообществом лингвистов в последние годы. Эти проекты описаны в отдельном разделе статьи. Все системы метаданных в той или иной степени опираются на словари (регистры, онтологии) лингвистических категорий, которые также активно разрабатывались международным сообществом лингвистов в последние годы. Эти проекты описаны в отдельном разделе статьи.

7	В список литературы включены как традиционные публикации, так и ссылки на информационные ресурсы и документацию, размещенные в Интернете.	В список литературы включены как традиционные публикации, так и ссылки на информационные ресурсы и документацию, размещенные в Интернете. В список литературы включены как традиционные публикации, так и ссылки на информационные ресурсы и документацию, размещенные в Интернете.

8	Проект метаданных IMDI	<h3><strong>Проект метаданных IMDI</strong></h3> <h3><strong>Проект метаданных IMDI</strong></h3>

9	Постановка задачи разработки специальной системы метаданных для ЛР принадлежит, по-видимому, рабочей группе EAGLES/ISLE², которая в 2001 г. предложила план разработки соответствующего стандарта [1]. Эта инициатива получила название Инициативы IMDI³. 2. EAGLES – Консультативная группа экспертов по стандартам языковых технологий – Expert Advisory Group on Language Engineering Standards >>>> ISLE – Международные стандарты для языковых технологий – International Standard for Language Engineering >>>> 3. IMDI – Инициатива метаданных ISLE – ISLE Metadata Initiative >>>>	Постановка задачи разработки специальной системы метаданных для ЛР принадлежит, по-видимому, рабочей группе EAGLES/ISLE<sup>2</sup>, которая в 2001 г. предложила план разработки соответствующего стандарта [1]. Эта инициатива получила название Инициативы IMDI<sup>3</sup>. Постановка задачи разработки специальной системы метаданных для ЛР принадлежит, по-видимому, рабочей группе EAGLES/ISLE<sup>2</sup>, которая в 2001 г. предложила план разработки соответствующего стандарта [1]. Эта инициатива получила название Инициативы IMDI<sup>3</sup>.
	2. EAGLES – Консультативная группа экспертов по стандартам языковых технологий – Expert Advisory Group on Language Engineering Standards <a target=_blank href="http://www.ilc.cnr.it/EAGLES/home.html">>>>></a> ISLE – Международные стандарты для языковых технологий – International Standard for Language Engineering <a target=_blank href="https://www.mpi.nl/ISLE/">>>>></a><br><br>3. IMDI – Инициатива метаданных ISLE – ISLE Metadata Initiative <a target=_blank href="http://tla.mpi.nl/imdi-metadata/">>>>></a>
10	Рабочая группа IMDI разработала подробные предложения, в которых были учтены требования сообщества разработчиков и пользователей ЛР, существующий опыт разработки систем метаданных, в том числе Дублинское ядро (DC), RDF и других. Была определена сфера применения ЛР, среди которых разработчики выделили различные типы ЛР: текстовые корпуса, аннотированные корпуса, мультимедийные корпуса, лексиконы, типологические базы данных, грамматические данные, онтологии и другие.	Рабочая группа IMDI разработала подробные предложения, в которых были учтены требования сообщества разработчиков и пользователей ЛР, существующий опыт разработки систем метаданных, в том числе Дублинское ядро (DC), RDF и других. Была определена сфера применения ЛР, среди которых разработчики выделили различные типы ЛР: текстовые корпуса, аннотированные корпуса, мультимедийные корпуса, лексиконы, типологические базы данных, грамматические данные, онтологии и другие. Рабочая группа IMDI разработала подробные предложения, в которых были учтены требования сообщества разработчиков и пользователей ЛР, существующий опыт разработки систем метаданных, в том числе Дублинское ядро (DC), RDF и других. Была определена сфера применения ЛР, среди которых разработчики выделили различные типы ЛР: текстовые корпуса, аннотированные корпуса, мультимедийные корпуса, лексиконы, типологические базы данных, грамматические данные, онтологии и другие.

11	На этой основе были определены структура мета-описания, объем метаданных, элементы словаря метаданных, отображение элементов метаданных, в том числе повторное использование определений элементов метаданных из других сообществ.	На этой основе были определены структура мета-описания, объем метаданных, элементы словаря метаданных, отображение элементов метаданных, в том числе повторное использование определений элементов метаданных из других сообществ. На этой основе были определены структура мета-описания, объем метаданных, элементы словаря метаданных, отображение элементов метаданных, в том числе повторное использование определений элементов метаданных из других сообществ.

12	Были сформулированы требования к инструментам. Нужны редакторы мета-описаний, браузеры, которые понимают структуру связанных файлов мета-описания и предоставляют графические изображения поддержки пользователя во время навигации, инструменты поиска, которые могут справиться со структурой файла метаописания и любыми элементами метаданных. Инструменты поиска должны эффективно использовать связи между метаописаниями.	Были сформулированы требования к инструментам. Нужны редакторы мета-описаний, браузеры, которые понимают структуру связанных файлов мета-описания и предоставляют графические изображения поддержки пользователя во время навигации, инструменты поиска, которые могут справиться со структурой файла метаописания и любыми элементами метаданных. Инструменты поиска должны эффективно использовать связи между метаописаниями. Были сформулированы требования к инструментам. Нужны редакторы мета-описаний, браузеры, которые понимают структуру связанных файлов мета-описания и предоставляют графические изображения поддержки пользователя во время навигации, инструменты поиска, которые могут справиться со структурой файла метаописания и любыми элементами метаданных. Инструменты поиска должны эффективно использовать связи между метаописаниями.

13	Практически осуществимый сценарий внедрения стандарта должен включать такие темы: где хранить мета-описания способы регистрации и привязки мета-описаний способы построения просматриваемых иерархий способы контроля за связыванием новых описаний с существующим пространством требования к центрам, которые могли бы создать и поддерживать пространство метаданных ЛР	Практически осуществимый сценарий внедрения стандарта должен включать такие темы: <ul class="docx-publication-list"> <li>где хранить мета-описания</li> <li>способы регистрации и привязки мета-описаний</li> <li>способы построения просматриваемых иерархий</li> <li>способы контроля за связыванием новых описаний с существующим пространством</li> <li>требования к центрам, которые могли бы создать и поддерживать пространство метаданных ЛР</li></ul> Практически осуществимый сценарий внедрения стандарта должен включать такие темы: <ul class="docx-publication-list"> <li>где хранить мета-описания</li> <li>способы регистрации и привязки мета-описаний</li> <li>способы построения просматриваемых иерархий</li> <li>способы контроля за связыванием новых описаний с существующим пространством</li> <li>требования к центрам, которые могли бы создать и поддерживать пространство метаданных ЛР</li></ul>

14	В результате деятельности рабочей группы EAGLES/ISLE появились проекты систем метаданных для лексиконов [2] и предложения по классификации и структуре словарей [3]. Наибольшее распространение метаданные IMDI получили применительно к мультимодальным ЛР. Также была разработана схема перехода от модели метаданных IMDI к стандарту метаданных OLAC [4]. Руководство пользователя для модели метаданных IMDI представлено по адресу [5]. Полный перечень документов, разработанных в рамках инициативы IMDI, доступен по адресу [6].	В результате деятельности рабочей группы EAGLES/ISLE появились проекты систем метаданных для лексиконов [2] и предложения по классификации и структуре словарей [3]. Наибольшее распространение метаданные IMDI получили применительно к мультимодальным ЛР. Также была разработана схема перехода от модели метаданных IMDI к стандарту метаданных OLAC [4]. Руководство пользователя для модели метаданных IMDI представлено по адресу [5]. Полный перечень документов, разработанных в рамках инициативы IMDI, доступен по адресу [6]. В результате деятельности рабочей группы EAGLES/ISLE появились проекты систем метаданных для лексиконов [2] и предложения по классификации и структуре словарей [3]. Наибольшее распространение метаданные IMDI получили применительно к мультимодальным ЛР. Также была разработана схема перехода от модели метаданных IMDI к стандарту метаданных OLAC [4]. Руководство пользователя для модели метаданных IMDI представлено по адресу [5]. Полный перечень документов, разработанных в рамках инициативы IMDI, доступен по адресу [6].

15	Метаданные OLAC⁴ 4. OLAC – Консорциум открытых лингвистических архивов – the Open Language Archives Community, >>>>	<h3><strong>Метаданные </strong><strong>OLAC</strong><sup>4</sup></h3> <h3><strong>Метаданные </strong><strong>OLAC</strong><sup>4</sup></h3>
	4. OLAC – Консорциум открытых лингвистических архивов – the Open Language Archives Community, <a href="http://olac.ldc.upenn.edu/" target="_blank">>>>></a>
16	Метаданные крупнейшего современного собрания ЛР – Консорциума открытых лингвистических архивов (OLAC) – определены в нормативном документе “Метаданные OLACˮ [7] . Этот документ определяет формат метаданных, используемый OLAC для описания ЛР и предоставления связанных с ними услуг. OLAC использует формат XML для обмена метаданными ЛР в рамках Инициативы открытых архивов (OAI).	Метаданные крупнейшего современного собрания ЛР – Консорциума открытых лингвистических архивов (OLAC) – определены в нормативном документе “Метаданные OLACˮ [7]<strong> </strong>. Этот документ определяет формат метаданных, используемый OLAC для описания ЛР и предоставления связанных с ними услуг. OLAC использует формат XML для обмена метаданными ЛР в рамках Инициативы открытых архивов (OAI). Метаданные крупнейшего современного собрания ЛР – Консорциума открытых лингвистических архивов (OLAC) – определены в нормативном документе “Метаданные OLACˮ [7]<strong> </strong>. Этот документ определяет формат метаданных, используемый OLAC для описания ЛР и предоставления связанных с ними услуг. OLAC использует формат XML для обмена метаданными ЛР в рамках Инициативы открытых архивов (OAI).

17	Набор метаданных OLAC основан на наборе метаданных Дублинского ядра (DC) и использует все пятнадцать элементов, определенных в этом стандарте. Чтобы обеспечить большую точность в описании ЛР, OLAC следует рекомендациям DC для квалификации элементов.	Набор метаданных OLAC основан на наборе метаданных Дублинского ядра (DC) и использует все пятнадцать элементов, определенных в этом стандарте. Чтобы обеспечить большую точность в описании ЛР, OLAC следует рекомендациям DC для квалификации элементов. Набор метаданных OLAC основан на наборе метаданных Дублинского ядра (DC) и использует все пятнадцать элементов, определенных в этом стандарте. Чтобы обеспечить большую точность в описании ЛР, OLAC следует рекомендациям DC для квалификации элементов.

18	Цитируемый документ определяет только формальные (синтаксические) требования к описанию метаданных OLAC. Полный набор рекомендаций, уточнения значения элементов и схемы использования содержатся в Рекомендациях по использованию метаданных OLAC [8].	Цитируемый документ определяет только формальные (синтаксические) требования к описанию метаданных OLAC. Полный набор рекомендаций, уточнения значения элементов и схемы использования содержатся в Рекомендациях по использованию метаданных OLAC [8]. Цитируемый документ определяет только формальные (синтаксические) требования к описанию метаданных OLAC. Полный набор рекомендаций, уточнения значения элементов и схемы использования содержатся в Рекомендациях по использованию метаданных OLAC [8].

19	Квалификаторы, рекомендованные DC, применимы к широкому спектру ЛР. Однако для ЛР, которые не удовлетворяют этим общим стандартам, члены OLAC разработали специальные квалификаторы для сообщества, которые приняты в качестве рекомендуемой передовой практики для описания ЛР.	Квалификаторы, рекомендованные DC, применимы к широкому спектру ЛР. Однако для ЛР, которые не удовлетворяют этим общим стандартам, члены OLAC разработали специальные квалификаторы для сообщества, которые приняты в качестве рекомендуемой передовой практики для описания ЛР. Квалификаторы, рекомендованные DC, применимы к широкому спектру ЛР. Однако для ЛР, которые не удовлетворяют этим общим стандартам, члены OLAC разработали специальные квалификаторы для сообщества, которые приняты в качестве рекомендуемой передовой практики для описания ЛР.

20	Формат метаданных. XML-реализация метаданных OLAC соответствует “Руководящим принципам реализации Дублинского ядра в XMLˮ [9]. Схема метаданных OLAC включает в себя элементы из двух схем метаданных (простой и квалифицированной). Квалифицированный элемент может указывать уточнение (используя элемент, определенный в пространстве имен dcterms) или схему кодирования (используя схему, определенную в dcterms как значение атрибута xsi:type), или и то, и другое.	<em><strong>Формат метаданных</strong></em><em><strong>. </strong></em>XML-реализация метаданных OLAC соответствует “Руководящим принципам реализации Дублинского ядра в XMLˮ [9]. Схема метаданных OLAC включает в себя элементы из двух схем метаданных (простой и квалифицированной). Квалифицированный элемент может указывать уточнение (используя элемент, определенный в пространстве имен dcterms) или схему кодирования (используя схему, определенную в dcterms как значение атрибута xsi:type), или и то, и другое. <em><strong>Формат метаданных</strong></em><em><strong>. </strong></em>XML-реализация метаданных OLAC соответствует “Руководящим принципам реализации Дублинского ядра в XMLˮ [9]. Схема метаданных OLAC включает в себя элементы из двух схем метаданных (простой и квалифицированной). Квалифицированный элемент может указывать уточнение (используя элемент, определенный в пространстве имен dcterms) или схему кодирования (используя схему, определенную в dcterms как значение атрибута xsi:type), или и то, и другое.

Введение

Проект метаданных IMDI

Метаданные OLAC4

Метамодель META-SHARE

Основы модели

Онтологии META-SHARE

Таксономия ЛР

Основное содержание и структура модели

Структура представления и условные обозначения

Международный стандартный номер языковых ресурсов (ISLRN) [13]

Карта LRE [14]

Инфраструктура компонентов метаданных (CMDI) CLARIN [15]

Спецификация CMDI 1.2 [16]

Реестр понятий CLARIN [22]

Инструментальные средства CMDI

Поисковые инструменты

Использование CMDI в различных проектах

Стандартизация метаданных ЛР

Словари метаданных и реестры категорий данных

ISOcat [33].

База данных DatCatInfo [35].

Реестр понятий CLARIN [22]

Словарь лингвистических метаданных (LIME) [38]

LexInfo [39]

База данных лексики метаданных российских ЛР

Заключение

References

Comments

Via social network

Метаданные OLAC⁴