О создании центра лингвистических ресурсов РАН

 
Код статьиS241377150006107-0-1
DOI10.31857/S241377150006107-0
Тип публикации Статья
Статус публикации Опубликовано
Авторы
Аффилиация: ИНИОН РАН
Адрес: Российская Федерация, Москва
Название журналаИзвестия Российской академии наук. Серия литературы и языка
ВыпускТом 78 Номер 4
Страницы5-12
Аннотация

Предлагается концепция создания Центра лингвистических ресурсов РАН как организационно-технологической структуры, обеспечивающей агрегацию и интеграцию российских цифровых (электронных) лингвистических информационных ресурсов (ЛИР), реализующих различные задачи теоретической и прикладной лингвистики. Центр должен стать частью Цифровой системы управления сервисами научной инфраструктуры коллективного пользования, создание которой предусмотрено в Национальном проекте “Наука&8j1;. Описывается состояние ЛИР в РАН на основе проведенной инвентаризации и предлагается их типология. Формулируются задачи Центра ЛИР. Предлагаются способы действий Центра по отношению к различным типам ЛИР, как документным, так и структурированным. Особое внимание предлагается уделить корпусным и лексикографическим ресурсам. Кратко формулируются организационные, экономические и правовые аспекты функционирования Центра.

Ключевые словалингвистические информационные ресурсы, инвентаризация, типология, агрегация, навигация, интеграция, Центр лингвистических ресурсов
Источник финансированияСтатья отражает результаты работы по исследовательскому проекту № 18-00-002\18 “Интеграция научно-информационных ресурсов учреждений РАН (на примере языкознания) как части единого цифрового пространства РАНˮ, реализуемому при поддержке РФФИ
Получено11.09.2019
Дата публикации25.09.2019
Кол-во символов24696
Цитировать  
100 руб.
При оформлении подписки на статью или выпуск пользователь получает возможность скачать PDF, оценить публикацию и связаться с автором. Для оформления подписки требуется авторизация.

Оператором распространения коммерческих препринтов является ГАУГН-ПРЕСС

Размещенный ниже текст является ознакомительной версией и может не соответствовать печатной.
1

Постановка задачи

2 Быстрое развитие информационных технологий в лингвистике как науке, а также необходимость решения различных прикладных задач, использующих методы и средства компьютерной лингвистики (таких как обработка текста, анализ и синтез речи, автоматический перевод, обучение языкам и др.) привели к созданию большого числа электронных лингвистических информационных ресурсов (ЛИР) различного назначения. Деятельность по формированию ЛИР, обеспечению к ним доступа, сохранности, открытости, возможности многократного использования, требует оптимизации, координации и системного подхода, т.е., обобщенно говоря, – требует управления деятельностью в сфере ЛИР. Поскольку наиболее продвинутыми в этой области являются учреждения РАН, предлагается начать организацию этой деятельности в РАН.
3 Управление деятельностью в сфере ЛИР должно стать частью Цифровой системы управления сервисами научной инфраструктуры коллективного пользования, создание которой предусмотрено в Национальном проекте “Наукаˮ.
4 Создание системы управления ЛИР обеспечит значительный экономический эффект – при тех же затратах можно получить больший результат.
5

Определения

6 Лингвистические информационные ресурсы (ЛИР) – организованные массивы речевых и языковых данных, представленных на машинных носителях и предназначенных для использования в науке и различных сферах практической деятельности, а также массивы документов, отражающих результаты научных исследований в сфере языкознания.
7 Интеграция информационных ресурсов – создание централизованных ресурсов, полностью включающих данные и функции интегрируемых ресурсов.
8 Агрегация информационных ресурсов – создание частично распределенных ресурсов, в которых централизованы метаданные и некоторые функции, как правило, поиск и навигация,
9

Зарубежный опыт

10 В мире создан ряд организаций, занимающихся разработкой, интеграцией и агрегацией лингвистических ресурсов, а также координацией деятельности в этой области. К их числу относятся:
11 LDC (Linguistic Data Consortium, USA)1, 1. >>>>
12 ELRA (European Language Resources Association)2 2. >>>>
13 TELRI (TransEuropean Language Resources Infrastructure)3. 3. >>>>
14 Перед этими организациями стоят следующие задачи:
  • разработка единых стандартов создания ресурсов;
  • сбор, учет, каталогизация ресурсов, создаваемых партнерами;
  • разработка способов защиты от несанкционированного доступа;
  • создание единых экспертных требований;
  • планирование единой стратегии разработки лингвистических ресурсов;
  • создание многофункциональных лингвистических ресурсов большого объема для использования в разных странах.
15 Зарубежный опыт должен быть использован при проведении аналогичных разработок в России. Следует добавить, что проблемам создания ЛИР ежегодно посвящается большое количество научных конференций во всем мире.
16

Состояние проблемы в России

Всего подписок: 2, всего просмотров: 260

Оценка читателей: голосов 0

1. Антопольский А.Б., Ефременко Д.В. Инфосфера общественных наук России: монография; под ред. В. А. Цветковой.?– М. ; Берлин : Директ-Медиа, 2017. – 676 с. ISBN 978-5-4475-9218-9 DOI 10.23681/468227

2. Антопольский А.Б., Ефременко Д.В. К вопросу о едином электронном пространстве знаний // Вестник Российской академии наук, 2018, том 88, № 2, с. 163–170 DOI: 10.7868/S086958731802007X ; [Перев. на англ.] Antopol’skii, A.B. & Efremenko,/ The Uniform Electronic Knowledge Space Revisited, //D.V. Her. Russ. Acad. Sci. (2018) 88: 89. https://doi.org/10.1134/S1019331618010070

3. Антопольский А.Б., Каленов Н.Е., Серебряков В.А., Сотников А.Н. Точка зрения о едином цифровом пространстве научных знаний // Вестник Российской академии наук, 2019 (в печати).

4. Антопольский А.Б., Ефременко Д.В. О создании современной цифровой инфраструктуры для хранения и анализа научно технической информации // Научно-техническая информация, сер.1, 2019, № 6 (в печати).

Система Orphus

Загрузка...
Вверх