Полезные функции в НКРЯ: поиск по части слова и поиск с исключением ненужного элемента

 
Код статьиS013161170003978-4-1
DOI10.31857/S013161170003978-4
Тип публикации Статья
Статус публикации Опубликовано
Авторы
Аффилиация: Институт русского языка им. В. В. Виноградова РАН
Название журналаРусская речь
ВыпускНомер 1
Страницы99-108
АннотацияНациональный корпус русского языка — это не просто большое собрание самых разных текстов, но и разнообразная лингвистическая информация, сопровождающая тексты, и средства поиска информации. Однако многие неподготовленные пользователи не подозревают о богатых возможностях этого лингвистического ресурса и к тому же не любят читать инструкции, поэтому используют его только для простого поиска слов. Для таких пользователей корпуса мы предлагаем серию заметок, в которых разработчики НКРЯ на примерах конкретных поисковых задач будут знакомить читателей с корпусными инструментами и приемами их использования. В настоящей заметке рассказывается о средстве, позволяющем осуществлять поиск по части словоформы или лексемы, а также о способе установления фильтров на ненужные единицы, что позволяет получать более точные результаты.
Ключевые словаНациональный корпус русского языка: функциональные возможности, корпусной инструментарий, средства поиска
Получено28.03.2019
Дата публикации28.03.2019
Кол-во символов14903
Цитировать   Скачать pdf Для скачивания PDF необходимо авторизоваться
Размещенный ниже текст является ознакомительной версией и может не соответствовать печатной.
1 Исследователи отмечают, что в современном русском языке функционирует большое количество слов, имеющих в своем составе иноязычные морфемы: авто- (автобус, автобан), аэро- (аэробус, аэростат), -фон (телефон, магнитофон, смартфон), гипер- (гипертекст, гипермаркет, гиперссылка, гиперактивный), микро- (микромир, микросхема, микробиология), супер- (супермен, суперкомпьютер, суперфинал) и т. д. Часть этих слов заимствована из других языков (автобус, телефон, гипертекст и др.), часть образована с использованием иноязычных морфем (автоответчик, суперновость, аэротруба и др.). С помощью подобных элементо образуется большое количество новых слов, еще не попавших в словари. Можно ли оценить продуктивность той или иной морфемы? В этом может помочь Национальный корпус русского языка благодаря нескольким полезным функциям.
2 Предположим, нам нужно проверить, активна ли модель с элементом -навт (от греч. nautēs — мореплаватель) в современном русском языке. На память сразу приходят слова космонавт (космос + nautēs, букв. космоплаватель, ‘человек, совершивший полет в космос’), астронавт (астро + nautēs, букв. звездоплаватель, ‘то же, что космонавт’), аэронавт (аэро + nautēs, букв. воздухоплаватель), аргонавты (Арго + nautēs, ‘древнегреческие герои, совершившие на корабле «Арго» плавание к берегам Колхиды’). Есть ли еще слова на -навт в современном русском языке? Поищем ответ в основном корпусе. В этом нам поможет функция «звездочки» (астериска). Звездочка позволяет искать лексемы по какой-то их части, начальной или конечной. Чтобы осуществить запрос, в месте обрыва сегмента (перед ним или после него) надо поставить звездочку (астериск).
3 На странице лексико-грамматического поиска в поле «слово» записываем *навт.
4
image1

Рис. 1. Запрос для поиска слов, оканчивающихся на –навт | Fig. 1. Search query for looking up words ending with -navt

5 В результате такого запроса можно получить около четырех тысяч примеров существительных, оканчивающихся на -навт.
  • Выход в открытый космос считается самым сложным заданием для космонавта (Известия. 08.01.2003).
  • Сам он уподоблял своё движение от «Мистерии» к «Гармонии» странствию аргонавтов за золотым руном (Знание — сила. 2003).
  • Я играл космонавта, а в барокамеру нас снимать не пустили, и мы изображали невесомость в павильонах «Мосфильма» (Финансовая Россия. 19.09.2002).
  • Но и первоначальные также в их причастности к человеческой истории и вечной с нею борьбе: Орфей в походе аргонавтов усмирял волны, а Пушкин в двух строках (С. Бочаров. Из истории понимания Пушкина. 1998).
  • Правда, молодой человек был не гусар, не офицер, но в девяностые годы инженер-путеец был фигурой модной, не менее романтической, чем гусар. Нечто вроде космонавта сегодня (Д. Гранин. Зубр).
6 Обратите внимание на таблицу внизу каждой страницы. Она называется «Частоты найденного для этой страницы», и в ней указано количество словоформ и лексем (лемм), отвечающих запросу, которые встретились в примерах на данной странице. Таблицы предназначены для быстрого просмотра страниц, поиска нужного слова и оценки его количественных показателей (частотности).

всего просмотров: 770

Оценка читателей: голосов 0

Система Orphus

Загрузка...
Вверх