Useful Functions in Russian National Corpus: search by part of a word and search with the exclusion of an unnecessary element

 
PIIS013161170003978-4-1
DOI10.31857/S013161170003978-4
Publication type Article
Status Published
Authors
Affiliation: Vinogradov Russian Language Institute of the Russian Academy of Sciences
Journal nameRusskaya Rech’
EditionIssue 1
Pages99-108
AbstractThe Russian National Corpus is not only a comprehensive collection of a wide variety of texts, but also a great deal of linguistic information accompanying them, and information search tools. However, many untrained users are unaware of the considerable potential this linguistic resource may offer and, moreover, are unwilling to read the instructions. They tend to use it just for a word search. For this kind of users of the Corpus, we offer a series of notes, in which the developers, using examples of practical search tasks, will introduce readers to different kinds of corpus tools and techniques to manage them. This note describes a tool which makes it possible to conduct a search by part of a word form or lexeme, as well as the method of setting filters on unnecessary units and, thereby, getting more accurate results.
KeywordsRussian National Corpus: functionality, corpus tools, search tools
Received28.03.2019
Publication date28.03.2019
Number of characters14903
Cite   Download pdf To download PDF you should sign in
1 Исследователи отмечают, что в современном русском языке функционирует большое количество слов, имеющих в своем составе иноязычные морфемы: авто- (автобус, автобан), аэро- (аэробус, аэростат), -фон (телефон, магнитофон, смартфон), гипер- (гипертекст, гипермаркет, гиперссылка, гиперактивный), микро- (микромир, микросхема, микробиология), супер- (супермен, суперкомпьютер, суперфинал) и т. д. Часть этих слов заимствована из других языков (автобус, телефон, гипертекст и др.), часть образована с использованием иноязычных морфем (автоответчик, суперновость, аэротруба и др.). С помощью подобных элементо образуется большое количество новых слов, еще не попавших в словари. Можно ли оценить продуктивность той или иной морфемы? В этом может помочь Национальный корпус русского языка благодаря нескольким полезным функциям.
2 Предположим, нам нужно проверить, активна ли модель с элементом -навт (от греч. nautēs — мореплаватель) в современном русском языке. На память сразу приходят слова космонавт (космос + nautēs, букв. космоплаватель, ‘человек, совершивший полет в космос’), астронавт (астро + nautēs, букв. звездоплаватель, ‘то же, что космонавт’), аэронавт (аэро + nautēs, букв. воздухоплаватель), аргонавты (Арго + nautēs, ‘древнегреческие герои, совершившие на корабле «Арго» плавание к берегам Колхиды’). Есть ли еще слова на -навт в современном русском языке? Поищем ответ в основном корпусе. В этом нам поможет функция «звездочки» (астериска). Звездочка позволяет искать лексемы по какой-то их части, начальной или конечной. Чтобы осуществить запрос, в месте обрыва сегмента (перед ним или после него) надо поставить звездочку (астериск).
3 На странице лексико-грамматического поиска в поле «слово» записываем *навт.
4
image1

Рис. 1. Запрос для поиска слов, оканчивающихся на –навт | Fig. 1. Search query for looking up words ending with -navt

5 В результате такого запроса можно получить около четырех тысяч примеров существительных, оканчивающихся на -навт.
  • Выход в открытый космос считается самым сложным заданием для космонавта (Известия. 08.01.2003).
  • Сам он уподоблял своё движение от «Мистерии» к «Гармонии» странствию аргонавтов за золотым руном (Знание — сила. 2003).
  • Я играл космонавта, а в барокамеру нас снимать не пустили, и мы изображали невесомость в павильонах «Мосфильма» (Финансовая Россия. 19.09.2002).
  • Но и первоначальные также в их причастности к человеческой истории и вечной с нею борьбе: Орфей в походе аргонавтов усмирял волны, а Пушкин в двух строках (С. Бочаров. Из истории понимания Пушкина. 1998).
  • Правда, молодой человек был не гусар, не офицер, но в девяностые годы инженер-путеец был фигурой модной, не менее романтической, чем гусар. Нечто вроде космонавта сегодня (Д. Гранин. Зубр).
6 Обратите внимание на таблицу внизу каждой страницы. Она называется «Частоты найденного для этой страницы», и в ней указано количество словоформ и лексем (лемм), отвечающих запросу, которые встретились в примерах на данной странице. Таблицы предназначены для быстрого просмотра страниц, поиска нужного слова и оценки его количественных показателей (частотности).

Price publication: 0

Number of purchasers: 2, views: 1625

Readers community rating: votes 0

Система Orphus

Loading...
Up