Предсказания, большие данные и новые измерители: о возможностях технологий компьютерной лингвистики в теоретических лингвистических исследованиях

Статья посвящена обзору работ последних лет, в которых теоретическая исследовательская задача решается с помощью методов или инструментов, используемых в компьютерной лингвистике. В обзоре проводится подробный анализ того, как именно с помощью применения того или иного инструмента или метода можно получить новые знания о природе языка. В частности, выделяются два основных направления, развитие которых в рамках теоретических исследований представляется чрезвычайно перспективным. Это, с одной стороны, применение алгоритмов машинного обучения как предсказательной модели для описания многофакторных языковых явлений, с другой стороны, использование возможностей, открывающихся для типологических исследований и межъязыковых сравнений благодаря созданию множества «глубоко аннотированных» корпусов для разных языков, т. е. корпусов со сложной разметкой, например, синтаксической или референциальной. Уже сейчас объем имеющихся различных данных позволяет делать определенные выводы о свойствах тех или иных универсалий, которые были описаны раньше в теоретических типологических работах.

Ключевые слова

дативная альтернация, категория определенности, компьютерная лингвистика, машинное обучение, синтаксический корпус, теория языка, типология, референциальный выбор

Получено

11.04.2016

Дата публикации

11.04.2016

Кол-во символов

1125

Цитировать Скачать pdf Для скачивания PDF необходимо авторизоваться

ГОСТ	Бонч-Осмоловская А. А. Предсказания, большие данные и новые измерители: о возможностях технологий компьютерной лингвистики в теоретических лингвистических исследованиях // Вопросы языкознания – 2016. – Номер 2 C. 100-120 [Электронный ресурс]. URL: http://ras.jes.su/vopjaz/s207987840000364-9-1 (дата обращения: 21.07.2024). DOI: 10.31857/S0373658X0000985-2
MLA	Bonch-Osmolovskaya, Anastasia "Predictors, big data and new measuring: The impact of computational linguistics on linguistic theory." Voprosy Jazykoznanija 2 (2016):100-120. DOI: 10.31857/S0373658X0000985-2
APA	Bonch-Osmolovskaya A. (2016). Predictors, big data and new measuring: The impact of computational linguistics on linguistic theory. Voprosy Jazykoznanija (2), pp.100-120 DOI: 10.31857/S0373658X0000985-2


1	\\\\\\\\\\\\\\\\\\\\\\\\\

Цена публикации: 0

Всего подписок: 0, всего просмотров: 911

Оценка читателей: голосов 0

1. Кибрик А. А., Добров Г. Б., Залманов Д. А., Линник А. С., Лукашевич Н. В. Референциальный выбор как многофакторный вероятностный процесс // Компьютерная лингвистика и интеллектуальные технологии. По материалам ежегодной Международной конференции «Диалог». М.: Изд-во РГГУ, 2010. Т. 9 (16). С. 173—179.

2. Ляшевская О. Н., Астафьева И., Бонч-Осмоловская А., Гарейшина А., Гришина Ю., Дьячков В., Ионов М., Королева А., Кудринский М., Литягина А., Лучина Е., Сидорова Е., Толдова С., Савчук С., Коваль С. Оценка методов автоматического анализа текста: морфологические парсеры русского языка // Компьютерная лингвистика и интеллектуальные технологии. По материалам ежегодной Международной конференции «Диалог». М.: Изд-во РГГУ, 2010. Т. 9 (16). С. 318—326.

3. Толдова С. Ю., Соколова Е. Г., Астафьева И., Гарейшина А., Королева А. Н., Привознов Д., Сидорова Е., Тупикина Л., Ляшевская О. Н. Оценка методов автоматического анализа текста 2011—2012: синтаксические парсеры русского языка // Вестник компьютерных и информационных технологий. 2012. № 8. С. 14—19.

4. Толдова С. Ю., Ляшевская О. Н. Современные проблемы и тенденции компьютерной лингвистики // Вопросы языкознания. 2014. №. 1. С. 120—145.

5. Agirre E., Edmonds P. G. (eds). Word sense disambiguation: Algorithms and applications (Text, speech and language technology. Vol. 33). Dordrecht: Springer Science & Business Media, 2007.

6. Bhatia A., Lin Ch., Schneider N., Tsvetkov Yu., Talib Al-Raisi F., Roostapour L., Bender J., Kumar A., Levin L., Simons M., Dyer Ch. Automatic classification of communicative functions of definiteness. Proceedings of the 25th International conference on computational linguistics. Dublin City University and Association for Computational Linguistics, 2014. Pp. 1059—1070.

7. Bresnan J. Is knowledge of syntax probabilistic? Experiments with the English dative alternation. Linguistics in search of its evidential base, series: Studies in generative grammar. Featherston S., Sternefeld W. (eds). Berlin: Mouton de Gruyter, 2007. Pp. 75—96.

8. Bresnan J., Cueni A., Nikitina T., Baayen R. H. Predicting the dative alternation. Cognitive foundations of interpretation. Boume G., Krämer I., Zwarts J. (eds). Amsterdam: Royal Netherlands Academy of Science, 2007. Pp. 69—94.

9. Bresnan J., Ford M. Predicting syntax: Processing dative constructions in American and Australian varieties of English. Language. 2010. Vol. 86. No. 1. Pp. 168—213.

10. Bresnan J., Nikitina T. The gradience of the dative alternation. Reality exploration and discovery. Pattern interaction in language and life. Uyechi L., Wee L.-H. (eds). Stanford: Center for the Study of Language and Information, 2009. Pp. 161—184.

11. Daume III, H. Campbell L. A Bayesian model for discovering typological implications. Proceedings of the 45th annual meeting of the Association for Computational Linguistics (ACL). Prague, June 23—30, 2007. Association for Computational Linguistics, 2007. Pp. 65—72.

12. Dryer M. S., Haspelmath M. (eds). The world atlas of language structures online. Leipzig: Max Planck Institute for Evolutionary Anthropology, 2013. Available at: http://wals.info,Accessed on 2015-04-10.

13. Farkas R., Vincze V., Móra G., Csirik J., Szarvas G. The CoNLL-2010 shared task: Learning to detect hedges and their scope in natural language text. Proceedings of the Fourteenth conference on computational natural language learning: Shared task. Association for Computational Linguistics, 2010. Pp. 1—12.

14. Futrell, Mahowald K., Gibson E. CLIQS: Crosslinguistic investigations in quantitative syntax. Poster presented at AMLaP 2014.

15. Gibson E., Fedorenko E. The need for quantitative methods in syntax and semantics research. Language and Cognitive Processes. 2013. Vol. 28. № 1—2. Pp. 88—124.

16. Gibson E., Piantadosi S. T., Fedorenko E. Quantitative methods in syntax / semantics research: A response to Sprouse and Almeida. Language and cognitive processes. 2012. Vol. 28. No. 3. Pp. 229—240.

17. Gildea D., Temperley D. Optimizing grammars for minimum dependency length. Proceedings of the 45th annual meeting of the Association for Computational Linguistics (ACL). Prague, June 23—30, 2007. Association for Computational Linguistics, 2007. Pp. 184—191.

18. Green G. Some implications of an interaction among constraints. Papers from the Seventh regional meeting, Chicago Linguistic Society. Chicago: Chicago Linguistic Society, The University of Chicago, 1971. Pp. 85—100.

19. Green G. Semantics and syntactic regularity. Bloomington: Indiana University Press, 1974.

20. Grüning A., Kibrik A. A. A neural network approach to referential choice. Komp’yuternaya lingvistika i intellektual’nye tekhnologii. Trudy mezhdunarodnoi konferentsii «Dialog-2003». Moscow: Nauka, 2003. Pp. 260—266. [Компьютерная лингвистика и интеллектуальные технологии. Труды международной конференции «Диалог-2003». М.: Наука, 2003. C. 260—266.]

21. Grüning A., Kibrik A. A. Modeling referential choice in discourse: A cognitive calculative approach and a Neural Networks approach. Anaphora processing: Linguistic, cognitive and computational modelling. Branco A., McEnery T., Mitkov R. (eds). Amsterdam: John Benjamins, 2005. Pp. 163—198.

22. Hajič J., Ciaramita M., Johansson R., Kawahara D., Martí M. A., Màrquez L., Meyers A., Nivre J., Padó S., Štěpánek J., Straňák P., Surdeanu M., Xue N., Zhang Y. The CoNLL-2009 shared task: Syntactic and semantic dependencies in multiple languages. Proceedings of the Thirteenth conference on computational natural language learning: Shared task. Association for Computational Linguistics, 2009. Pp. 1—18.

23. Kibrik A. A. Anaphora in Russian narrative discourse: A cognitive calculative account. Studies in anaphora. Fox B. (ed.). Amsterdam: John Benjamins, 1996. Pp. 255—304.

24. Kibrik A. A. Reference and working memory: Cognitive inferences from discourse observation. Discourse studies in cognitive linguistics. Van Hoek K., Kibrik A. A., Noordman L. (eds). Amsterdam: John Benjamins, 1999. Pp. 29—52.

25. Mann W. C., Thompson S. A. Rhetorical structure theory: Toward a functional theory of text organization. Text. 1988. Vol. 8 (3). Pp. 243—281.

26. Nedoluzhko A., Toldova S., Novák M. Coreference chains in Czech, English and Russian: Preliminary findings. Komp’yuternaya lingvistika i intellektual’nye tekhnologii. Po materialam ezhegodnoi Mezhdunarodnoi konferentsii «Dialog». Moscow: Russian State Univ. for the Humanities, 2015. Vol. 14 (21). Pp. 474—486. [Компьютерная лингвистика и интеллектуальные технологии. По материалам ежегодной Международной конференции «Диалог» (Москва, 27—30 мая 2015 г.). М.: Изд-во РГГУ, 2015. Т. 14 (21). С. 474—486.]

27. Ng H. T., Wu S. M., Wu Y., Hadiwinoto C., Tetreault J. The CoNLL 2013 shared task on grammatical error correction. Proceedings of the Seventeenth conference on computational natural language learning. Association for Computational Linguistics, 2013. Pp. 1—24.

28. Nilsson J., Riedel S., Yuret D. The CoNLL 2007 shared task on dependency parsing. Proceedings of the CoNLL shared task session of EMNLP-CoNLL. Association for Computational Linguistics, 2007. Pp. 915—932.

29. Pinker S. Learnability and cognition: The acquisition of argument structure. Cambridge: MIT Press, 1989.

30. Pradhan S., Ramshaw L., Marcus M., Palmer M., Weischedel R., Xue N. CoNLL 2011 shared task: Modeling unrestricted coreference in ontonotes. Proceedings of the Fifteenth conference on computational natural language learning: shared task. Association for Computational Linguistics, 2011. Pp. 1—27.

31. Pradhan S., Moschitti A., Xue N., Uryupina O., Zhang Y. CoNLL-2012 shared task: Modeling multilingual unrestricted coreference in OntoNotes. Joint conference on EMNLP and CoNLL-shared task. Association for Computational Linguistics, 2012. Pp. 1—40.

32. Surdeanu M., Johansson R., Meyers A., Màrquez L., Nivre J. The CoNLL-2008 shared task on joint parsing of syntactic and semantic dependencies. Proceedings of the Twelfth conference on computational natural language learning. Association for Computational Linguistics, 2008. Pp. 159—177.

33. Toldova S., Roytberg A., Ladygina A., Vasilyeva M., Azerkovich I., Kurzukov M., Sim G., Gorshkov D., Ivanova A., Nedoluzhko A., Grishina Y. RU-EVAL-2014: Evaluating anaphora and coreference resolution for Russian. Komp’yuternaya lingvistika i intellektual’nye tekhnologii. Po materialam ezhegodnoi Mezhdunarodnoi konferentsii «Dialog». Moscow: Russian State Univ. for the Humanities, 2014. Vol. 13 (20). Pp. 77—90. [Компьютерная лингвистика и интеллектуальные технологии. По материалам ежегодной Международной конференции «Диалог». М.: Изд-во РГГУ, 2014. Т. 13 (20). С. 77—90.]

34. Wintner S. What science underlies natural language engineering? Computational Linguistics. 2009. Vol. 35. No. 4. Pp. 641—644.