CONCEPTUAL AMBIGUITY AND SYNCRETISM IN A RUSSIAN DOMAIN CORPUS
Abstract
This paper focuses on conceptual ambiguity and syncretism in a Russian corpus on Integrative Physiology, a topical blend of various aspects of medicine and sport. These phenomena need to be studied to produce conceptually annotated corpora, which in turn is of great importance for developing advanced resources for natural language processing. In this article, we provide statistical characteristics of conceptually ambiguous and syncretic lexical units in the corpus on Integrative Physiology, reveal the sources of conceptual ambiguity and syncretism, determine types thereof and composition of the units characterized by these phenomena. The results obtained contribute to the understanding of the conceptual structure of the Integrative Physiology domain and can be used both for conceptual annotation of the domain corpus and for the development of disambiguation rules and metrics.
Downloads
References
2. Зиновьева А. Ю., Шереметьева С. О., Неручева Е. Д. Анализ неоднозначности концептуальной разметки русскоязычного текста // Вестник Тюменского государственного университета. Гуманитарные исследования. Humanitates. 2020. Т. 6, № 3 (23). С. 38‒60.
3. Рахилина Е. В., Кобрицов Б. П., Кустова Г. И., Ляшевская О. Н., Шеманаева О. Ю. Многозначность как прикладная проблема: семантическая разметка в национальном корпусе русского языка // Труды международной конференции «Диалог 2006». М., 2006. С. 445–450.
4. Ожегов С. И., Шведова Н. Ю. Толковый словарь русского языка : 80 000 слов и фразеологических выражений. М. : Азбуковник, 1999.
5. Поляков В. Н. Использование технологий, ориентированных на лексическое значение, в задачах поиска и классификации // Проблемы прикладной лингвистики. 2004. Вып. 2. С. 101–117.
6. Сиротина А. Ю., Лукашевич Н. В. Опыт создания корпуса текстов в сфере информационной безопасности // Сборник Международной научной конференции «Корпусная лингвистика-2019». СПб., 2019. С. 79–85.
7. Филаретова Л. П. Перспективы интегративной физиологии // Интегративная физиология. Всероссийская конференция с международным участием, посвящённая 95-летию Института физиологии им. И. П. Павлова РАН, Санкт-Петербург (9‒11 декабря 2020 г.) : тезисы докладов. СПб. : Ин-т физиологии им. И. П. Павлова РАН, 2020. С. 3.
8. Шереметьева С. О., Бабина О. И. Платформа для концептуального аннотирования многоязычных текстов // Вестник ЮУрГУ. Серия «Лингвистика». 2020. Т. 17, № 4. С. 53–60.
9. Djemaa M., Candito M., Muller Ph., Vieu L. Corpus Annotation within the French Framenet: A Domainby-Domain Methodology // Proceedings of the 10th International Conference on Language Resources and Evaluation. Portorož, Slovenia, 2016. P. 3794–3801
10. Palmer M., Gildea P., Kingsbury P. The Proposition Bank: An Annotated Corpus of Semantic Roles // Computational Linguistics. 2005. Vol. 31 (1). P. 71–106.
11. Rocha L., Soares-Bastos I., Freitas C., Rademaker A. Scavenger Hunt: What do we Find When Look for Confusions // PROPOR: International Conference on the Computational Processing of Portuguese. 2018. URL: https://www.inf.ufrgs.br/propor-2018/wp-content/uploads/2018/10/PROPOR2018-SRW_paper_12.pdf (дата обращения: 06.06.2022)
12. Sheremetyeva S. Automatic Extraction of Linguistic Resources in Multiple Languages // Proceedings of NLPCS2012, 9th International Workshop on Natural Language Processing and Cognitive Science in conjunction with ICEIS2012, Wroclaw, Poland. 2012. P. 44‒52.
13. Viju J. S. Concept Interpretation by Semantic Knowledge Harvesting // International Journal for Research in Applied Science & Engineering Technology (IJRASET). 2018. Vol. 6 (5). P. 477–484.
Keywords
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.