CONCEPTUAL AMBIGUITY AND SYNCRETISM IN A RUSSIAN DOMAIN CORPUS

  • Анастасия Юрьевна Зиновьева South Ural State University

Abstract

This paper focuses on conceptual ambiguity and syncretism in a Russian corpus on Integrative Physiology, a topical blend of various aspects of medicine and sport. These phenomena need to be studied to produce conceptually annotated corpora, which in turn is of great importance for developing advanced resources for natural language processing. In this article, we provide statistical characteristics of conceptually ambiguous and syncretic lexical units in the corpus on Integrative Physiology, reveal the sources of conceptual ambiguity and syncretism, determine types thereof and composition of the units characterized by these phenomena. The results obtained contribute to the understanding of the conceptual structure of the Integrative Physiology domain and can be used both for conceptual annotation of the domain corpus and for the development of disambiguation rules and metrics.

Downloads

Download data is not yet available.

References

1. Ефремова Т. Ф. Новый словарь русского языка. Толково-словообразовательный. М. : Русский язык, 2001. 2354 с.
2. Зиновьева А. Ю., Шереметьева С. О., Неручева Е. Д. Анализ неоднозначности концептуальной разметки русскоязычного текста // Вестник Тюменского государственного университета. Гуманитарные исследования. Humanitates. 2020. Т. 6, № 3 (23). С. 38‒60.
3. Рахилина Е. В., Кобрицов Б. П., Кустова Г. И., Ляшевская О. Н., Шеманаева О. Ю. Многозначность как прикладная проблема: семантическая разметка в национальном корпусе русского языка // Труды международной конференции «Диалог 2006». М., 2006. С. 445–450.
4. Ожегов С. И., Шведова Н. Ю. Толковый словарь русского языка : 80 000 слов и фразеологических выражений. М. : Азбуковник, 1999.
5. Поляков В. Н. Использование технологий, ориентированных на лексическое значение, в задачах поиска и классификации // Проблемы прикладной лингвистики. 2004. Вып. 2. С. 101–117.
6. Сиротина А. Ю., Лукашевич Н. В. Опыт создания корпуса текстов в сфере информационной безопасности // Сборник Международной научной конференции «Корпусная лингвистика-2019». СПб., 2019. С. 79–85.
7. Филаретова Л. П. Перспективы интегративной физиологии // Интегративная физиология. Всероссийская конференция с международным участием, посвящённая 95-летию Института физиологии им. И. П. Павлова РАН, Санкт-Петербург (9‒11 декабря 2020 г.) : тезисы докладов. СПб. : Ин-т физиологии им. И. П. Павлова РАН, 2020. С. 3.
8. Шереметьева С. О., Бабина О. И. Платформа для концептуального аннотирования многоязычных текстов // Вестник ЮУрГУ. Серия «Лингвистика». 2020. Т. 17, № 4. С. 53–60.
9. Djemaa M., Candito M., Muller Ph., Vieu L. Corpus Annotation within the French Framenet: A Domainby-Domain Methodology // Proceedings of the 10th International Conference on Language Resources and Evaluation. Portorož, Slovenia, 2016. P. 3794–3801
10. Palmer M., Gildea P., Kingsbury P. The Proposition Bank: An Annotated Corpus of Semantic Roles // Computational Linguistics. 2005. Vol. 31 (1). P. 71–106.
11. Rocha L., Soares-Bastos I., Freitas C., Rademaker A. Scavenger Hunt: What do we Find When Look for Confusions // PROPOR: International Conference on the Computational Processing of Portuguese. 2018. URL: https://www.inf.ufrgs.br/propor-2018/wp-content/uploads/2018/10/PROPOR2018-SRW_paper_12.pdf (дата обращения: 06.06.2022)
12. Sheremetyeva S. Automatic Extraction of Linguistic Resources in Multiple Languages // Proceedings of NLPCS2012, 9th International Workshop on Natural Language Processing and Cognitive Science in conjunction with ICEIS2012, Wroclaw, Poland. 2012. P. 44‒52.
13. Viju J. S. Concept Interpretation by Semantic Knowledge Harvesting // International Journal for Research in Applied Science & Engineering Technology (IJRASET). 2018. Vol. 6 (5). P. 477–484.
Published
2023-06-09
How to Cite
ЗИНОВЬЕВА, Анастасия Юрьевна. CONCEPTUAL AMBIGUITY AND SYNCRETISM IN A RUSSIAN DOMAIN CORPUS. Bulletin of Chelyabinsk State University, [S.l.], n. 2(472), p. 38-46, june 2023. ISSN 2782-4829. Available at: <https://journals.csu.ru/index.php/BulletinCSU/article/view/2007>. Date accessed: 19 may 2024.

Keywords

: conceptual ambiguity, conceptual annotation, conceptual syncretism, domain, integrative physiology, Russian language