НЕОДНОЗНАЧНОСТЬ И СИНКРЕТИЗМ КОНЦЕПТУАЛЬНОЙ СТРУКТУРЫ РУССКОЯЗЫЧНОГО КОРПУСА ПРЕДМЕТНОЙ ОБЛАСТИ
Аннотация
Статья посвящена явлениям концептуальной неоднозначности и концептуального синкретизма в русскоязычном корпусе предметной области «Исследование интегративной физиологии спортсменов», которая представляет собой актуальное сочетание различных областей медицины и спорта. Изучение этих явлений важно для создания концептуально размеченных корпусов, что имеет большое значение для разработки ресурсов автоматической обработки текста. В статье приведены статистические характеристики распределения концептуально неоднозначных и синкретичных лексических единиц в корпусе указанной предметной области, выявлены источники концептуальной неоднозначности и синкретизма, определены их типы и композиционный состав единиц, характеризующихся этими явлениями. Результаты вносят вклад в понимание концептуальной структуры дискурса предметной области «Исследование интегративной физиологии спортсменов» и могут быть использованы для концептуальной разметки корпуса данной предметной области, а также при разработке правил и метрик снятия концептуальной неоднозначности.
Скачивания
Литература
2. Зиновьева А. Ю., Шереметьева С. О., Неручева Е. Д. Анализ неоднозначности концептуальной разметки русскоязычного текста // Вестник Тюменского государственного университета. Гуманитарные исследования. Humanitates. 2020. Т. 6, № 3 (23). С. 38‒60.
3. Рахилина Е. В., Кобрицов Б. П., Кустова Г. И., Ляшевская О. Н., Шеманаева О. Ю. Многозначность как прикладная проблема: семантическая разметка в национальном корпусе русского языка // Труды международной конференции «Диалог 2006». М., 2006. С. 445–450.
4. Ожегов С. И., Шведова Н. Ю. Толковый словарь русского языка : 80 000 слов и фразеологических выражений. М. : Азбуковник, 1999.
5. Поляков В. Н. Использование технологий, ориентированных на лексическое значение, в задачах поиска и классификации // Проблемы прикладной лингвистики. 2004. Вып. 2. С. 101–117.
6. Сиротина А. Ю., Лукашевич Н. В. Опыт создания корпуса текстов в сфере информационной безопасности // Сборник Международной научной конференции «Корпусная лингвистика-2019». СПб., 2019. С. 79–85.
7. Филаретова Л. П. Перспективы интегративной физиологии // Интегративная физиология. Всероссийская конференция с международным участием, посвящённая 95-летию Института физиологии им. И. П. Павлова РАН, Санкт-Петербург (9‒11 декабря 2020 г.) : тезисы докладов. СПб. : Ин-т физиологии им. И. П. Павлова РАН, 2020. С. 3.
8. Шереметьева С. О., Бабина О. И. Платформа для концептуального аннотирования многоязычных текстов // Вестник ЮУрГУ. Серия «Лингвистика». 2020. Т. 17, № 4. С. 53–60.
9. Djemaa M., Candito M., Muller Ph., Vieu L. Corpus Annotation within the French Framenet: A Domainby-Domain Methodology // Proceedings of the 10th International Conference on Language Resources and Evaluation. Portorož, Slovenia, 2016. P. 3794–3801
10. Palmer M., Gildea P., Kingsbury P. The Proposition Bank: An Annotated Corpus of Semantic Roles // Computational Linguistics. 2005. Vol. 31 (1). P. 71–106.
11. Rocha L., Soares-Bastos I., Freitas C., Rademaker A. Scavenger Hunt: What do we Find When Look for Confusions // PROPOR: International Conference on the Computational Processing of Portuguese. 2018. URL: https://www.inf.ufrgs.br/propor-2018/wp-content/uploads/2018/10/PROPOR2018-SRW_paper_12.pdf (дата обращения: 06.06.2022)
12. Sheremetyeva S. Automatic Extraction of Linguistic Resources in Multiple Languages // Proceedings of NLPCS2012, 9th International Workshop on Natural Language Processing and Cognitive Science in conjunction with ICEIS2012, Wroclaw, Poland. 2012. P. 44‒52.
13. Viju J. S. Concept Interpretation by Semantic Knowledge Harvesting // International Journal for Research in Applied Science & Engineering Technology (IJRASET). 2018. Vol. 6 (5). P. 477–484.
Ключевые слова
Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial» («Атрибуция — Некоммерческое использование») 4.0 Всемирная.