О корпусе речевых образцов с ошибками в употреблении русского языка как иностранного: способы представления данных и параметры глубинной разметки
https://doi.org/10.37493/2409-1030.2022.4.17
Аннотация
Цель исследования, результаты которого представлены в статье, состоит в разработке оптимального состава и способа представления данных в разрабатываемом корпусе русских речевых образцов с ошибками, допущенными иностранными обучающимися. Разработка такого корпуса обусловлена, во-первых, необходимостью научного описания ошибочных языковых выражений, как подвергаются описанию в настоящее время все значимые факты применения языка, во-вторых, необходимостью создания в лингводидактических целях единой базы систематизированных данных об ошибках в речи изучающих русский язык. Создание такого корпуса требует глубинного описания ошибок в речи, поэтому в настоящей статье предлагается описывать ошибочное языковое выражение как нарушение определенной языковой нормы, определенной семантической, морфологической, синтаксической или лексической языковой модели, лежащей в основе нормативно правильного выражения, с указанием вида речевой деятельности, речевой ситуации, родного языка, специальности обучающегося. В рамках поставленной задачи по созданию корпуса ошибка понимается как сбой на определенном уровне порождения речи, поэтому в основу модели описания ошибок положена модель описания языковых выражений, разработанная отечественными исследователями при создании толково-комбинаторного словаря. Предлагаемая в статье модель глубинного аннотирования ошибочных выражений включает схематизированные модели семантического представления, синтаксической и лексической сочетаемости (в зависимости от характера ошибки) языкового выражения, что призвано, с одной стороны, точно локализовать ошибку в употреблении языка, с другой – послужить учебным материалом в лингводидактике. Сделан вывод, что при достижении статистически значимого количества аннотированных образцов с ошибками в русской речи, допущенными иностранными обучающимися, данные корпуса вполне могут использоваться как источник эмпирических данных для комплексного научного описания фактов языковой действительности. Также сделан вывод, что для жизнеспособности предлагаемого корпуса он должен представлять собой открытую систему, предполагающую включение в глубинное аннотирование новых параметров описания.
Об авторах
С. В. ГусаренкоРоссия
Гусаренко Сергей Викторович – доктор филологических наук, профессор кафедры русского как иностранного
Адрес: д.1, ул. Пушкина, 355017, Ставрополь
М. К. Гусаренко
Россия
Гусаренко Марина Константиновна – кандидат филологических наук, доцент кафедры лингвистики, лингводидактики и межкультурной коммуникации
Адрес: д.1, ул. Пушкина, 355017, Ставрополь
Список литературы
1. Апресян Ю. Д. Типы информации для поверхностно-семантического компонента модели «Смысл↔Текст». Wien: Wiener Slavistischer Almanach, 1980. 119 с.
2. Апресян Ю. Д., Богуславский И. М., Иомдин Б. Л., Иомдин Л. Л., Санников А. В., Санников В. З., Сизов В. Г., Цинман Л. Л. Синтаксически и семантически аннотированный корпус русского языка: современное состояние и перспективы. // Национальный корпус русского языка: 2003-2005 (результаты и перспективы). М.: Индрик, 2005. С. 193–214.
3. Баранчикова А. Д., Сперанская А. Н. Динамика глагольной сочетаемости субстантива клятва по данным Национального корпуса русского языка // Мир русского слова. 2019. №2. С.19–23.
4. Грудева Е. В., Бучилова И. А. Волкова Н. А. Корпусы ошибок: целевая аудитория, возможная архитектура корпуса // Вестник Череповецкого государственного университета. 2018. №5 (86). С. 63–72.
5. Золотов П.Ю. Лингводидактические свойства корпусных технологий. // Вестник Тамбовского университета. Серия: Гуманитарные науки. 2020. Т. 25. №185. С. 75–82.
6. Корпус русских учебных текстов. URL: https://ling.hse.ru/krut (Дата обращения 25.10.2021)
7. Ляшевская О. Н., Кашкин Е. В. Типы информации о лексических конструкциях в системе ФреймБанк // Труды института русского языка им. В. В. Виноградова. М.: Инст. РЯ им. В. В. Виноградова РАН. № 6. 2015. С. 464–555.
8. Ляшевская О. Н. Корпусные инструменты в грамматических исследованиях русского языка. М.: Издательский Дом ЯСК, 2016. 520 c.
9. Мельчук И. А. Опыт теории лингвистических моделей «смысл↔текст». Семантика. Синтаксис. М.: Наука, 1974. 314 с.
10. Мельчук И. А., Жолковский А. К. Толково-комбинаторный словарь русского языка. Опыты семантико-синтаксического описания русской лексики. Wien: Wiener Slavistischer Almanach, 1984. 992 с.
11. Мельчук И. А. Русский язык в модели “смысл↔текст”. Москва – Вена: Школа «Языки русской культуры», Венский славистический альманах, 1995. 682 с.
12. Резанова З. И., Веснина Г. Ю. Подкорпус русской речи билингвов лингвистического корпуса «Томский региональный текст»: принципы разметки и метаразметки корпуса // Вопросы лексикографии. 2016. № 1. С. 29–39.
13. Русский учебный корпус RLC. URL: https://web-corpora.net/RLS/ (Дата обращения 25.10.2021)
14. FrameNet Project. URL: https://framenet.icsi.berkeley.edu/fndrupal/ (Дата обращения: 25.10.2021)
Рецензия
Для цитирования:
Гусаренко С.В., Гусаренко М.К. О корпусе речевых образцов с ошибками в употреблении русского языка как иностранного: способы представления данных и параметры глубинной разметки. Гуманитарные и юридические исследования. 2022;9(4):650-658. https://doi.org/10.37493/2409-1030.2022.4.17
For citation:
Gusarenko S.V., Gusarenko M.K. On the corpus of speech samples with errors in the use of Russian as a foreign language: methods of data representation and deep markup parameters. Humanities and law research. 2022;9(4):650-658. (In Russ.) https://doi.org/10.37493/2409-1030.2022.4.17