ИНФОРМАЦИОННО-ТЕХНОЛОГИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ОПТИМИЗАЦИИ НАУЧНО-ИССЛЕДОВАТЕЛЬСКОЙ ДЕЯТЕЛЬНОСТИ ПО ТЕОРЕТИЧЕСКОЙ И ПРИКЛАДНОЙ ЛИНГВИСТИКЕ В УСЛОВИЯХ ЦИФРОВИЗАЦИИ
https://doi.org/10.37493/2409-1030.2021.4.26
Аннотация
В статье излагаются результаты исследования путей оптимизации рабочего процесса, положенного в основу проведения лингвистических исследований с привлечением методологии и методики корпусной лингвистики и автоматизированной обработки языкового и речевого материала. Приводятся рекомендации и предложения по выбору и практическому применению современных свободных лингвистических программных продуктов в разнонаправленных исследованиях по теоретической и прикладной лингвистике. Предлагаются основания для классификации современного лингвистического программного обеспечения на основе критериев функциональности, кросс-платформенности, свободной модели распространения и открытости программного кода. На данных основаниях даются рекомендации по интеграции в рабочий процесс лингвиста корпусного, лексикографического, переводческого и фонетического программного обеспечения, а также языков программирования с поддержкой известных и признанных лингвистических библиотек алгоритмов. Уделяется внимание программным продуктам общего назначения, способным выступить фактором оптимизации рабочего процесса лингвиста-исследователя. Актуальность предпринятого исследования связана с активизацией в последние годы процессов цифровизации науки, внедрением и привлечением методологии прикладной лингвистики при проведении научных исследований по теории языка, а также планируемым объединением теоретической и прикладной лингвистики в единую научную специальность по номенклатуре Высшей аттестационной комиссии Российской Федерации. Новизна предпринятого исследования продиктована комплексным и системным подходом к анализу рабочего процесса лингвиста-исследователя в контексте современного свободного и бесплатного лингвистического программного обеспечения с открытым программным кодом. Научной новизной также характеризуется расширенная трактовка понятия «лингвистическое программное обеспечение», включающая программные продукты для подготовки и редактирования отчетов о результатах лингвистических исследований.
Об авторе
М. В. КаменскийРоссия
доктор филологических наук, доцент, профессор кафедры романо-германской филологии и лингводидактики гуманитарного института
Ставрополь
Список литературы
1. Антопольский, Б.А. Лингвистические ресурсы и технологии в России: состояние и перспективы. (Обзор) // Социальные новации и социальные науки. М.: ИНИОН РАН, 2021. № 2. С. 114-131.
2. Бабина, О.И. Корпусный метод автоматического морфологического анализа флективных языков // Вестник ЮурГУ. 2012. № 25. С. 38-44.
3. Колмогорова, А.В., Калинин, А.А., Маликова, А.В. Лингвистические принципы и методы компьютерной лингвистики для решения задач сентимент-анализа русскоязычных текстов // Актуальные проблемы филологии и педагогической лингвистики. 2018. №1(29). С. 139-148.
4. Национальный корпус русского языка URL: https://ruscorpora.ru/new/ (Дата обращения: 14.09.2021).
5. Паспорт специальности ВАК 10.02.19 URL: https://teacode.com/online/vak/p10-02-19.html (Дата обращения: 14.09.2021).
6. Паспорт специальности ВАК 10.02.21 URL: https://teacode.com/online/vak/p10-02-21.html (Дата обращения: 14.09.2021).
7. Проекты паспортов научных специальностей номенклатуры научных специальностей, по которым присуждаются степени, утвержденной приказом Министерства науки и высшего образования Российской федерации от 24 февраля 2021 г. № 118 URL: https://drive.google.com/drive/folders/1xqoWINSPHH48_IA2Iw1uuWt3qkMQc5E0 (Дата обращения: 14.09.2021).
8. Стиль цитирования ГОСТ 7.0.5-2008 для программы Zotero URL: https://github.com/romanraspopov/GOST-styles-forZotero (Дата обращения: 15.09.2021).
9. Стиль цитирования ГОСТ 7.32-2017 для программы Zotero URL: https://firescience.ru/project/zoterogost/7322017.html (Дата обращения: 15.09.2021).
10. Тарасова, И.А. Концептуальное моделирование как методологическая основа анализа корпусных данных // Вестник Томского государственного университета. Филология. 2020. №63. С. 178-188.
11. Фридл, Дж. Регулярные выражения. М.: Символ-Плюс, 2008. 608 с.
12. Artha – The Open Thesaurus URL: http://artha.sourceforge.net/ (Дата обращения: 14.09.2021).
13. Audacity: Free, open source, cross-platform audio software for multi-track recording and editing URL: https://www.audacityteam.org/ (Дата обращения: 14.09.2021).
14. Bird, S., Klein, E., Loper, E. Natural Language Processing with Python URL: http://www.nltk.org/book/ (Дата обращения: 14.09.2021).
15. Сorpus of contemporary American English (cOcA) URL: https://www.english-corpora.org/coca/ (Дата обращения: 14.09.2021).
16. Fuzzy Searches: IBM Documentation. URL: https://www.ibm.com/docs/en/informix-servers/12.10?topic=modifiers-uzzysearches (Дата обращения: 14.09.2021).
17. GATE (General Architecture for Text Engineering) [RL: https://gate.ac.uk/ (Дата обращения: 14.09.2021).
18. GATE: 13th Training course (online) – Feb 2021 URL: https://gate.ac.uk/wiki/TrainingcourseFeb2021/ (Дата обращения: 14.09.2021).
19. GATE: Developing Language Processing components With GATE (a User Guide) URL: https://gate.ac.uk/sale/tao/split.html (Дата обращения: 14.09.2021).
20. GNU Emacs URL: https://www.gnu.org/software/emacs/ (Дата обращения: 14.09.2021).
21. GoldenDict URL: http://goldendict.org/ (Дата обращения: 14.09.2021).
22. Google Scholar: Natural Language Toolkit URL: https://scholar.google.com.au/scholar?q=%22natural+language+toolkit%22 (Дата обращения: 14.09.2021).
23. Hammond, M. Programming for Linguists: Java Technology for Language Researchers. cambridge: Blackwell Publishers, 2002. – 288 p.
24. LancsBox: Lancaster University corpus Toolbox URL: http://corpora.lancs.ac.uk/lancsbox (Дата обращения: 14.09.2021).
25. LancsBox: Lancaster University corpus Toolbox: Materials URL: http://corpora.lancs.ac.uk/lancsbox/materials.php (Дата обращения: 14.09.2021).
26. LibreOffice – Free Office Suite URL: https://www.libreoffice.org/ (Дата обращения: 14.09.2021).
27. Linux Mint URL: https://www.linuxmint.com/ (Дата обращения: 14.09.2021).
28. Natural Language Toolkit URL: http://www.nltk.org/ (Дата обращения: 14.09.2021).
29. NLTK: Accessing Text corpora and Lexical Resources URL: https://www.nltk.org/book (Дата обращения: 14.09.2021).
30. OmegaT – The Free Translation Memory Tool URL: https://omegat.org/ (Дата обращения: 14.09.2021).
31. Open American National corpus (OANc) URL: https://www.sketchengine.eu/oanc_masc-corpus/ (Дата обращения: 14.09.2021).
32. OpenJDK: Java Development Kit URL: https://openjdk.java.net/ (Дата обращения: 14.09.2021).
33. Praat: Doing Phonetics By computer URL: https://www.fon.hum.uva.nl/praat/ (Дата обращения: 14.09.2021).
34. Praat: Picture Window URL: https://www.fon.hum.uva.nl/praat/manual/Picture_window.html (Дата обращения: 14.09.2021).
35. Python URL: https://www.python.org/ (Дата обращения: 14.09.2021).
36. Regex 101: Build, test, and debug regex URL: https://regex101.com/ (Дата обращения: 14.09.2021).
37. Tenacity URL: https://tenacityaudio.org/ (Дата обращения: 14.09.2021).
38. Tools for corpus Linguistics URL: https://corpus-analysis.com/ (Дата обращения: 14.09.2021).
39. Trados: Translation Software, cAT Tool & Terminology URL: https://www.trados.com/ (Дата обращения: 14.09.2021).
40. TuxTrans: Applications URL: http://web.archive.org/web/20210126083214/https://www.uibk.ac.at/tuxtrans/software.html (Дата обращения: 14.09.2021).
41. Vim URL: https://www.vim.org/ (Дата обращения: 14.09.2021).
42. VLc Media Player URL: https://www.videolan.org/index.ru.html (Дата обращения: 14.09.2021).
43. VLc Media Player Portable (PortableApps.com) URL: https://portableapps.com/apps/music_video/vlc_portable (Дата обращения: 14.09.2021).
44. What is Translation Memory? URL: https://www.trados.com/solutions/translation-memory/ (Дата обращения: 14.09.2021).
45. XMind – Mind Mapping Software URL: https://www.xmind.net/ (Дата обращения: 14.09.2021).
46. XMind Tutorial URL: https://www.xmind.net/embed/Keyt/ (Дата обращения: 14.09.2021).
47. Zorin OS: Your computer. Better URL: https://zorinos.com/ (Дата обращения: 14.09.2021).
48. Zotero: Your Personal Research Assistant URL: https://www.zotero.org/ (Дата обращения: 14.09.2021).
Рецензия
Для цитирования:
Каменский М.В. ИНФОРМАЦИОННО-ТЕХНОЛОГИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ОПТИМИЗАЦИИ НАУЧНО-ИССЛЕДОВАТЕЛЬСКОЙ ДЕЯТЕЛЬНОСТИ ПО ТЕОРЕТИЧЕСКОЙ И ПРИКЛАДНОЙ ЛИНГВИСТИКЕ В УСЛОВИЯХ ЦИФРОВИЗАЦИИ. Гуманитарные и юридические исследования. 2021;(4):208-218. https://doi.org/10.37493/2409-1030.2021.4.26
For citation:
Kamensky M.V. INFORMATION TECHNOLOGIES IN OPTIMIZING SCIENTIFIC RESEARCH IN THE SPHERE OF THEORETICAL AND APPLIED LINGUISTICS IN THE DIGITAL AGE. Humanities and law research. 2021;(4):208-218. (In Russ.) https://doi.org/10.37493/2409-1030.2021.4.26