Вестник Северного (Арктического) федерального университета. Серия «Гуманитарные и социальные науки»
ISSN 2227-6564 e-ISSN 2687-1505 DOI:10.37482/2687-1505
Юридический и почтовый адрес организации-издателя: САФУ, редакция журнала «Вестник САФУ. Серия "Гуманитарные и социальные науки"», наб. Северной Двины, 17, г. Архангельск, Россия, 163002
Тел: (818-2) 21-61-21 о журнале |
: Лингвистика
81’33:811.161.1
10.37482/2227-6564-V038
МАЛИКОВА Алина Вячеславовна, преподаватель кафедры романских языков и прикладной лингвистики Сибирского федерального университета (г. Красноярск)*
ORCID: https://orcid.org/0000-0002-3438-1839 *Адрес: 660041, г. красноярск, просп. Свободный, д. 82А; e-mail: malikovaav1304@gmail
Статья посвящена описанию начальных этапов проекта по разработке классификатора интернеттекстов на русском языке по критерию эмоциональной тональности. Целью проекта является создание
алгоритма сентимент-анализа, атрибутирующего тексты к одному из 8 классов эмоций по модели «куб
Лёвхейма». Необходимыми этапами проекта выступают тщательный отбор языкового материала для обучающей выборки, его независимая экспертная разметка, экспертный лингвистический анализ полученных
данных для выделения маркеров эмоций, их валидация инструментами корпусной лингвистики и – при
условии подтверждения значимости их показателей в корпусах эмоций – валидация в работе прототипа
классификатора. Автор исследует возможность использования невербальных маркеров эмоций в качестве
параметров классификации: в результате лингвистического анализа обнаруживаются два потенциальных
параметра – фиксация лексем заглавными буквами и цифровой формат числительных. Двойная валидация
выявленных маркеров позволяет определить, какой из данных маркеров вызывает положительную динамику точности классификации. Маркер графической передачи числительных приводит к увеличению общей точности работы алгоритма сентимент-анализа на 2 %, а также к приросту точности классификации
для классов Интерес на 7 %, классов Удивление и Радость – на 3 %. Отмечается, что тип невербальных
маркеров по своей эффективности для сентимент-анализа текстов незначительно отстает от лексико-семантических и пунктуационных вербальных маркеров и находится на одном уровне с синтаксическими
вербальными маркерами. Результаты исследования указывают на необходимость рассмотрения данного
типа маркеров наряду с вербальными маркерами эмоций и более подробного изучения конкретных маркеров для их использования в качестве параметров классификатора.
русскоязычные интернет-тексты, классификатор текстов, машинное обучение, невербальные маркеры эмоций, сентимент-анализ
1. Hogenboom A., Frasincar F., de Jong F., Kaymak U. Polarity Classification Using Structure-Based Vector Representations of Text // Decis. Support Sys. 2015. № 74. Р. 46–56.
2. Loukachevitch N.V., Blinov P.D., Kotelnikov E.V., Rubtsova Y.V., Ivanov V.V., Tutubalina E. SentiRuEval: Testing Object-Oriented Sentiment Analysis Systems in Russian // Computational Linguistics and Intellectual Technologies: Proceedings of the Annual International Conference “Dialogue”, Moscow, 27–30 May 2015. Мoscow: RSUH, 2015. Iss. 14 / ed. by V.P. Selegey. P. 3–15. 3. Vasilyev V.G., Denisenko A.A., Soloviev D.A. Aspect Extraction and Twitter Sentiment Classification by Fragment Rules // Computational Linguistics and Intellectual Technologies: Proceedings of the Annual International Conference “Dialogue”, Moscow, 27–30 May 2015. Мoscow: RSUH, 2015. Iss. 14 / ed. by V.P. Selegey. P. 76–88. 4. Karpov I.A., Kozhevnikov M.V., Kazorin V.I., Nemov N.R. Entity Based Sentiment Analysis Using Syntax Patterns and Convolutional Neural Network // Computational Linguistics and Intellectual Technologies: Proceedings of the Annual International Conference “Dialogue”, Moscow, 1–4 July 2016. Мoscow: RSUH, 2016. Iss. 15 / ed. by V.P. Selegey. P. 225–236. 5. Lucas G.M., Gratch J., Malandrakis N., Szablowski E., Fessler E., Nichols J. GOAALLL!: Using Sentiment in the World Cup to Explore Theories of Emotion // Image Vis. Comput. 2017. Vol. 65. P. 58–65. 6. Staiano J., Guerini M. DepecheMood: A Lexicon for Emotion Analysis from Crowd-Annotated News // Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics (ACL), Baltimore, USA, 22–27 June 2014 / ed. by K. Toutanova, H. Wu. N. Y.: Association for Computational Linguistics, 2014. P. 427–433. 7. Alm C.O., Roth D., Sproat R. Emotions from Text: Machine Learning for Text-Based Emotion Prediction // Proceedings of Human Language Technology Conference and Conference on Empirical Methods in Natural Language Processing, Vancouver, Canada, 6–8 October 2005 / ed. by R.J. Mooney. Stroudsburg: Association for Computational Linguistics, 2005. P. 579–586. 8. Lövheim H. A New Three-Dimensional Model for Emotions and Monoamine Neurotransmitters // Medical Hypotheses. 2012. Vol. 78, № 2. Р. 341–348. 9. Tomkins S.S.Affect Theory // Emotion in the Human Face / ed. by P. Ekman. Cambridge: Cambridge University Press, 1982. P. 353–395. 10. Potapova R., Lykova O. Verbal Representation of Lies in Russian and Anglo-American Cultures // Procedia – Soc. Behav. Sci. 2016. Vol. 236. P. 114–118. 11. Pisarevskaya D. Rhetorical Structure Theory as a Feature for Deception Detection in News Reports in the Russian Language // Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference “Dialogue”, Moscow, 31 May – 3 June 2017. Мoscow: RSUH, 2017. Vol. 1, iss. 16 / ed. by V.P. Selegey. P. 191–200. 12. Potapova R., Komalova L. Multimodal Perception of Aggressive Behavior // Lecture Notes in Computer Science. Cham: Springer, 2016. Vol. 9811. P. 499–506. 13. Koltsova O.Y., Alexeeva S.V., Kolcov S.N. An Opinion Word Lexicon and a Training Dataset for Russian Sentiment Analysis of Social Media // Computational Linguistics and Intellectual Technologies: Proceedings of the Annual International Conference “Dialogue”, Moscow, 1–4 July 2016. Мoscow: RSUH, 2016. Iss. 15 / ed. by V.P. Selegey. P. 259–268. 14. Колосов Я.В. Лингвистические корреляты эмоционального состояния «страх» в русской и английской речи: формирование базы данных: дис. … канд. филол. наук. М., 2004. 214 c. 15. Колмогорова А.В. Вербальные маркеры эмоций в контексте решения задач сентимент-анализа // Вопр. когнит. лингвистики. 2018. № 1(54). С. 83–93. DOI: 10.20916/1812-3228-2018-1-83-93 16. Kolmogorova A., Kalinin A., Malikova A. Emojis as Predictors in Lövheim Cube Backed Multi-Class Sentiment Analysis: Can We Really Trust Them? // 6th SWS International Scientific Conference on Arts and Humanities ISCAH 2019. Sofia, 2019. Vol. 6. P. 645–652. |