Кто и почему отказывается от табакокурения в России (на основе данных социальных медиа и применения нейросетей)
DOI:
https://doi.org/10.14515/monitoring.2025.4.2996Ключевые слова:
самосохранительное поведение, табакокурение, генеративный искусственный интеллект, большие языковые модели, цифровая демография, социальные сетиАннотация
Цель работы ― выявить специфику мотивации бросать или не бросать курить среди русскоязычных пользователей социальных медиа. Авторы исследуют систему мнений русскоязычных пользователей социальных сетей по вопросам самосохранительного поведения на основе тематического анализа контента социальных медиа с использованием больших языковых моделей (LLM). Сформированный для этих целей датасет включает более 58 тыс. комментариев на русском языке. Комментарии собраны под видеороликами по теме курения, вручную отобранными авторами в русскоязычном YouTube-сегменте.
В ходе исследования разработан и апробирован алгоритм классификации доводов пользователей социальных медиа по вопросам мотивации табакокурения и мотивации отказа от табакокурения по заданной авторами типовой структуре; разработаны и апробированы алгоритмы классификации определения пола и возраста автора комментария на русском языке социальной сети; построены распределения причин (не)отказа от табакокурения пользователей социальных медиа, в том числе в разрезе демографических характеристик пользователей: пол и возраст. При анализе полученного массива комментариев авторы показывают, что основными доводами в пользу отказа от курения оказываются здоровье и экономия денег, причем первый встречается вдвое чаще второго; среди доводов к сохранению этой привычки выделяются опасения, связанные с лишним весом. При этом существенных гендерных и возрастных отличий в доводах отказа или не отказа от курения выявлено не было.
Благодарность. Исследование выполнено в рамках НИР «Воспроизводство населения в социально-экономическом развитии» 122041800047-9 и внутреннего гранта экономического факультета МГУ им. М. В. Ломоносова на тему: «Демографические детерминанты оценки качества медицинских услуг и отказа от табакокурения: анализ мнений россиян на основе применения нейросетей и генеративного искусственного интеллекта». Авторы выражают благодарность коллегам, участвовавшим в разметке массивов комментариев пользователей социальных медиа: Антону Колотуше и Софии Журавлевой.
Библиографические ссылки
Калабихина И. Е., Казбекова З. Г., Банин Е. П., Клименко Г. А. Демографические ценности и социально-демографический портрет пользователей ВКонтакте: есть ли связь? // Вестник Московского университета. Серия 6. Экономика. 2023. № 3. С. 157―180. https://doi.org/10.55959/MSU0130-0105-6-58-3-8.
Kalabikhina I. E., Kazbekova Z. G., Banin E. P., Klimenko G. A. (2023) Demographic Values and Socio-Demographic Profile of the VKontakte Users: Is There a Connection? Lomonosov Economics Journal. Vol. 58. No. 3. P. 157―180. https://doi.org/10.55959/MSU0130-0105-6-58-3-8. (In Russ.)
Калабихина И. Е., Казбекова З. Г., Зубова Е. А. Доводы пользователей социальных медиа по поводу отказа от табакокурения (на основе методов машинного обучения) // Вопросы управления. 2024. Т. 18. № 5. С. 48―67. https://doi.org/10.22394/2304-3369-2024-5-48-67.
Kalabikhina I. E., Kazbekova Z. G. Zubova E. A. (2024). Arguments of Social Media Users Regarding Smoking Cessation (Machine Learning-Based Data). Management Issues. Vol. 18. No. 5. P. 48―67. https://doi.org/10.22394/2304-3369-2024-5-58-67. (In Russ.)
Кузнецова П. О. Почему не снижается курение у женщин: результаты микроанализа // Женщина в российском обществе. 2019. № 3. С. 91―101.
Kuznetsova P. O. (2019) Why the Number of Smoking Women Does not Decrease: A View from Microanalysis Level. Woman in Russian Society. No. 3. P. 91―101. (In Russ.)
Сбоев А. Г., Рыбка Р. Б., Молошников И. А., Наумов А. В., Селиванов А. А. Сравнение точностей методов на основе языковых и графовых нейросетевых моделей для определения признаков авторского профиля по текстам на русском языке // Вестник НИЯУ МИФИ. 2023. Т. 10. № 6. С. 529―539. https://doi.org/10.56304/S2304487X21060109.
Sboev A. G, Rybka R. B., Moloshnikov I. A., Naumov A. V., Selivanov A. A. (2023). Comparison of the Accuracies of Methods Based on Language and Graph Neural Network Models for Determining Author Profile Features from Russian Texts. Vestnik Nacional’nogo Issledovatel’skogo Yadernogo Universiteta “MIFI”. Vol. 10. No. 6. P. 529―539. https://doi.org/10.1134/S2304487X21060109. (In Russ.)
Соболев А. А., Федотова А. М., Куртукова А. В., Романов А. С., Шелупанов А. А. Методика определения возраста автора текста на основе метрик удобочитаемости и лексического разнообразия // Доклады Томского государственного университета систем управления и радиоэлектроники. 2022. Т. 25. № 2. С. 45―52.
Sobolev A. A., Fedotova A. M., Kurtukova A. V., Romanov A. S., Shelupanov A. A. (2022) Methodology to Determine the Age of the Text’s Author Based on Readability and Lexical Diversity Metrics. Proceedings of TUSUR University. Vol. 25. No. 2. P. 45―52. (In Russ.)
Bickel W. K., Tomlinson D. C., Craft W. H., Ma M., Dwyer C. L., Yeh Y. H., Tegge A. N., Freitas-Lemos R., Athamneh L. N. (2023) Predictors of Smoking Cessation Outcomes Identified by Machine Learning: A Systematic Review. Addict Neuroscience. Vol. 6. Art. 100068. https://doi.org/10.1016/j.addicn.2023.100068.
Cheng N., Chandramouli R., Subbalakshmi K. P. (2011) Author Gender Identification from Text. Digital Investigation. Vol. 8. No. 1. P.78―88. https://doi.org/10.1016/j.diin.2011.04.002.
Chu K.-H., Colditz J., Malik M, Yates T., Primack B. (2019) Identifying Key Target Audiences for Public Health Campaigns: Leveraging Machine Learning in the Case of Hookah Tobacco Smoking. Journal of Medical Internet Research. Vol. 21. No. 7. Art. e12443. http://dx.doi.org/10.2196/12443.
Coughlin L. N., Tegge A. N., Sheffer C. E., Bickel W. K. (2020). A Machine-Learning Approach to Predicting Smoking Cessation Treatment Outcomes. Nicotine & Tobacco Research: Official Journal of the Society for Research. Vol. 22. No. 3. P. 415―422. https://doi.org/10.1093/ntr/nty259.
Culotta A. (2010) Towards Detecting Influenza Epidemics by Analyzing Twitter Messages. In: Proceedings of the First Workshop on Social Media Analytics. New York, NY: Association for Computing Machinery P. 115―122. https://doi.org/10.1145/1964858.1964874.
Dieleman L. A., van Peet P. G., Vos H. M. M. (2021) Gender Differences within the Barriers to Smoking Cessation and the Preferences for Interventions in Primary Care a Qualitative Study Using Focus Groups in The Hague. BMJ Open. Vol. 11. No. 1. Art. e042623. https://doi.org/10.1136/bmjopen-2020-042623.
Guida M., Otmakhova Y., Hovy E., Frermann L. (2025) LLMs for Argument Mining: Detection, Extraction, and Relationship Classification of Pre-Defined Arguments in Online Comments. arXiv. Preprint arXiv:2505.22956. https://doi.org/10.48550/arXiv.2505.22956.
Himdi H., Shaalan K. (2024) Advancing Author Gender Identification in Modern Standard Arabic with Innovative Deep Learning and Textual Feature Techniques. Information. Vol. 15. No. 12. Art. 779. https://doi.org/10.3390/info15120779.
Kalabikhina I., Zubova E., Loukachevitch N., Kolotusha A., Kazbekova Z., Banin E., Klimenko, G. (2023). Identifying Reproductive Behavior Arguments in Social Media Content Users’ Opinions through Natural Language Processing Techniques. Population and Economics. Vol. 7. No. 2. P.40―59. https://doi.org/10.3897/popecon.7.e97064.
Kalabikhina I., Kazbekova Z., Moshkin V. (2025) (Non)Smoking Comments Classified by Arguments, Gender and Age [Data Set]. Zenodo. January 31. Version v1. https://doi.org/10.5281/zenodo.14782953.
Kavuluru R., Sabbir A. K. M. (2016) Toward Automated E-Cigarette Surveillance: Spotting E-Cigarette Proponents on Twitter. Journal of Biomedical Informatics. Vol. 61. P. 19―26. http://dx.doi.org/10.1016/j.jbi.2016.03.006.
Kim K., Kim S. (2025) Large Language Models’ Accuracy in Emulating Human Experts’ Evaluation of Public Sentiments about Heated Tobacco Products on Social Media: Evaluation Study. Journal of Medical Internet Research. Vol. 27. Art. e63631. https://doi.org/10.2196/63631.
Klein A. Z., Magge A., Gonzalez-Hernandez G. (2022) ReportAGE: Automatically Extracting the Exact Age of Twitter Users Based on Self-Reports in Tweets. PloS One. Vol. 17. No. 1. Art. e0262087. https://doi.org/10.1371/journal.pone.0262087.
O’Connor K., Golder S., Weissenbacher D., Klein A. Z., Magge A., Gonzalez-Hernandez, G. (2024) Methods and Annotated Data Sets Used to Predict the Gender and Age of Twitter Users: Scoping Review. Journal of Medical Internet Research. Vol. 26. Art. e47923. https://doi.org/10.2196/47923.
Ritchie H., Roser M. (2023, November) Smoking. Our World in Data. URL: https://ourworldindata.org/smoking (date of access: 20.08.2025).
Romanov A. S., Kurtukova A. V., Sobolev A. A., Shelupanov A. A., Fedotova A. M. (2020) Determining the Age of the Author of the Text Based on Deep Neural Network Models. Information. Vol. 11. No. 12. Art. 589. https://doi.org/10.3390/info11120589.
Sboev A., Litvinova T., Gudovskikh D., Rybka R., Moloshnikov I. (2016) Machine Learning Models of Text Categorization by Author Gender Using Topic-Independent Features. Procedia Computer Science. Vol. 101. P.135―142. https://doi.org/10.1016/j.procs.2016.11.017.
Sboev A., Moloshnikov I., Gudovskikh D., Selivanov A., Rybka R., Litvinova T. (2018) Automatic Gender Identification of Author of Russian Text by Machine Learning and Neural Net Algorithms in Case of Gender Deception. Procedia Computer Science. Vol. 123. P. 417―423. https://doi.org/10.1016/j.procs.2018.01.064.
Visweswaran S., Colditz J.B., O’Halloran P. H., N. R., Taneja S. B., Welling J., Chu K. H., Sidani J. E., Primack B. A. (2020) Machine Learning Classifiers for Twitter Surveillance of Vaping: Comparative Machine Learning Study. Journal of Medical Internet Research. Vol. 22. No. 8. Art. e17478. http://dx.doi.org/10.2196/17478.
Younkin V., Litvak M., Rabaev I. (2024) Automatic Gender Identification from Text. Applied Sciences. Vol. 14. No. 24. Art. 12041. https://doi.org/10.3390/app142412041.
Загрузки
Опубликован
Как цитировать
Выпуск
Раздел
Лицензия
Copyright (c) 2025 Мониторинг общественного мнения: экономические и социальные перемены

Это произведение доступно по лицензии Creative Commons «Attribution-NonCommercial-ShareAlike» («Атрибуция — Некоммерческое использование — На тех же условиях») 4.0 Всемирная.




