Поиск многомерной связи категориальных признаков: сравнение CHAID, логлинейного анализа и множественного анализа соответствий

Авторы

  • Светлана Васильевна Жучкова Национальный исследовательский университет Высшая школа экономики https://orcid.org/0000-0002-4425-725X
  • Алексей Николаевич Ротмистров Национальный исследовательский университет «Высшая школа экономики» http://orcid.org/0000-0003-2386-8710

DOI:

https://doi.org/10.14515/monitoring.2019.2.02

Ключевые слова:

категориальные переменные, многомерная связь, прогностические модели, электоральное поведение, эффекты взаимодействия

Аннотация

В работе затрагивается проблема отсутствия разработанных концепций анализа многомерных связей между категориальными признаками при том, что такие признаки и многомерные связи между ними довольно распространены в социологических исследованиях. Об этом свидетельствует ряд методологических работ, в которых делается вывод о необходимости анализа многомерных связей, а не только парных, поскольку многомерные связи не сводятся к набору парных связей. Тем не менее опыт изучения многомерных связей между категориальными признаками в социологии остается довольно ограничен и практически отсутствует его теоретическое обобщение. Настоящим исследованием авторы попытались восполнить этот пробел через сравнение трех методов, подходящих для поиска многомерной связи между категориальными признаками: дерева решений CHAID, логлинейного анализа и множественного анализа соответствий. Сравнение методов происходило на теоретическом и эмпирическом уровнях. Содержательной задачей эмпирического этапа выступило составление портрета типичного представителя электората различных российских политических партий на основе базы восьмой волны Европейского социального исследования, проведенного в 2016 г., и социологического теоретико-методологического подхода к изучению электорального поведения. Результаты применения этих методов приведены к форме комбинаций категорий; введены числовые критерии сравнения, благодаря чему выделен наиболее эффективный метод в двух типах аналитических задач: описании и прогнозировании. Согласно результатам исследования, в описательных задачах наиболее эффективен множественный анализ соответствий, а в задачах прогноза — логлинейный анализ. Последний вывод противоречит сложившемуся мнению о преимуществе CHAID в случаях наличия в данных какого-либо целевого признака и в связи с этим обладает высокой практической значимостью для дальнейшего развития идеи построения высокоточных прогностических моделей в социологических исследованиях.

Благодарность. Публикация подготовлена в ходе проведения исследования «Обоснование преимуществ поиска эффектов взаимодействия и их учета в социологических регрессионных моделях» (№18-05-0031) в рамках Программы «Научный фонд Национального исследовательского университета «Высшая школа экономики» (НИУ ВШЭ)» в 2018 г. и в рамках государственной поддержки ведущих университетов Российской Федерации «5-100».

Биографии авторов

Светлана Васильевна Жучкова, Национальный исследовательский университет Высшая школа экономики

  • Национальный исследовательский университет «Высшая школа экономики», Москва, Россия
    • студентка 1 курса магистратуры факультета компьютерных наук

Алексей Николаевич Ротмистров, Национальный исследовательский университет «Высшая школа экономики»

  • Национальный исследовательский университет «Высшая школа экономики», Москва, Россия
    • кандидат социологических наук, доцент

Загрузки

Опубликован

2018-12-17

Как цитировать

Жучкова, С. В., & Ротмистров, А. Н. (2018). Поиск многомерной связи категориальных признаков: сравнение CHAID, логлинейного анализа и множественного анализа соответствий. Мониторинг общественного мнения: экономические и социальные перемены, (2). https://doi.org/10.14515/monitoring.2019.2.02

Выпуск

Раздел

Методы и методология

Наиболее читаемые статьи этого автора (авторов)