![]() |
|
сделать стартовой | добавить в избранное |
![]() |
Корреляционный анализ для ранговых шкал |
Корреляционный анализ для ранговых шкал. С.В. Усатиков, кандидат физ-мат наук, доцент; С.П. Грушевский, кандидат физ-мат наук, доцент; М.М. Кириченко, кандидат социологических наук Продолжаем исследовать объекты, обладающие двумя и более признаками, и уже выяснили, что гипотезу о их независимости можно смело отбросить. Как же теперь предсказывать значение одного признака по значению другого? Насколько вообще сильна эта зависимость? Для изучения способностей человека к умственной или физической деятельности нередко прибегают к специально организованным пробам и тестам. Результатом такого теста является число, называемое тестовым баллом. При замене теста другим подобным тестовые баллы испытуемого изменяются, но ведь объект измерения тот же, что и прежде. Следовательно, для этих чисел имеют смысл только понятия “больше” или “меньше”. Для тестовых баллов, как и для школьных оценок, допустимы только их сравнения. Операции вроде сложения или вычитания для этих шкал не имеют смысла, поскольку нет единицы измерения. Например, нельзя сказать, что получивший оценку 4 знает предмет на 1 балл лучше, чем получивший 3. Ясно только, что получивший 4 знает этот предмет лучше, чем тречник. Итак, реальным содержанием измерений в ранговых шкалах является тот порядок, в котором выстраиваются объекты по степени выраженности измеряемого признака. Например, для изучения двигательных возможностей группы детей мы предложили каждому ребенку сложить что-то определенное из кубиков и палочек. Ясно, что время, затраченное на выполнение задания, тем больше, чем менее развиты способности к тонким движениям рук и пальцев. Поэтому упорядочение испытуемых по затраченному времени совпадает с их упорядочением по развитию этих способностей. При другом подобном задании затраченное время будет другим, но порядок сохранится (конечно, с учетом влияния случайных обстоятельств). Первым решение подобных проблем предложил психолог Ч.Спирмен в 1900 году, обсуждавший, например, связь между способностями к музыке и математике. Пусть проведено испытаний с изменениями двух признаков и получено пар чисел (Xi,Yi), где1Ј iЈ . Упорядочим эти пары по возрастанию чисел Xi и их порядковый номер j (1Ј jЈ ) назовем рангом чисел Xi. Если несколько чисел совпадают по величине, то каждому из них присваивается ранг, равный среднему арифметическому их номеров. Порядок чисел Yi также, естественно, изменится. Если отдельно упорядочить числа yi по возрастанию, то их порядковый номер r тоже становится рангом чисел Yi. Но поскольку эти числа имеют смысл только в паре между собой, ранги r чисел Yi перемещаются и получается пар чисел рангов (j, rj), где 1Ј jЈ . Если признаки взаимосвязаны, то возрастание j влияет на порядок, в котором следуют ранги rj : например, они чаще возрастают, чем убывают, либо наоборот. Еще два случая однозначной зависимости признаков: с возрастанием j ранги rj либо только возрастают, либо только убывают. В этом случае число называемое коэффициентом ранговой корреляции Спирмена, равно либо 1 либо -1. Во всех остальных случаях величина r может колебаться от 1 до -1 и в случае независимости признаков (т.е
. полного “хаоса” среди рангов rj) r =0. Если число r отрицательное, то говорят об отрицательной корреляции, т.е. при возрастании одного признака второй в основном убывает. Если число r положительное , то говорят о положительной корреляции, т.е. при возрастании одного признака второй в основном тоже возрастает. Величина жеЅ r Ѕ Ј 1 показывает в долях меру зависимости признаков. ЕслиЅ r Ѕ близка к 1, говорят о сильной корреляции, т.е. зависимость признаков почти однозначная и случайные отклонения редки. Если Ѕ r Ѕ близка к 0, то говорят о слабой корреляции, т.е. при возрастании одного признака рост или уменьшение другого почти совсем хаотичны и непредсказуемы. В заключении вернемся к вопросу о значимости вычисленного коэффициента r , т.е. к проверке гипотезы о независимости признаков. В данном случае это можно сделать проще. А именно, число подчиняется - закону Стьюдента с = -2 степенями свободы. Поэтому если, например, уровень значимости a =0,2 (или 20%), то заведомо Ј 3 при верной нулевой гипотезе. Следовательно, если >3, то гипотезу о независимости можно отбросить и считать величину r значимой. При других уровнях значимости a и числе степеней свободы необходимо брать критическое значение из таблицы распределения Стьюдента в статистических справочниках или учебниках. Коэффициент Спирмена относится к числу достаточно распространенных измерительных процедур. Одна из причин этой популярности - его “всеядность” - он может быть использован для анализа шкал всех типов (считается, вообще-то, что он предназначен только для шкал ранговых, но и номинальную шкалу можно рассмотреть как ранговую, если рангом считать % ответов по каждой позиции вопроса с номинальной шкалой). С другой стороны, этот достаточно простой коэффициент эффективен для такой, часто весьма необходимой в исследовании, процедуры, как установление степени гомогенности группы. Например, в анкете используются вопросы, касающиеся системы ценностей и жизненных планов выпускников. Позиции вопроса (получение высшего образования, решение жилищного вопроса, удачный брак и дети и т.д. и т.п.) можно проранжировать по степени значимости для всей выпускной группы. Но этот ранговый ряд будет усреднением суммы всех индивидуальных оценок, его составляющих. Поэтому как контрольный прием может быть использована попарное сравнение всех ранговых рядов. Каждая подгруппа выборки принимается за 100%, и в них устанавливаются ранги произведенных оценок. Затем попарно рассчитываются значения r . Недостатком этого приема является то обстоятельство, что использование более чем 10 групп затруднительно - число необходимых парныхъ расчетов переваливает за четыре десятка. Рассмотрим эту процедуру на конкретном примере. В ходе исследования (10-11.1995) политических установок и избирательской активности населения Кубани в анкете применялся вопрос: “Изменилась ли Ваша материальное положение за первую половину 1995 года?” Ответы % Ранги 1. Значительно улучшилось 2,8 5 2. Несколько улучшилось 8,8 4 3. Осталось без изменений 27,4 2 4. Несколько ухудшилось 25,4 3 5. Значительно ухудшилось 35,5 1 Однако при выделении основных, по роду занятий подгрупп, картина стала уже более пестрой (р - ранг) Рабочие Крес- тьяне ИТР, служащие Пред- прини-матели Пенсионе-ры Все-го % р % р % р % р % р Значительно улучшилось 3,8 5 0 5 3,0 5 0 4,5 4 5 5 Несколько улучшилось 9,6 4 10,7 4 4,5 4 60 1 8 4 4 Осталось без изменений 25 3 32,1 1,5 27,8 2 30 2 24 2,5 2 Несколько ухудшилось 30,8 1,5 32,1 1,5 24,1 3 0 4,5 24 2,5 3 Значительно ухудшилось 30,8 1,5 25 3 40,6 1 10 3 40 1 1 Затем по приведенной выше формуле производятся расчеты.
Для групп рабочих и крестьян это будет выглядеть следующим образом: Произведя все необходимые вычисления (в данном примере их должно быть 10), можно построить диагональную матрицу связи: Рабочие Крестьяне ИТР, служащие Предпри- ниматели Пенсионе-ры Рабочие 0,775 0,875 -0,075 0,925 Крестьяне 0,675 0,575 0,700 ИТР, служащие 0,275 0,975 Предпри ниматели 0,125 Пенсионеры Для простоты она переформировывается в таблицу степени совпадения r . Рабочие Крестьяне ИТР, служащие Предпри- ниматели Пенсионеры Рабочие 4 3 10 2 Крестьяне 6 7 5 ИТР, служащие 8 1 Предпри ниматели 9 Пенсионеры Уже на основании этих таблиц можно делать, исходя из различий в проиведенных оценках, какие-либо выводы относительно социально-психологических установыок групп и причин, их определяющих. Необходимо каснуться некоторых недостатков r , так как на ряде процедур анализа этот коэффициент может ”не срабатывать” или исказить результаты. Во-первых, это дефект присущий всем ранговым (в отличии от интервальных) шкалам. Ранги устанавливаются по убыванию / возрвстанию незвасимо от степени разрыва между двумя позициями. В принципе возможен вариант, когда r зафиксирует полную идентичность (r = 1) двух сильно различающихся рядов, например, таких: Группа 1 Группа 2 % ответов ранг % ответов ранг Позиция 1 80 1 20 1 Позиция 2 10 2 19 2 Позиция 3 4 3 17 3 Позиция 4 3 4 16 4 Позиция 5 2 5 15 5 Позиция 6 1 6 13 6 Кроме того, характер парных корреляций не учитывает размера группы. Если Ваши расчеты не автоматизированы, а в программу ЭВМ не заложено ограничение на численность группы, то “умная” машина может абсурдно проранжировать группу из одного человека, присвоив отмеченной одиночной позиции ранг №1, а всем остальным - срединный (для примера табл. 5 это был бы номер 4- срединный между второй и шестой позициями). Однако, прежде чем делать выводы относительно тесноты парных связей подгрупп (и гомогенности группы в целом), необходима проверка значимости коэффициента, установления того “порогового барьера” a , за которым мы можем говорить о наличии занчимой корреляции. По приведенной выше формуле расчета находим, что для групп предпринимателей и пенсионеров (r =0,125), значение равно: = 0,216 что в несколько раз меньше критического (2,353 для a =0,1 и 1,638 для a =0,2). В такой ситуации остается лишь признать связь рядов статистически малозначимой и сильно завысить степень возможной ошибки при повторных замерах (a =0,4-0,5). В заключение остановимся еще на одном коэффециенте ранговой корреляции, не менее употребимом, чем r . Это множественный коэффициент корреляции W, или, как его еще часто называют, коэффициент конкордации. Предназначаемый, как и r , для измерения степени связи ранжированных переменных, он основывается на несколько иной логике анализа. Если коэффициент Спирмена предназначается для анализа степени совпадения/расхождения отдельных групп, составояющих выборочную совокупность, то для коэффициента W объектом оценивания является, как правило, согласованность мнений всей выборочной совокупности. В первом случае употребляется индуктивный метод анализа - от частных фактов (отдельные подгруппы) к общему умозаключяению (степень гомогенности выборочной совокупности).
Опыт выделения и разграничения функциональных и индивидуальных стилей. УЧРП. зап. МГПИИЯ им. М. Тореза, 1970, вып. 54, с. 108-129.}. Объектом исследования служили пьесы, поэмы и сонеты Шекспира, Марло, Чапмена, Лили и Бена Джонсона, за единицу подсчета принималось слово (как совокупность словоформ), а также словообразовательные классы слов (например, слова на -ed, -ing, dis- и т. д.). С целью выявить факторы, оказывающие наибольшее влияние на употребительность лексических единиц, - это было задачей начального этапа исследования - тексты группировались, по сходству в употреблении определенных, специально отобранных признаков - слов и классов слов. Для этого использовался; метод корреляционного анализа. После подсчета частот признаков в текстах между каждой парой исследуемых текстов вычислялся коэффициент корреляции, позволяющий установить, насколько данные тексты близки или же, напротив, расходятся по употребительности признаков, на основе которых производились вычисления. При анализе полученных таблиц коэффициентов корреляций выяснилось, что тексты, сходные по употребительности отобранных признаков, образуют группы (clumps или clusters), из которых пять, наиболее четких и хорошо поддающихся интерпретации, можно определить как жанровые и стилистические
1. Понятие о корреляции и корреляционном анализе в психологии
9. Анализ «я-концепции» с помощью теста «кто я такой»
10. Корреляционно-регрессивный анализ
11. Корреляционно-регрессионный анализ в системе маркетинговых исследований
12. Анализ возможности создания универсального оборудования для замеса хлебного теста
15. Tupolev 154M noise asesment (Анализ шумовых характеристик самолёта Ту-154М)
16. Анализ медико-биологических данных с использованием Excel и СПП STADIA
18. Тесты по биологии для школы
19. Анализ повадок отряда ДЯТЛООБРАЗНЫЕ - Piciformes семейства ДЯТЛОВЫЕ – Picidae
21. Гладкий Лавров - учебник географии 10 класса - население - 30 тестов
25. Статистический анализ демографической ситуации в Российской Федерации
26. Анализ бюджетного дефицита за 1990-1996 годы
27. Анализ регулирования и финансирования бюджетного дефицита с 1985 и по наши дни
28. Экономическая сказка-реферат "НДС - вражья морда" или просто "Сказка про НДС"
29. Анализ проблем возмещения ущерба, причиненного незаконными действиями государственных органов
31. Анализ Конституции США и ее сравнение с Конституцией РФ 1993 года
32. Правительство в Российской Федерации и зарубежных странах. Сравнительный анализ
33. Сравнительный анализ конституции России и США
35. Федеральная резервная система и политика НацБанка РБ: сравнительный анализ
36. Сравнительный анализ Правительств Киргизской Республики и Российской Федерации
37. Историко-правовой анализ Закона СССР "о разграничении полномочий между СССР и субъектами федерации"
41. Анализ современных моделей реформирования налоговой системы
42. Учет и анализ расчетов с персоналом по оплате труда в организации
44. Анализ стихотворения John Donne
45. Грамматический анализ субстантивированных прилагательных и причастий
47. Фразеологический анализ ФЕ с компонентом-соматизмом Mund/рот в немецком и русском языках
48. Синтактико-семантический анализ составляющих сложносоставных слов в английском языке
49. Анализ ЮКОСа. Деятельность, стратегии развития, история
50. Анализ живописных произведений флорентийской школы конца XV - начала XVI веков
51. Метод действенного анализа в режиссуре театра, кино и телевидения
52. Сравнительный анализ культуры Средневековья и Возрождения
53. Несколько рефератов по культурологии
57. Анализ романа "Преступление и наказание" Ф.М.Достоевского
58. Анализ новеллы "Измена" из произведения Бабеля "Конармия"
59. Анализ рассказа Блока "Потомки солнца"
60. Анализ стихотворения А. Блока "О доблестях, о подвигах, о славе"
61. Анализ стихотворения Блока "О доблестях, о подвигах, о славе..."
62. Анализ стихотворения Н.А. Заболоцкого "Завещание"
63. К анализу романа Булгакова "Мастер и Маргарита"
64. Пушкин А.С. "Каменный гость" (Литературоведческий анализ одной из маленьких трагедий)
66. Схема анализа литературно-художественного произведения
67. Анализ стихотворения Тютчева "Я Встретил Вас и всё былое"
68. Сопоставительный анализ употребления перформативных глаголов в русском и английском языках
69. Анализ стихотворения А.А. Блока "Плачет ребенок. Под лунным серпом ..."
73. Анализ поэтического сборника В. Ф. Ходасевича «Путем зерна»
74. Фадеев "Разгром". Анализ характеров героев. Краткое содержание романа
75. Анализ стихотворения А.С. Пушкина "Я помню чудное мгновенье"
76. Сопоставительный анализ стихотворений Мандельштама "Заблудился я в небе - что делать?..."
77. Перевод и анализ стихотворения Эдгара По "Fairy Land"
78. Анализ формы и средств выразительности хора № 19 "Гроза" из оратории Йозефа Гайдна "Времена года"
79. Гармонический анализ "Новеллетты" F-dur ор.21 №1 Р. Шумана
80. Реферат перевода с английского языка из книги “A History of England” by Keith Feiling
81. Анализ деятельности Александра Невского в период раннего средневековья Руси
83. Россия на окраине Европы. Исторический анализ событий и времен начала 20-го века
84. Тесты по истории России с древнейших времен до конца XIX века
89. Сравнительный анализ и оценка возможностей НГМД и НЖМД
90. Тест по истории
91. Анализ структур, характеристик и архитектур 32-разрядных микропроцессоров
92. Синтаксический анализ языка НОРМА. Разбор описания
93. Программа и План - сопоставительный анализ
95. Сравнительный анализ языков программирования JavaScript и VBScript
96. Использование компьютерных программ для анализа финансового состояния организации
97. Информационные системы маркетингового анализа
98. Вопросы на тему "Windows, Excel & Word" с тестами, иллюстрациями и пояснениями
99. Сравнительный анализ каскадной и спиральной моделей разработки программного обеспечения