Диаграмма еще раз демонстрирует факт независимости между средними как традиционными характеристиками27 и центральностями как структурными характеристиками (и это повторяется для двух других выборок). Воспроизведение этого факта указывает на их несводимость друг к другу. Перейдем теперь к центральностям как таковым и на следующем примере покажем, какую нетривиальную информацию может давать их изучение.

3. Пример третий. Изучение доверия

Третий сюжет почерпнут из двух статей автора [Сатаров, 2016 a; Сатаров, 2016 b], в которых элементы «нового подхода» реализуются наиболее последовательно. Здесь статистический «сетевой» анализ также применяется не к сырым ответам на вопросы анкеты, а к результатам их предварительной обработки. Суть нововведений в следующем. Мы мыслим сеть как образованную совокупностью бинарных переменных – конечных векторов, компоненты которых принимают значения 0 или 1; длина вектора равна объему выборки (или, если потребуется, некой ее подвыборки). Каждая переменная соответствует одному из вариантов ответа на все вопросы анкеты. Эти переменные образуют узлы сети. Связи между узлами – это некоторые меры близости (зависимости, сопряженности) между бинарными переменными. Автор уже давно использует в качестве такой меры величину, известную в анализе таблиц сопряженности под названием приведенных стандартизированных остатков. Есть два бинарных вектора x и y длины n; xy – вектор, образованный из первых двух путем перемножения соответствующих координат. Через |x| обозначается число единиц в векторе x (аналогичным образом это обозначение используется для других векторов). Если вектору x соответствует некий ответ на некий вопрос, то |x| – число респондентов, выбравших этот ответ на этот вопрос.



Величина известна под названием «остаток». Он равна нулю или близка к нему, если (как в нашем примере) выбор респондентами ответов x и y есть события независимые. Когда остаток e>xy значимо отклоняется от нуля, мы имеем основания говорить о положительной (e>xy больше нуля) или отрицательной (e>xy меньше нуля) зависимости между выбором респондентами двух ответов. Чтобы оценить статистическую значимость отклонения, от величины e>xy переходят к связанной с ней статистике28:



которая имеет стандартное нормальное асимптотическое распределение. Это позволяет дальше действовать следующим образом. Мы задаемся некоторой устраивающей нас доверительной вероятностью P (0,05; 0,01, 0,005 …) и используем соответствующее ей значение z – такое, что (1 – N (z)) = P, где N – функция стандартного нормального распределения в качестве порогового значения. Далее мы исключаем из сети все связи между узлами (бинарными векторами) x и y, которым соответствуют абсолютные значения статистики A>xy, меньшие z. Таким образом, в сети остаются только связи между узлами со статистически значимыми зависимостями.

На данном этапе развития «нового подхода» мы не изучали всю сеть, которую можно построить на основе ответов на все вопросы некой анкеты. Описанное выше сетевое представление данных опроса использовалось для изучения локальных свойств отдельных узлов сети. Изучались все значимые связи некого узла и характеристики этой совокупности связей (например, центральность). В двух упомянутых выше статьях объектами изучения были ответы респондентов на вопросы о степени доверия к четырем институтам: к президенту, правительству, Федеральному собранию и милиции (полиции). Респонденты могли выбрать один из вариантов ответа: «Полностью доверяю», «Скорее доверяю», «Скорее не доверяю», «Совсем не доверяю». Вопросы о доверии этим институтам задавались в разные годы. В описываемом исследовании сравнивались данные 1998, 2001 и 2015 гг. В качестве меры центральности использовалась доля высоких по абсолютному значению связей во всей совокупности рассматриваемых связей. Сопоставлялись центральности (и другие характеристики) для разных вариантов ответа, разных институтов и разных годов. Этот весьма поверхностный анализ дал немало важных результатов, часть из которых будет представлена ниже.