Моделирование структурными уравнениями для чего

Моделирование латентных изменений c помощью структурных уравнений * 2649

Митина О.В.
кандидат психологических наук, ведущий научный сотрудник факультета психологии, Московский государственный университет имени М.В. Ломоносова (ФГБОУ ВО МГУ имени М.В. Ломоносова), Москва, Россия
ORCID: https://orcid.org/0000-0002-2237-4404
e-mail: omitina@inbox.ru

Ссылка для цитирования

Основные положения и принципы структурного моделирования

Структурное моделирование (СМ), или моделирование структурными уравнениями, по сути дела, всеобъемлющая и необычайно мощная техника многомерного анализа, включает большое количество методов из различных областей статистики. Кратко можно сказать, что структурное моделирование представляет собой развитие многих методов многомерного анализа, а именно: множественная линейная регрессия, дисперсионный анализ, факторный анализ, которые получили здесь естественное развитие и объединение (Митина, 2005; Bentler, 1995).

Основные понятия, с которыми работает структурное моделирование, – это переменные, в психологии – ответы на пункты опросников, характеристики, показатели, выраженность качеств и т. д. Переменные могут быть измеряемыми, наблюдаемыми, их значения определяются непосредственно в результате опроса, отчета или самоотчета, наблюдений, физических, физиологических, социально-демографических измерений. Другой тип переменных – латентные, ненаблюдаемые. Это гипотетические конструкты, которые нельзя измерить непосредственно. Исследователь, строя свою психологическую теорию, предполагает их существование и проявление через измеряемые переменные. Значение этой латентной переменной определяется исходя из заданных в теории структурных уравнений на основании значений измеряемых переменных.

В структурных моделях латентные переменные обозначаются буквой F (factor – фактор), а наблюдаемые V (variable – переменная).

Все переменные, измеряемые и латентные, взаимодействуют друг с другом. Характер этих взаимодействий устанавливается исследователем на этапе формулирования гипотез. Переменные могут детерминировать одна другую (т. е. составлять причинно-следственную пару): детерминирующая переменная называется независимой, а детерминируемая – зависимой. В причинно-следственных парах в качестве зависимых и независимых переменных выступают как латентные, так и наблюдаемые переменные в любом сочетании. То есть и латентные и наблюдаемые переменные могут детерминироваться и латентными и наблюдаемыми переменными. Возможно также, что зависимая переменная, в свою очередь, также может детерминировать какую-либо третью переменную. Другой тип связи между переменными, участвующими в модели, – корреляционный. Переменные каким-то образом связаны друг с другом, но нет оснований говорить, что одна из них является причиной, а другая следствием.

Чтобы модель была полна, правила структурного моделирования предполагают, что для каждой зависимой переменной (латентной или измеряемой), помимо общей части, определяемой весовым вкладом детерминирующих ее известных независимых переменных, есть еще и специфичность, в модели не вычисляемая, но выражаемая латентной переменной E для наблюдаемых зависимых переменных и D – для латентных зависимых переменных. Эти остаточные переменные, являясь латентными и независимыми, также взаимодействуют между собой по всем правилам структурной модели. Как правило, остаточные компоненты не включаются в интерпретацию и выносятся за рамки анализируемой модели. В структурном моделировании бывает достаточно просто указать на них и обозначить их как E (от слова “error” – ошибка). Однако мы склонны придавать им большее значение и интерпретировать их не как ошибку модели, а как специфичность переменной, которую данная модель не учитывает либо в силу заранее известной ограниченности (поскольку любая модель не совершенна), либо в силу недостаточной разработанности. Анализ взаимосвязей между остаточными членами нам представляется полезным и информативным.

Существует два эквивалентных способа задать модель – графически, с помощью диаграммы, или с помощью системы линейных уравнений множественной регрессии и ковариационных соотношений. На структурных диаграммах латентные переменные обозначаются овалами, а наблюдаемые прямоугольниками, причинно-следственная пара соединяется односторонней стрелкой, исходящей из независимой и оканчивающейся на зависимой переменной. Ковариационные связи обозначаются двухсторонними стрелками (рис. 1).

Факт, что переменная X детерминирует переменную Y , на графике обозначаемый односторонней стрелкой, задается следующим структурным уравнением:

Y = aX + EY , где a – это коэффициент детерминации, EY – остаточный член[2].

Значения параметров a и b могут быть определены заранее, исходя, например, из результатов каких-либо предыдущих исследований, данных наблюдений или предполагаются к оценке в ходе анализа модели. В последнем случае эти коэффициенты заменяются звездочками.

В структурном моделировании задаются или оцениваются ковариации (корреляции) только независимых переменных. Ковариации зависимых переменных вычисляются исходя из симметричности и линейности этой функции: ( aX+bY,Z) = (Z,aX+bY) = a(X,Z) + b(Y,Z) .

Ковариация переменной с самой собой есть вариация и является ее мерой разброса. На диаграммах вариации обозначаются круговой стрелкой, исходящей и заканчивающейся на самой переменной, и чаще всего просто упоминаются, а на самом рисунке опускаются. Вариации, как и ковариации и коэффициенты детерминации, могут быть заранее известными исходя из теоретических соображений или предыдущих исследований, а могут оцениваться в ходе анализа модели. Вариации остаточных членов E и D , являющихся независимыми латентными конструктами, считаются заранее неизвестными и обозначаются звездочками, а вот их коэффициенты детерминаций на исследуемые зависимые переменные для задания масштаба полагаются равными 1. Ниже представлена эквивалентная структурной схеме система уравнений.

Следующие два этапа в определенном смысле напоминают этапы регрессионного анализа. Вначале с помощью минимизирующей процедуры (чаще всего метода наименьших квадратов) вычисляются оценки для регрессионных коэффициентов, вариаций и ковариаций независимых переменных, а потом с помощью статистических критериев определяется значимость вычисленных параметров и интегральный показатель, позволяющий определить, насколько теоретическая модель, заданная формулами, в целом соответствует экспериментальным данным. Таких показателей несколько:

отношение c2 к числу степеней свободы df . Оптимально, чтобы этот показатель не был больше 2.
CFI (Comparative Fit Index) – сравнительный критерий согласия, лежащий в пределах от 0 до 1. Если CFI больше 0,9, значит, модель согласована.
RMSEA (root mean-square error of approximation) – квадратичная усредненная ошибка аппроксимации. Этот показатель также лежит в пределах от 0 до 1. Однако для принятия нулевой гипотезы его значение не должно превышать 0,05.

Как правило, исследователь принимает решение о согласованности модели исходя из общей совокупности значений указанных показателей. Если один из показателей дает «хорошее» значение, а остальные не очень сильно отклоняются от критериального интервала, можно принимать гипотезу о согласованности.

Моделирование латентных изменений

Моделирование латентных изменений наряду с конфирматорным факторным анализом, анализом путей входит в арсенал методов структурного моделирования.

В англоязычной литературе этот набор техник называется «Latent Growth Modeling», что дословно можно перевести как моделирование латентного роста. Однако мы предпочитаем употреблять именно слово «изменения», так как динамика может происходить не только в сторону роста, но и падения, либо иметь какую-то нелинейную форму.

Этот метод применяется наиболее часто для анализа повторяющихся измерений, для данных, полученных в ходе лонгитюдных исследований (Duncan et al., 1999). Однако он также может быть использован и в том случае, если выбрать какой-либо независимый параметр и получать данные (повторять измерения), последовательно (упорядоченно) изменяя значения независимого параметра. Очевидно, что при лонгитюде этим независимым параметром является время, а естественный временной ход соответствует последовательному изменению значений этого независимого параметра.

Для простоты рассмотрим в начале моделирование латентного линейного роста. Далее все рассуждения могут быть распространены на более общий случай латентных изменений (как монотонных, так и немонотонных).

Линейный рост можно представить с помощью уравнения Y=aX+b (рис. 2). X – это независимая переменная, Y – это линейно зависимая от X переменной. Параметр a соответствует углу наклона прямой, а параметр b – точке пересечения этой прямой с осью OY (т. е. уровню, на который эта наклонная прямая приподнята (если b > 0) или опущена (если b OX ).

Если теперь предположим, что в ходе эксперимента были зафиксированы две переменные X и Y , и было сделано n наблюдений, то есть получено n пар значений ( X i Y i ), то известная задача линейной регрессии заключается в нахождении таких значений a и b , чтобы прямая Y=aX+b алгебраически и статистически соответствовала экспериментальным данным (Тюрин, Макаров, 1998).

Эта же идея используется и при моделировании латентного линейного роста. В случае когда имеется некоторое количество повторяющихся измерений Y i ( I = 0,1, …, n – временные этапы), необходимо выявить меньшее количество латентных факторов (в линейном случае два), позволяющих описывать всю модель без существенной потери информации.

На рис. 3 изображена схема взаимосвязи латентных и наблюдаемых переменных, используемая для моделирования латентного линейного роста. Y 1 , Y 2 , Y 3 – это измерения какой-либо характеристики, выполненные при последовательно возрастающих значениях независимого параметра. В данной модели латентные факторы отмечены F 0 и F 1 и позволяют моделировать характер изменений. Односторонние стрелки соответствуют связям детерминации (латентные переменные детерминируют наблюдаемые переменные). Числа, стоящие рядом со стрелками, обозначают факторные нагрузки того или иного фактора на соответствующие переменные.

Как видим из рис. 3 и соответствующей системы уравнений, факторные нагрузки по фактору F 0 одинаковы для всех наблюдаемых переменных, а по фактору F 1 изменяются с каждым следующим шагом на единицу, т. е. пропорционально n (номеру измерения). Таким образом, если проводить аналогию с уравнением линейной регрессии, фактор F 0 соответствует константе, а фактор F 1 – коэффициенту наклона.

Однако существенное различие между линейной регрессией и латентным моделированием линейного роста заключается в составе требуемых для анализа данных.

В первом случае необходимо большое количество пар наблюдений над различными объектами по зависимой Y и независимой X переменным. Во втором случае необходимо производить наблюдения (измерения зависимой переменной Y ) над одними и теми же объектами при различных фиксированных уровнях (значениях) независимого параметра (переменной X ). В этом смысле дизайн эксперимента аналогичен дисперсионному анализу, при проведении которого также необходимо измерять зависимый показатель у всех объектов при разных уровнях анализируемого фактора (Гусев, 2000). Если в случае линейной регрессии множество различных значений X i должно быть большим, чтобы гарантировать достоверность результатов, то в случае моделирования латентного линейного роста различных уровней может быть немного (например, трех вполне достаточно), однако такая возможность ставит перед необходимостью проведения измерений зависимой переменной у всех элементов выборки при каждом значении независимого параметра.

Моделирование латентных изменений позволяет определить не только общие для всей выборки показатели – наклон и константу (макроуровень), но и установить, от чего эти коэффициенты могут зависеть у каждого конкретного объекта наблюдений (индивида) (микроуровень).

На рис. 4 представлены различные виды линейных графиков. С помощью линейной регрессии можем вычислить одну «усредненную» прямую, у которой коэффициенты a и b являются усредненными значениями коэффициентов a i и b i для каждого индивида в отдельности. Структурное моделирование позволяет выявлять латентную линейную зависимость (т. е. строить линейный график) для каждого испытуемого, соотносить индивидуальные зависимости друг с другом, определять характер разброса, причины выявленных различий.

Таким образом, можно сказать, что латентное моделирование линейного роста в определенной степени интегрирует идеи линейного регрессионного анализа, факторного и дисперсионного анализа и позволяет использовать преимущества всех этих методов одновременно.

Моделирование латентных нелинейных изменений

Представленная модель латентных изменений для линейного случая легко может быть распространена и на более сложный случай, предполагающий нелинейные изменения одной или (и) совокупности характеристик. Ниже разберем различные примеры.

Простые одномерные модели. Моделируются нелинейные изменения одной характеристики (рис. 5).

Как видно из соответствующей системы уравнений, факторные нагрузки по фактору F 0 , соответствующему константе, одинаковы для всех наблюдаемых характеристик, по фактору F 1 (линейный член) изменяются с каждым следующим шагом на единицу, т. е. пропорционально номеру измерения, по фактору F 2 (квадрат) пропорционально квадрату номера измерения, по фактору F 3 (куб) пропорционально кубу номера измерения и т.д.

Кроме того, в общем случае допускается, что латентные факторы могут быть взаимосвязаны между собой, поэтому последней строчкой добавлено ковариационное соотношение всех факторов между собой. Графически им должны соответствовать двусторонние стрелки, но, чтобы избежать нагромождений, на рис. 5 они опущены.

Число латентных факторов может быть сколь угодно большим. Однако рекомендуется соблюдать принцип разумной простоты. Если модель хорошо удовлетворяет экспериментальным данным полиномом степени n, не имеет смысла рассматривать модель более высокой степени. Факторы F 1 , F 2 , F 3 … задают форму кривой. Если же возникает необходимость смоделировать любую другую нелинейную зависимость j(X) , коэффициенты перед фактором, соответствующим одночленной функции j, должны изменяться как j(n) , а многочленная моделируется как линейная комбинация одночленов.

Моделируются нелинейные изменения нескольких характеристик одновременно. На рис. 6 представлена модель для трех характеристик, каждая из которых изменяется линейно. Однако модель легко может легко быть распространена на случай, во-первых, большего числа наблюдаемых характеристик, а во-вторых, на случай когда они все (или некоторые из них) изменяются нелинейно.

При этом возможны различные взаимосвязи латентных факторов друг с другом.

Ассоциативная модель предполагает, что все латентные факторы могут коррелировать друг с другом (рис. 7). Система уравнений дополняется ковариационными соотношениями всех факторов со всеми.

В модели латентных конструктов латентных изменений предполагается существование факторов второго порядка: общая константа и общая линейность (рис. 8). Для экономии места на рис. 8 верхняя часть модели – зависимость наблюдаемых характеристик от латентных факторов первого порядка – опущена, но она в точности сохраняется.

Поэтому к уравнениям, описывающим модель рис. 6, добавляются следующие уравнения:

В случае когда предполагается, что измеряемые характеристики более тесно связаны друг с другом в каждый момент измерения, используется модель латентных изменений латентных конструктов (рис. 9).

Соответствующая система уравнений имеет вид:

Моделирование детерминаций фактором изменений внешними параметрами. Модели латентных изменений позволяют не только установить детерминацию изменений латентными факторами изменений, но также проверить гипотезы о детерминации этих факторов какими-либо внешними коррелятами: наблюдаемыми характеристиками или факторами, инвариантными в течение всего процесса (рис. 10). Рассмотрим лишь простейший случай – одна переменная, линейные изменения. Однако все рассуждения с равным успехом можно применять в более сложных случаях.

Ковариационное соотношение между факторами, используемое в рис. 3, заменяется детерминационными уравнениями

W – инвариантный параметр. Например, нас интересует, как изменяется со временем (год от года) успеваемость ученика по какому-либо предмету (характеристика Y ), а W – это его пол.

Моделирование дисконтинуальных изменений. Предлагаемая методология может быть использована для анализа процесса, предполагающего разрыв в какой-либо момент времени. Таким образом мы можем проследить и промоделировать не только непрерывные процессы (рис. 11).

Согласно модели в момент времени m произошло качественное изменение параметров. Эти изменения могут быть различны. Например, на обоих этапах характер детерминации сохранился: до момента разрыва и после него изменения носили линейный характер, однако значения факторов линейности и константности значимо отличаются. В терминах графиков ситуация отражена на рис. 12. Возможно также не только изменение значений факторов, но и их число (например, переход от линейных изменений к нелинейным).

Пример использования моделей латентных изменений в конкретном социально-психологическом исследовании

Продемонстрируем применение указанных выше моделей. Данные были получены в ходе масштабного лонгитюдного исследования употребления психоактивных веществ (ПАВ), проводимого в Калифорнийском университете Лос-Анжелеса под руководством П. Бентлера и М. Ньюкомба[3]. 332 испытуемых (94 мужчины и 238 женщин) наблюдались в течение 17 лет с 1976 года по 1993. Было сделано шесть замеров. Возраст респондентов во время проведения каждого из них составлял 12–13, 16–17, 20–21, 24–25, 28–29 и 28–29 лет соответственно. Каждый замер – это широкомасштабный опрос, включавший социально-демографические вопросы, личностные опросники, методики коммуникативного характера, вопросы, связанные с семейной обстановкой, друзьями, исследовалась динамика отношения к психоактивным веществам: частота употребления алкоголя, сигарет и наркотиков. На рис. 13 представлены основные социально-психологические переменные (латентные в овалах, наблюдаемые в прямоугольниках), определенные при первом опросе. В задачу исследования входило выявить характер динамики употребления различных ПАВ с возрастом; влияние социально-демографических и психологических переменных, проявившихся в раннем подростковом возрасте на последующее употребление ПАВ.

На первом этапе анализа данных была построена трехпеременная ассоциативная модель с социально-психологическими и демографическими детерминантами (рис. 14). Статистические показатели модели свидетельствуют о высокой степени соответствия экспериментальным данным.

В задачу данной статьи не входит подробная интерпретация данной схемы, она будет сделана в публикациях, посвященных именно факторам риска и защиты употребления ПАВ, однако здесь мы считаем необходимым кратко проиллюстрировать возможные направления чтения подобных схем.

Во-первых, кривые роста для всех трех видов ПАВ выглядят аналогично: это возрастающие кубические кривые с отрицательным коэффициентом при квадратичном члене. То есть хотя в течение жизни и возможны некоторые спады в употреблении тех или иных ПАВ, доминирующей тенденцией является все-таки рост. Однако главным фактором употребления ПАВ является актуализированность этой привычки в младшем подростковом возрасте. В уравнениях – это константа. И особенно велика она в случаях употребления сигарет и алкоголя. При этом у девочек в этот период тяга к ПАВ проявляется сильнее, чем у мальчиков (константа положительно детерминирована полом). В младшем подростковом возрасте девочки в большей степени социально активны, а употребление ПАВ, по их мнению, способствует повышению их статуса как среди одноклассников, так и среди более взрослых подростков, с которыми они предпочитают проводить досуг. Это и является причиной, что в возрасте 12–13 лет именно девочки более часто употребляют ПАВ, нежели мальчики.

Существенным этот рост на фоне изначальной предрасположенности не является. В более старшем возрасте социальные, да и внутренние установки (молодые женщины в большей степени следят за своим здоровьем) приводят к обратному эффекту: так, например, при употреблении алкоголя линейный коэффициент оказывается выше для респондентов-мужчин.

К факторам риска употребления ПАВ следует отнести стремление к острым ощущениям, к факторам защиты – ориентацию на академическую успеваемость и крепкие семейные связи. Социальная адекватность, являясь фактором защиты на ранних этапах, впоследствии может, трансформировавшись в близкую социально-психологическую диспозицию социальной конформности, оказывать уже неблагоприятное влияние (см. положительную детерминацию линейного коэффициента употребления алкоголя и наркотиков и отрицательную константы во всех трех случаях). Конформный человек может употреблять ПАВ просто за компанию под влиянием сверстников.

Данная схема свидетельствует о наличии общих латентных факторов второго порядка, определяющих характер изменений. То есть тенденции в употреблении всех трех видов ПАВ схожи. Данная схема вполне согласуется с предыдущей (представленной на рис. 14). На ранних подростковых этапах девочки в большей степени склонны употреблять ПАВ, а в дальнейшем в большей степени этому риску подвергаются юноши и молодые мужчины. К факторам защиты от употребления ПАВ однозначно относится ориентация на успешную учебу, социальная адекватность, играя защитную роль, иногда может оказаться и неблагоприятным фактором.

Следующая модель, рассмотренная нами, отражала динамику обобщенной латентной переменной, названной «употребление ПАВ». Непосредственно ее измерить нельзя, она латентная, но именно эта характеристика, по нашему предположению, детерминирует курение, употребление алкоголя и наркотиков, проявляемые непосредственно. Как уже было сказано выше, модель латентных изменений латентных переменных позволяет выявить, как латентная характеристика изменяется во времени, и что является детерминантами процесса. На рис. 16 представлена структурная схема. Согласно модели, которая очень хорошо согласована с экспериментальными данными, можно видеть, что изменения описываются кубической кривой с отрицательным коэффициентом при квадратичном члене. Факторы риска и защиты такие же, как и в предыдущих случаях для отдельных видов ПАВ. Эти факты можно интерпретировать как устойчивость и надежность полученных решений как в этом, так и в двух предыдущих случаях: характер динамики везде один и тот же, факторы риска и защиты употребления ПАВ также сохраняются.

Последняя модель предполагает существование точки разрыва, т. е. наличие момента, в котором анализируемый процесс существенным образом меняет свои характеристики.

В качестве такой точки мы выбрали возраст 20–21 год. С содержательной точки зрения этот выбор обосновывается тем, что в США – это возраст совершеннолетия. Достигнув этого возраста, молодые американцы получают право курить сигареты и употреблять спиртные напитки официально. Мы предположили, что легализация употребления определенных видов ПАВ должна отразиться на показателях процесса. Таким образом, мы выделили два временных промежутка: до и после наступления совершеннолетия, и построили модели линейных латентных изменений с детерминантами. Характер детерминаций подтверждает результаты, полученные на предыдущих моделях. А именно: девочки в большей степени, нежели мальчики, склонны употреблять ПАВ в младшем подростковом возрасте, однако скорость вовлечения в употребление ПАВ у мальчиков выше.

Ориентация на академическую успеваемость во всех случаях является фактором риска.

Фактор стремления к новым ощущениям амбивалентен: его выраженность приводит к тому, что на этапе ранней молодости сразу после наступления совершеннолетия молодые американцы в большей степени склонны употреблять ПАВ, однако затем они, по всей видимости, находят иные способы удовлетворения этой потребности (спорт, экстремальная деятельность, путешествия) и тем самым ослабляют употребление ПАВ.

Социальная адекватность на первом этапе амбивалентна, а на втором однозначно является фактором защиты.

В заключение отметим, что модели латентных изменений дают богатый материал для интерпретаций и безусловно должны соотноситься с содержательной областью. То есть выбор окончательной модели должен быть сделан психологом исходя из теоретических соображений, а статистические показатели могут играть лишь вспомогательную роль. Рассмотренный пример конкретного эмпирического исследования, со статистической точки зрения, допускает принятие любой из приведенных моделей. Чтобы ответить на вопрос об окончательном выборе той или иной модели, необходимы теоретические соображения, связанные с изучением употребления ПАВ, факторами риска и защиты этого употребления. Вполне возможно, что в определенных случаях могут быть использованы различные модели, так как они не противоречат, а дополняют друг друга. Но это тема другой статьи.

[2] Если Y – латентная переменная, то вместо EY в формуле остаточный член будет обозначен DY.

[3] Автор выражает им свою признательность за предоставленные данные и многочисленные консультации.

Содержание

ПРИМЕНЕНИЕ СТАТИСТИЧЕСКОГО МЕТОДА МОДЕЛИРОВАНИЯ С ПОМОЩЬЮ ЛИНЕЙНЫХ СТРУКТУРНЫХ УРАВНЕНИЙ В ПСИХОЛОГИИ: ЗА И ПРОТИВ.
Уравнения структурного моделирования Текст научной статьи по специальности « Компьютерные и информационные науки»
Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ожерельева Татьяна Алексеевна
Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Ожерельева Татьяна Алексеевна
Structural Equation Modeling
Текст научной работы на тему «Уравнения структурного моделирования»

ПРИМЕНЕНИЕ СТАТИСТИЧЕСКОГО МЕТОДА МОДЕЛИРОВАНИЯ С ПОМОЩЬЮ ЛИНЕЙНЫХ СТРУКТУРНЫХ УРАВНЕНИЙ В ПСИХОЛОГИИ: ЗА И ПРОТИВ.

ПРИМЕНЕНИЕ СТАТИСТИЧЕСКОГО МЕТОДА МОДЕЛИРОВАНИЯ С ПОМОЩЬЮ ЛИНЕЙНЫХ СТРУКТУРНЫХ УРАВНЕНИЙ В ПСИХОЛОГИИ: ЗА И ПРОТИВ.

Что определяет судьбу нового метода в науке? По крайней мере несколько обстоятельств влияют на принятие научной общественностью нового способа анализа данных [18]. Первое связано с тем, благоприятствует ли теоретический и методологический дух времени методической инновации, то есть вызывает ли теоретическое обоснование нового метода интерес в профессиональных кругах, соответствуют ли инструментальные стратегии, на которых базируется » метод, принятым научным стандартам и т. д. Второе обстоятельство определяется концептуальной и функциональной доступностью нового метода анализа. Насколько понятен и легок в употреблении предлагаемый

метод, какого рода знания требуются для его использования, какого рода техническое оборудование необходимо, и, наконец, сможет ли средний студент, обучающийся соответствующей профессии, применять этот метод? Ответы на эти вопросы зависят от теоретической и технической сложности предлагаемого метода, а также от определяемых им затрат компьютерного времени и профессионального труда. И, наконец, третий фактор, вероятно, наиболее важный, связан с тем, насколько перспективен данный метод для развития науки. Перспективность метода — понятие многогранное. Сюда входит как проза научной работы, например, уточнение и проверка достоверности ранее сформулированных гипотез, проверка надежности и валидности тестов, так и ее поэтика, например, тестирование новых теорий. Каждый из трех вышеназванных факторов, определяющих принятие нового метода анализа в науке, напрямую детерминирует будущее моделирование с помощью линейных структурных уравнений в психологии. В настоящей публикации описываются основные понятия, связанные со структурным моделированием.

Статистический метод моделирования с помощью линейных структурных уравнений (МЛСУ), описывающих латентные переменные, а также его разновидность — конфирматорный факторный анализ (КФА) были разработаны на основе техники статистического анализа множественных переменных, используемых биологами, экономистами, психологами и социологами. МЛСУ предполагает формулирование набора гипотез о влиянии одних переменных, например, причинных и контрольных, на другие переменные. Соответствие подобного набора гипотез (теоретической модели) и реальных данных, собранных при работе с конкретной выборкой (эмпирической модели), формализуется с помощью статистического алгоритма, оценивающего степень согласования или меру соответствия. Таким образом, МЛСУ позволяет тестировать причинные гипотезы на основе корреляционных данных. Вследствие широкого применения неэкспериментальных схем исследования в науках о человеке, МЛСУ и КФА часто используются в психологии, социологии и экономике. К удивлению, вышеназванные статистические методы не столь популярны в биологии, несмотря на то, что в рамках именно этой науки идеи МЛСУ впервые были сформулированы С. Райтом [38]. История возникновения и этапы детальной разработки МЛСУ описаны П. Бентлером [5], а работы К. Боллена [13] и П. Бентлера [7] содержат современное техническое описание МЛСУ, поэтому эти вопросы не будут обсуждаться в предлагаемой вниманию читателей статье. Задачей данного текста является ознакомление читателей с основными понятиями и типами моделей, используемыми в рамках МЛСУ, а также обсуждение «за » и «против » применения этого сложного статистического инструмента.

Несмотря на то, что статистические методы анализа множественных переменных были описаны и, соответственно, доступны для использования с начала века, в течение долгого времени эти методы применялись скорее для решения исследовательских задач открытого типа (не направленных на тестирование заранее сформулированных причинноследственных гипотез), чем для проверки причинноследственных предположений. В течение последних 10-15 лет, однако, ситуация изменилась, и МЛСУ стал рассматриваться как метод наиболее адекватный для тестирования причинноследственных предположений по сравнению с приемами, исторически используемыми для решения подобных задач. Чем же МЛСУ столь привлекателен для исследователей? Согласно Дж. Мартину [30], основное преимущество структурного моделирования по сравнению с использованием ряда более традиционных моделей (например, [19]) заключается

в том, что МЛСУ позволяет исследователю включить в модель гипотезы, касающиеся ошибок измерения и их влияний на отношения между переменными, тестируемыми с помощью множественных регрессий.

МЛСУ и КФА особенно привлекательны при осуществлении статистического анализа данных в ситуациях, когда исследователь взаимодействует с большим количеством переменных, интеркорреляции которых известны, и в его задачи входит суммирование этих переменных, определение степеней родства между ними, оценка качества измерительных инструментов, контроль ошибки измерения как для каждой из измеряемых (актуальных) переменных, так и для латентных, неизмеряемых переменных, и, наконец, нахождение соответствия между измеряемыми и латентными структурами. Правомерно будет сказать, что в ситуациях, когда набор переменных неточно измеряет латентную структуру или конструкт, являющийся предметом интереса исследователя, т. е. практически в любом случае, когда больше чем одна наблюдаемая переменная используется для представления латентной структуры, МЛСУ с латентными переменными следует применять как наиболее адекватный метод статистического анализа. Учитывая то обстоятельство, что в психологии большинство латентных структур измеряется посредством не одной, а нескольких актуальных переменных, т. е. не может быть представлено без ошибки измерения, возможность и необходимость применения МЛСУ в психологии становится очевидной.

Полезность применения МЛСУ была продемонстрирована в различных областях психологии. Примеры использования этого статистического метода могут быть найдены в большинстве западных психологических журналов [6], [18], [26].

Несмотря на то, что в кулуарных разговорах МЛСУ часто называют методом «моделирования причинноследственных отношений «, хотелось бы подчеркнуть, что причинноследственные закономерности формулируются и вносятся в модель исследователем в момент ее создания, т. е. эти каузальные отношения существуют только в представлении автора модели и предопределяются теорией, последователем которой является исследователь. Наличие причинноследственных отношений между переменными не может быть доказано путем моделирования структур ковариационных матриц [3], [16]. МЛСУ позволяет оценивать степень соответствия теоретических причинноследственных гипотез эмпирическим данным. Если степень соответствия такова, что различия между двумя моделями (теоретической и эмпирической) а) статистически отличимы от нуля (статистически значимы), то причинноследственные гипотезы могут быть отвергнуты; б) статистически неотличимы от нуля (незначимы), то причинноследственные гипотезы не могут быть как отвергнуты, так и «доказаны » в рамках МЛСУ. На практике, построенные теоретические модели нередко оказываются неадекватными эмпирическим данным; использование МЛСУ в различных областях психологии часто приводит, однако, к находкам, которые, в свою очередь, помогают усовершенствовать теорию в направлении улучшения ее соответствия реальным данным.

Предваряя анализ основных понятий МЛСУ, хотелось бы отметить, что, как и любой другой статистический подход, моделирование с помощью структурных линейных уравнений не избежало как критики со стороны, так и внутренних противоречий. Спонтанно выделилось несколько основных проблемных моментов, вокруг которых разыгрываются горячие споры критиков и защитников МЛСУ. Одно из направлений критики связано с вопросами статистических характеристик МЛСУ и ситуаций, в которых использование МЛСУ было бы ошибочно [20]. Д. Фридмен обеспокоен беспечностью, с которой регрессионные модели, включая МЛСУ, используются в психологии, и подчеркивает необходимость

внимательного отношения к основным статистическим допущениям, лежащим в основе этих моделей. Исследователь, использующий МЛСУ, должен отдавать себе отчет в том, что достоверность гипотез может быть протестирована с помощью этого метода, но ни в коем случае не может быть доказана. Тем не менее, если причинноследственная теория соответствует эмпирическим данным, то теория может считаться подтвержденной в том смысле, что она не опровергнута эмпирией. Как подчеркивает Д. Френсис, «МЛСУ разрешает устанавливать причинно следственные влияния путем предположения существования сети причин и следствий среди переменных, и детерминировать степень, с которой переменные должны быть связаны друг с другом, если такая сеть существует в действительности » [21; 625].

Структура обзора, предложенного вниманию читателя, такова: вначале следует краткое описание статистических основ МЛСУ и основных понятий, употребляемых в рамках структурного моделирования; затем — анализ последовательности шагов в осуществлении моделирования и «несбалансированное «[1] иллюстрирование основных типов моделей; и, наконец, обсуждение «за » и «против «, связанных с использованием этого метода.

СТАТИСТИЧЕСКИЕ ОСНОВЫ МОДЕЛИРОВАНИЯ С ПОМОЩЬЮ СТРУКТУРНЫХ УРАВНЕНИЙ

Моделирование с помощью структурных уравнений представляет собой метод, родственный методу систем регрессионных уравнений, используемому при формулировании, детализации и тестировании теории или гипотезы. Эти уравнения соотносятся зависимые переменные и набор детерминирующих переменных, которые, в свою очередь, могут выступать в роли зависимых переменных в других уравнениях. Подобные линейные уравнения в совокупности с уравнениями, детализирующими компоненты дисперсии и ковариации независимых переменных, составляют структурную модель. Составление и запись уравнений, детализирующих компоненты дисперсии и ковариации независимых переменных, осуществляется с помощью матричной алгебры.

В матричной алгебре и контексте ковариационного структурного анализа буквой å обозначается популяционная матрица ковариацией и буквой — вектор основных параметров, включающих регрессионные коэффициенты, дисперсии и ковариации независимых переменных. В контексте более общих структурных моделей средние зависимых переменных также являются функцией основных параметров, и к вышеназванному списку добавляются средние латентных переменных, а также a коэффициенты (сдвиг регрессионных прямых по ординате) регрессионных уравнений, описывающих взаимосвязи зависимых и независимых переменных. При условии, что вектор неизвестных параметров ( ) принимает параметрические значения, популяционные вектор средних m и матрица ковариации å могут быть записаны как m=m( ) и å=å( ). Это и есть структурная гипотеза, которую надлежит проверить. На практике, вектор эмпирических (полученных на основе анализа реальной выборки испытуемых) средних Х и ковариационная матрица S используются при оценке неизвестных параметров вектора q. Если =m( ) и сходны с и S, то модель, включающая анализируемые линейные структурные уравнения, достоверно описывает эмпирические данные. Если же матрицы, построенные на основе

модели и подсчитанные на основе эмпирического исследования несходны, модель должна быть отвергнута. Заметим еще раз, что во многих моделях средние не структурированы как m(q) = и только структура ковариационной матрицы S представляет интерес для исследователя. Класс этих более частных моделей называется ковариационными структурными моделями. Подклассом такого рода моделей, включающим латентные факторы, является, например, конфирматорный факторный анализ.

Статистической основой МЛСУ является асимптотическая статистическая теория, подразумевающая, что оценка и тестирование моделей осуществляется при наличии относительно больших по численности выборок испытуемых. Поскольку использование МЛСУ требует больших затрат компьютерного времени, пользователи при тестировании моделей предпочитают использовать стандартные статистические пакеты типа LISREL [25], EQS [7] и Мх. Чаще всего предпочтение отдается EQS в связи с «дружелюбной натурой » этого пакета — от пользователя вовсе не требуется знание матричной алгебры в момент перевода теоретической модели на язык компьютера. LISREL и Мх предъявляют к пользователям существенно более строгие требования: первым шагом на пути использования этих пакетов должно стать ознакомление с азами матричной алгебры[2]. Все эти пакеты, несмотря на различия в деталях, основаны на одних и тех же общих математических и статистических подходах, применяемых к анализу систем линейных структурных уравнений. Математическая модель относится к классу ковариационных структурных моделей, включающих как множественную регрессию, анализ путей, одновременный анализ уравнений, конфирматорный факторный анализ, так и анализ структурных отношений между латентными переменными. Согласно модели Бентлера-Викса [12], параметры любой линейной структурной модели представляют собой регрессионные коэффициенты, дисперсии и ковариации независимых переменных. Статистическая теория позволяет оценивание этих параметров с использованием мультифакторной нормальной теории, а также более общих эллиптической и арбитрального распределения теорий, основываясь на обобщенном методе наименьших квадратов или теории минимального cквадрат.

Как было упомянуто выше, дисперсии и ковариации, полученные на основе эмпирических данных, сравниваются с гипотетической моделью. Степень, с которой гипотетическая модель S( ) воспроизводит эмпирически найденные отношения между переменными, отражающиеся в матрице S, определяет меру соответствия модели. Обычно мера соответствия определяется с помощью распределения cквадрат с количеством степеней свободы (df), подсчитывающимися на основе разницы между количеством элементов в матрице S (или S и X) и количеством свободных параметров, оценивающихся в . Если значение cквадрат, соответствующее определенному количеству степеней свободы, меньше табличного, то модель воспроизводит эмпирические данные удовлетворительно, т. е. S( ) близка к S. Если же значение cквадрат больше табличного, и все допущения, сделанные в ходе моделирования, соблюдены (например, допущение о независимости измерений), то нулевая гипотеза S=S( ) отвергается. Обычно значение cквадрат рассматривается как результирующая функция в точке ее минимума, умножен на величину выборки. В результате, теоретически, при работе с большими выборками, нулевая гипотеза S=S( ) может оказаться отвергнута только в результате высокой мощности анализа. На практике, поскольку cквадрат чувствителен к размеру выборки, модели с большим количеством испытуемых не соответствуют эмпирическим данным до желаемой

степени даже при тривиальных различиях между S и [2], [12], [29]. Поэтому среди исследователей принято подсчитывать некоторые дополнительные индексы меры соответствия теоретической и эмпирической моделей. К. Боллен в своей книге [13] упоминает несколько таких индексов, в число которых входит критерий Акайке [1], корень остатков квадратов средних, и т. д. В EQS автоматически подсчитываются нормированная мера соответствия, ненормированная мера соответствия и индекс сравнения [8]. Все эти индексы предоставляют дополнительную информацию относительно степени соответствия двух моделей, поскольку они отражают способность теоретической модели «объяснить » эмпирические ковариации.

Не менее важна в структурном моделировании и проверка специальных гипотез о тех или иных параметрах, входящих в модель. Тестирование подобного рода гипотез осуществляется с помощью хорошо известных r и zтестов. Например, тест гипотезы о том, что в популяции равняется 0, может быть осуществлен посредством использования мономерных нормальных zтестов нулевых гипотез, применяемых для больших выборок. Zкоэффициент представляет собой дробь, в числителе которой находится оценка одного из параметров структурных коэффициентов, а в знаменателе — оценка стандартной ошибки, с которой этот параметр оценен. Этот тест и подобные многомерные тесты встроены практически во все стандартные пакеты МЛСУ.

Латентными переменными называются скрытые, не измеряемые напрямую конструкты, которые могут быть представлены посредством двух или более реально измеряемых (далее в тексте — актуальных) переменных. Основная идея концепции взаимоотношений латентных и актуальных переменных заключается в том, что актуальные переменные коррелируют только до той степени, до которой они пересекаются, описывая скрытую латентную переменную, то есть предполагается, что «вычерчивание » латентной переменной (отсечение от нее частей, представленных через обозреваемые переменные), сведет корреляцию между актуальными переменными к нулю. Как упоминалось выше, латентные переменные не могут быть измерены напрямую, актуальные переменные выступают в роли представителей, индикаторов скрытых конструктов, представляющих теоретический интерес. Уравнения, записанные в контексте моделей с латентными переменными, позволяют выражать актуальные переменные в терминах латентных конструктов. Последние не могут быть представлены как линейные комбинации актуальных переменных, так как количество измерений пространства латентных переменных превышает количество измерений пространства актуальных переменных [4].

Факт существования латентных переменных обычно устанавливается через конфирматорный факторный анализ (КФА). КФА показывает, насколько хорошо актуальные переменные служат в роли предполагаемых представителей одной или нескольких латентных переменных. Главное различие между КФА и хорошо известным эксплораторным факторным анализом (ЭФА) заключается в том, что в КФА наличие факторов и их структура предполагается заранее, до осуществления самого анализа. В эксплораторном факторном анализе исследователь старается определить, сколько и каких факторов необходимо для возможно более полного объяснения корреляций, наблюдаемых между актуальными переменными. Подход к факторному анализу в рамках моделирования с помощью структурных уравнений характерен тем, что подразумевает априорное формулирование гипотез относительно 1) количества латентных переменных или факторов; 2) актуальных переменных, являющихся измерителями латентных переменных или факторов. В дополнение, и это не менее важно, чем высказанное, формулируется гипотеза о том, что

факторные нагрузки определенных латентных переменных на определенные актуальные переменные равны нулю. Тесты с использованием распределения cквадрат и различные индексы меры соответствия, упомянутые выше, определяют достоверность сформулированных гипотез.

В КФА латентные переменные могут коррелировать или не коррелировать друг с другом, но никогда не регрессируются на другие (латентные или актуальные) переменные. Более общие по своей природе модели, построенные на основе структурных уравнений, позволяют учитывать структуру взаимоотношений между латентными переменными. В рамках этого подхода могут быть сделаны предположения не только о структуре корреляции, но и о природе и направлении влияний одной латентной переменной на другую, т. е. в модель могут быть включены отношения причинноследственного характера. Подобные гипотезы проверяются посредством хорошо уже нам знакомых тестов с использованием распределения cквадрат и различных индексов меры соответствия, а отдельные регрессионные пути тестируются с помощью тестов значимости, упомянутых в предыдущем параграфе.

Наиболее полезным с практической точки зрения свойством МЛСУ является то, что этот метод позволяет осуществлять перебор и сравнение между собой разнообразных «соревнующихся » моделей. Эта черта стимулирует исследователя расширять круг сравниваемых моделей, памятуя тот факт, что какаято из непротестированных еще моделей может соответствовать эмпирическим данным в большей степени, чем модель, находящаяся в работе. Кроме того, уверенность исследователя в том, что модель с лучшей мерой соответствия является искомой и желаемой, зависит от того, были ли протестированы другие теоретически возможные альтернативные модели [27].

Существует несколько способов перебора моделей. Один из них заключается в том, что осуществляется сравнение значений cквадрат, полученных для каждой из моделей. Если величиной cквадрат, подсчитанной для каждой модели отдельно, измеряется степень соответствия между теоретической моделью и эмпирическими данными, то разница, полученная простым вычитанием значений, подсчитанных для двух разных моделей, распределенная по cквадрат и называемая инкрементным cквадрат, может служить мерой сравнения двух моделей. Важно помнить, что этот метод может быть использован только при сравнении иерархических или гнездовых моделей. Количество степеней свободы при подобного рода сравнении определяется разницей между степенями свободы двух анализируемых моделей. Два исхода возможны в результате такого сравнения: 1) инкрементный cквадрат является значимым и предпочтение отдается одной из моделей или 2) инкрементный cквадрат является статистически незначимым и выбор в пользу одной из моделей оказывается неосуществим. Во втором случае в игру вступает «принцип бережливости » [9], [11], т. е. предпочтение отдается наиболее простой и экономичной модели.

Другой популярный способ сравнения моделей использует множественные выборки. Часто эмпирические данные собираются в разных выборках, например, среди людей разного пола, возраста, разной национальной или групповой принадлежности. Теоретически исследователь может предположить, что имеющиеся группы были отобраны не из одной, а из разных популяций. Два типа полярных гипотез формулируются при подобного рода сравнении: 1) матрицы средних и ковариаций, подсчитанные в этих группах, должны полностью отличаться и быть не связаны друг с другом (т. е. выборки были отобраны из разных гетерогенных популяций); или 2) эмпирические матрицы средних и ковариаций должны совпадать (эта гипотеза подразумевает,

что выборки были отобраны из одной гомогенной популяции). Промежуточные гипотезы относительно степени совпадения или расхождения матриц средних и ковариций могут быть протестированы посредством осуществления одновременного анализа, позволяющего проверить, с какой точностью каждая из моделей воспроизводит эмпирические данные, полученные для каждой из анализируемых выборок. Как обычно, тесты, использующие распределение cквадрат, могут быть использованы для оценки адекватности проверяемых моделей. На практике, исследователь обычно начинает анализ с набора относительно неограниченных моделей, т. е. моделей с большим числом оцениваемых, нефиксированных параметров, а затем постепенно фиксирует (приравнивает друг к другу) параметры в разных группах. Рекомендуемый порядок ограничения количества свободных параметров в модели подробно обсуждался рядом авторов (например, [7]).

ЭТАПЫ ПРОЦЕССА МОДЕЛИРОВАНИЯ

Моделируя, исследователи обычно следуют схеме, описанной ниже [10].

1. Рисуется «диаграмма путей «, включающая все переменные, входящие в состав моделируемой причинноследственной системы. Переменные, не являющиеся результатом влияния других переменных, включенных в диаграмму, называются независимыми. Переменные, представляющие собой результат действия других переменных, называются зависимыми. В диаграммах путей актуальные (измеряемые) переменные изображаются квадратами, а латентные — овалами или кругами. Двунаправленные стрелки используются для обозначений корреляций и ковариаций независимых переменных. Однонаправленные стрелки, часто называемые коэффициентами путей, представляют влияния одних переменных на другие. Направление стрелок соответствует направлению влияний.

Рис. 1. Схематическое изображение типов соотношений латентных (Y) и актуальных (х) переменных.

Актуальные переменные x1 и х4 являются индикаторами латентной переменной Y1, причем x1 и х4 коррелируют, поскольку они перекрывают друг друга в своих описаниях Y1. Если, однако, путем парциальной регрессии или частной корреляции исключить сферу пересечения x1 и Х4 из анализа, то корреляция между этими переменными сведется к нулю. Переменная x2 является индикатором двух латентных переменных, Yi и Y2, т. е. входит в структуру как фактора, описывающего Y1, так и фактора, описывающего Y2. И, наконец, переменная х3 представляет переменную Y2. Ни одна из актуальных переменных не описывает латентные конструкты точно; все х включают в себя что-то еще (случайную ошибку измерения, ошибку метода, и так далее), что «загрязняет » чистоту отражения латентных переменных.

2. Диаграммы переводятся на язык уравнений множественных регрессий. При этом записывается столько уравнений, сколько модель содержит в себе переменных, требующих объяснения, т. е. количество уравнений соответствует количеству зависимых переменных.

3. Системы уравнений подвергаются статистическому анализу при помощи статистических пакетов типа LISREL, Мх или EQS. Задачей такого рода анализа является проверка соответствия модели, сформулированной посредством системы уравнений, и эмпирических данных. Коэффициенты путей, являющиеся стандартизированными парциальными регрессионными коэффициентами, показывают степень влияния причинных переменных на следственные.

4. Адекватность модели определяется посредством как статистических, так и нестатистических средств.

5. Осуществляется перебор моделей на данных одной и той же выборки. Одним из способов подобного перебора является сравнение иерархических, гнездовых моделей путем подсчета инкрементных

тестов с использованием распределения cквадрат.

НЕКОТОРЫЕ ТИПЫ МОДЕЛЕЙ, УПОТРЕБЛЯЕМЫЕ В МЛСУ

Измерительные модели, позволяющие оценивать надежность и валидность психологических инструментов.

Измерительная модель в КФА. Надежность и валидность инструментария, используемого в психологии, представляют собой предмет постоянной заботы профессиональных психологов. Достаточно часто исследователям приходится иметь дело с набором различных показателей, каждый из которых в той или иной мере «заражен » ошибкой измерения. Поскольку латентные переменные являются свободными от ошибок измерения показателями глубинных процессов или структур, они часто рассматриваются как индикаторы, способные как суммировать, так и представлять различные переменные в случае присутствия некоей общей дисперсии между ними. Эти латентные переменные могут быть как причинами, так и следствиями или ковариациями других гипотетических конструктов.

Как КФА, так и более общий метод анализа путей, включающий латентные переменные, позволяют оценивать конструктную, конвергентную и дискриминантную валидность. В моделях, имеющих дело с латентными переменными, весьма нежелательные ошибки измерения, являющиеся компонентами актуальных переменных, могут быть представлены посредством специальных терминов и, тем самым, привносимая ими дисперсия будет исключена из определений латентных переменных и смоделирована отдельно. Что же по поводу тех моделей, спросит читатель, разработанных в контексте анализа путей, которые включают в себя только актуальные переменные, выступающие в ролях как предсказывающих, так и результирующих факторов? В подобных моделях актуальные переменные скрывают в себе ошибку измерения, отдифференцировать которую невозможно, что ведет к искаженным оценкам других параметров модели. Одна из главных причин популярности моделей, включающих латентные переменные, в том и заключается, что такого рода моделирование позволяет отделить дисперсию ошибки и тем самым смоделировать «совершенное «, безошибочное измерение скрытых процессов так, что относительная величина влияния латентной переменной на актуальную будет отражением того, насколько актуальная переменная действительно » является индикатором глубинной структуры, а не результатом искажающих влияний ошибки измерения.

Несмотря на то, что каждое конкретное измерение содержит в себе ошибку, измерительная модель в том варианте, в котором она формулируется и тестируется в рамках КФА, строится на основе анализа паттерна корреляций актуальных переменных. Использование множественных индикаторов для каждого латентного конструкта позволяет при анализе ковариаций актуальных переменных представить степень, с которой каждая из этих переменных отражает латентную переменную. Остаточная же дисперсия, неучтенная латентными факторами, состоит из случайных и специфичных компонентов ошибки.

Параметры измерительной модели описывают измерительные достоинства актуальных переменных, на основании которых, в свою очередь, может быть подсчитана внутренняя согласованность, являющаяся одним из видов надежности измерения [25]. В рамках LISREL надежность актуальных переменных представляется в виде квадратов множественных корреляций этих переменных с латентным конструктором[3]. В EQS оценка надежности осуществляется путем вычитания квадратов коэффициентов ошибок измерения

каждой из актуальных переменных из 1 при подсчете стандартного решения. Эти оценки, в зависимости от дизайна исследования, могут как являться, так и не являться подходящими индексами надежности. Поскольку эти индексы в рамках КФА будут учитывать специфичность теста в качестве дисперсии ошибки, эти индексы могут выступать в роли оценок надежности только в том случае, когда дизайн позволяет суммировать всю специфическую дисперсию в рамках общего факторного пространства. Это может быть сделано, например, с панельными данными (см. ниже).

КФА может быть полезен для разработки валидного и надежного психологического инструментария, например, психометрических тестов. Применимость этого подхода также была показана в рамках клинической работы при разработке инструментов, оценивающих страх и тревожность [17], [33]. Особенно настойчиво исследователи [33] подчеркивают возможность и необходимость использования КФА, позволяющего тестировать гипотезы и валидизировать теории, в контексте клинической психологии, отличающейся наличием большого количества опросников, тестов и методик с привлекательными названиями, но низкой конструктной валидностью (иными словами, измеряющими что-то иное вместо того, что заявлено в названии методики). Р. Моррис и коллеги иллюстрируют свое утверждение примером исследования связей страхов и соматических жалоб у детей школьного возраста и показывают, что практики могут с большим доверием относиться к результатам, полученным при использовании КФА, по сравнению с традиционными факторными процедурами. В дополнение они говорят о преимуществах разработки модели в преддверии непосредственного сбора материала и советуют избегать «случайного » сбора материала, т. е. использования неаргументированного набора методик при отсутствии четкой теоретической модели.

К. Йореског [23] описал примеры моделей КФА, позволяющих оценивать уровень психометрического соответствия тестов на основе классификации (параллельные, тауэквивалентные и однородные или конергические), разработанной в классической теории тестов [28]. Используя гнездовые модели, исследователь может протестировать серию изменяющихся по степени строгости (начиная с модели с наибольшим числом свободных параметров и кончая моделью с наименьшим числом свободных, т. е. с большим числом фиксированных параметров) гипотез, касающихся психометрических достоинств тестов, путем приравнивания различных параметров моделей друг к другу. Например, модель параллельных тестов требует выполнения допущений о равенстве друг другу как факторных нагрузок, так и дисперсии ошибки, в то время как тауэквивалентная модель подразумевает равенство только факторных нагрузок. Д. Френсис разработал усложненный вариант описанной выше модели [21]. В его интерпретации модель позволяет тестировать степень эквивалентности различных нейропсихологических тестов в разных популяциях и на разных возрастных этапах. Р. Миллсап и Г. Эверсон [32] представили класс измерительных моделей в рамках КФА, в которых в анализ включаются не только ковариационные матрицы, но и матрицы средних актуальных переменных.

Заканчивая этот параграф, еще раз предостережем читателей от возможной ошибки. В то время как КФА, как было показано выше, позволяет формулировать и тестировать различные предположения, ведущие к оценке надежности измерений, эти самые оценки не будут иметь никакого смысла, если модель, на основании которой это оценивание было произведено, не соответствует характеристикам эмпирических данных. Итак, первое — оценка характеристик эмпирических данных, проверка моментов распределения и убеждение в том, что эмпирические данные пригодны для использования МЛСУ; затем — создание адекватных моделей и их статистическое сравнение; и лишь затем

Лонгитюдные модели со множественными индикаторами. В дополнение к теоретическим преимуществам, возникающим при использовании латентных переменных, а не измеряемых с ошибками единичных актуальных переменных, которые, как надеется автор, стали теперь очевидны читателю. МЛСУ также предоставляет некоторые статистические возможности, появляющиеся при работе с множественными индикаторами теоретических конструктов и позволяющими получить информацию относительно стабильности и надежности измерений в разные моменты времени. Напомним, что одномерные (с одной переменной) лонгитюдные модели не позволяют оценить возможное влияние коррелирующих ошибок измерения [37]. Примером лонгитюдных моделей с множественными индикаторами может являться модель развития интеллекта, где измерения осуществляются посредством нескольких актуальных переменных (например, вербального и невербального IQ) в разные моменты времени (например, 6, 8 и 10 лет).

Кроме того, как было упомянуто выше, при сборе кросссекциональных данных и использовании обычного КФА, разделение специфической дисперсии и дисперсии ошибки становится невозможным. Замечательное обсуждение этого вопроса было сделано в работе Р. Миллсапа и Г. Эверсона [32; 487]. Одним из способов выделения различных компонентов остаточной дисперсии является использование лонгитюдных (панельных) КФА моделей. Панельными данными называют результаты работы с крайне похожими между собой или идентичными инструментами, используемыми в одной и той же выборке испытуемых по крайней мере два (или больше) раза в несовпадающие моменты времени. Внимание привлекалось к тому факту [37], что оценивание надежности совершенно необходимо при осуществлении моделирования панельных данных.

Если тестспецифичная ошибка измерения рассматривается как случайная ошибка, надежность отдельных пунктов теста недооценивается. Однако при использовании МЛСУ становится возможным разложение дисперсии на специфичные и случайные ошибки измерения [35]. Например, тестспецифичная ошибка в измерении любого индикатора латентной переменной в исходных данных может быть смоделирована как коррелирующая с измерением того же индикатора в другой момент времени[4]. КФА позволяет исследователю эксплицитно моделировать эти тестспецифичные коррелирующие ошибки с целью получения оценки ошибки измерения, свойственной для использованного метода. Таким образом, могут быть оценены как случайная, так и специфичная ошибка измерения.

К. Йореског проанализировал пример разделения тестспецифичной и ситуационноспецифичной дисперсий для модели с шестью переменными, которые измерялись в четыре различных временных момента [23]. Панельные данные, проанализированные в этой работе, были получены из большого исследования процесса взросления, где измерения осуществлялись по результатам тестов способности и успешности в 5, 7, 9 и 11 классах. К. Йореског предложил для каждого временного среза двухфакторное решение с двумя коррелирующими общими факторами — факторами вербальных и количественных способностей. Степень соответствия модели заметно улучшилась, когда к факторам способностей были добавлены тестспецифичные факторы, сквозные для всех временных моментов — по одному фактору для каждого из тестов. Оценивая компоненты дисперсии, автор обнаружил, что факторы способностей объясняют значимо большую долю изменчивости, в то время как тестспецифичные дисперсии были

Модель множественных признаков и множественных методов. Лонгитюдные панельные модели, упомянутые в предыдущем разделе, являются частным случаем более общего подхода, позволяющего оценивать дискриминантную, конвергентную и конструктную валидность. Этот подход обычно называют моделированием множественных признаков и множественных методов (МПММ) [15]. Смысл МПММ заключается в том, что несколько различных признаков измеряется посредством нескольких инструментов или методов. Этот подход употребляется для определения истинных отношений среди признаков при наличии как дисперсии метода, так и случайной ошибки. Метод КФА был назван предпочтительным при работе с МПММ данными [17]. В ситуациях, когда дисперсии как признака, так и метода учитываются при планировании эксперимента, КФА может подтвердить существование факторов признаков и методов [23], [24]. Также используя КФА, исследователь может учесть коррелирующие ошибки. В нескольких работах обсуждались различные парадигмы и ограничения КФА МПММ моделей, позволяющих оценивать как конвергентную и дискриминантную валидность, так и искажения, вызываемые различными методами. Г. Марш утверждает, что в ситуации, когда факторы методов не могут быть четко определены, предпочтительнее не моделировать эти факторы как независимые, а рассматривать их как коррелирующие ошибки измерения [29].

Рис. 2 представляет собой схематическое представление гипотетической МПММ модели, тестирующей конвергентную и дискриминантную валидность десяти измерений трех признаков: тревожности, депрессии и гневливости [11]. Три фактора методов также присутствуют в модели: самоотчет, родительская и учительская оценки. Дискриминантная валидность может быть оценена путем анализа величины корреляций между факторами признаков.

Очевидно, что исследователю следует ожидать какуюто степень корреляции между различными психологическими состояниями (неортогональность факторов); слишком большие корреляции, однако, будут свидетельствовать против способности тестов определять разные состояния. Конвергентная валидность может быть оценена при анализе нагрузок каждого из тестов на факторы признаков. Факторы методов объясняют разделенную дисперсию, возникающую за счет схожих методических характеристик разных тестов.

Д. Коул проанализировал несколько примеров использования полного и неполного МПММ дизайнов в клинических исследованиях [17]. Он показал, реанализируя результаты, полученные другими авторами, что его находки в основном подтвердили исходные модели и предоставили большое количество ценных второстепенных заключений. Одним из наиболее интересных и полных примеров, разработанных Коулом, является его переоценка данных из исследования по валидизации детских тестов гневливости и депрессии. Эти два конструкта были измерены при использовании 8 инструментов, причем среди методов были самоотчет, оценивание одноклассниками и учителями и ранжирование учителями. Модель, включающая два коррелирующих фактора признаков и три коррелирующих фактора методов (самоотчет, оценивание и ранжирование), была найдена лучшей среди перебранных моделей. Тот факт, что гневливость и депрессия не показали значимых корреляций, был проинтерпретирован как свидетельство дискриминантной валидности тестов. Конвергентная валидность была продемонстрирована частично, поскольку, несмотря на то, что большинство индивидуальных измерений показали значимые ассоциации с соответствующими факторами признаков, одна из ассоциаций была значительно меньше, чем другие, а другая имела противоположный знак.

Разрабатывая технику использования концепции МПММ, Дж. Дж. Стейн,

Рис. 2. Схематическое представление МПММ КФА модели. Актуальные переменные представлены прямоугольниками, латентные переменные — овалами. В модель входят три фактора признаков (тревожность, депрессия и гневливость) и три фактора методов (родительская и учитель екая оценки и самоотчет). Остаточные ошибки на диаграмме не показаны.

М. Ньюкомб и П. Бентлер выделили среди моделируемых латентных измерений частоту, количество использования наркотических и опьяняющих веществ (НОВ), субъективное восприятие степени использования НОВ, интенсивность нарушения различных типов деятельности, вызванных НОВ, и употребление специфических НОВ. Факторы, описывающие употребление специфических НОВ, рассматривались как аналоги методических факторов, а более общие факторы использования НОВ — как факторы черт. Другие примеры использования МПММ КФА приемов включают оценку валидности самоотчета об употреблении алкоголя и других НОВ путем разделения четырех методов сбора данных и выделение факторов поддержки ровесников и семьи, оцениваемых тестами одиночества, социальной поддержки и социальной материальной помощи [34].

Одной из главных проблем при использовании МЛСУ для оценивания надежности и валидности является игнорирование статистических и теоретических допущений, лежащих в основе этого метода. Например, использование техники максимального правдоподобия, используемой обычно в МЛСУ, подразумевает, что анализируемые переменные распределены нормально [11]. Кроме того, в случае работы с панельной лонгитюдной моделью, феномен истощения выборки (отказ испытуемых

от дальнейшего участия в исследовании), может повлиять на качество и психометрические характеристики данных, так как возможно появление различного рода искажений и изменение параметров репрезентативности. Проблемы также могут возникнуть с размером и структурой выборки, которые могут оказаться неадекватными для решения задач стандартизации и валидизации. Необходимо также помнить о возможности появления ситуаций, когда используется слишком мало индикаторов латентных переменных, что может привести к неспособности однозначно идентифицировать модель.

Д. Коул [17] рекомендует использование КФА при решении задач валидизации тестов, но подчеркивает, что качество оценок, полученных путем применения КФА, не может быть лучше, чем характеристики эмпирических данных, т. е., если моменты распределения переменных, задействованных в анализе, не соответствуют моментам нормального распределения, оценки валидности и надежности, вопервых, будут невысоки, а вовторых, неадекватны. Кроме того, понятно, что если модель была специфицирована неправильно, то оценки также могут не соответствовать действительности. В дополнение к вышесказанному, читатель должен быть предостережен против формулирования любого рода заключений на основе post hoc модификаций тестируемой модели. Кроссвалидизация, проведенная при наличии двух разных выборок, представляет собой надежный способ подтверждения того, что в анализе не происходит капитализации шанса, особенно в ситуации, когда в модель включены остаточные дисперсии коррелирующих ошибок.

МОДЕЛИ ЛАТЕНТНЫХ ПУТЕЙ

Выше обсуждались два основных типа моделей, используемых в рамках МЛСУ. Первая группа включает модели, близкие по смыслу к регрессионным процедурам, описывающим взаимоотношения между измеряемыми переменными. В подобного рода моделях «ненаблюдаемые » (латентные) переменные используются для обозначения ошибок в уравнениях. Автор предполагает, что этот тип моделей хорошо знаком читателям из курсов по статистике и поэтому не анализирует их подробно[5]. Вторая группа моделей уходит своими корнями в традиции КФА, придуманного для исследования связей между латентными и измеряемыми переменными, но не уделяющего, как известно, ни малейшего внимания влиянию одной латентной переменной на другую. Именно этой группе моделей было уделено особое место в силу относительной ее неизвестности и немногочисленности попыток применения КФА в рамках русской психологии.

Модель латентных путей (МЛП), кратко затрагиваемая в этом разделе, представляет собой синтез двух вышеупомянутых моделей. МЛП состоит из двух частей: измерительной модели, отражающей структуру взаимоотношений между измеряемыми и латентными переменными, и модели латентных переменных, представляющей природу взаимодействий между латентными переменными. Модель латентных путей представляет собой наиболее общую модель в рамках МЛСУ. Все модели, описанные выше, являются частными случаями этой наиболее общей модели.

Модель латентных путей позволяет решать задачу, называемую многими исследователями (см. например, [30]) важнейшей задачей МЛСУ — с помощью этой модели исследователи могут тестировать причинноследственные гипотезы на неэкспериментальных данных. Под неэкспериментальными в данном случае понимаются данные, собранные не в лабораторных условиях,

Рис. 3. Иллюстрация применения модели латентных путей

где экспериментатор может манипулировать переменными и проверять гипотезы экспериментальным путем, а в «экологически валидных » ситуациях, где исследователь выступает скорее в роли наблюдателя и протоколиста.

В качестве иллюстрации двухкомпонентности модели латентных путей рассмотрим пример, который должен показаться близким и понятным многим специалистам по возрастной психологии. На рис. 3 изображены каузальные отношения между величиной IQ матери и ребенка, где при первом измерении исследуемые дети были 27месячными, при втором — их возраст был приблизительно 45 месяцев. Численные значения для модели были выбраны в соответствии с данными на 90 испытуемых [36]. Двунаправленная стрелка и ассоциируемое с ней численное значение означают, что в момент измерения 1 корреляция между значениями IQ матери и ребенка была 0,46 и исследователи [22] не предполагают наличия причинноследственной связи между этими переменными. Напротив, однонаправленные стрелки, идущие к переменной IQ ребенка, в момент измерения 2, означают наличие каузальных эффектов. Исследователи предполагают, что величина IQ ребенка в момент измерения 2 определяется величиной IQ ребенка и 10 матери в момент измерения 1 и, наконец, величиной помехи g, которая, согласно предположениям исследователей, не коррелирует с двумя вышеназванными переменными. Переменная g отражает влияния всех переменных, которые также детерминируют величину 10 ребенка, но остались за пределами рассматриваемой модели. Численные значения, ассоциируемые с каждой из однонаправленных стрелок, соответствуют величинам каузальных эффектов. Например, стрелка от переменной, обозначающей величину IQ матери, ассоциируется с эффектом размерностью 0,23 единицы. Это значит, что если бы величина IQ матери в момент измерения 1 была бы на 1 больше, чем это было в реальности, а величина IQ ребенка в момент измерения 1 и величины помехи остались бы прежними, наблюдалось бы увеличение значения IQ ребенка на 0,23 единиц в момент измерения 2. Читатель может применить подобную же схему для интерпретаций численных значений однонаправленных стрелок, идущих от помехи и величины IQ ребенка. Эта модель

представляет собой вариацию на тему традиционных регрессионных моделей и составляет ту часть модели латентных путей, которая называется моделью латентных переменных.

Теперь рассмотрим (рис. 4) структуру взаимоотношений между актуальными и латентными переменными, задействованными в модели. Представим, что значения IQ матери и ребенка измерялись посредством двух компонентов — вербального и невербального у матерей и вербального и моторного у детей. Каждое из этих измерений имеет свою независимую степень надежности, соответствующую величинам факторных нагрузок на латентные переменные интеллекта и отраженную в численных значениях, ассоциирующихся с однонаправленными стрелками, идущими от латентных конструктов к актуальным переменным. Эта модель представляет собой измерительную часть модели латентных путей.

Таким образом, рис. 5 отражает объединение двух моделей в одну и является примером МЛП. Напомним читателю, что идеология измерительной части модели родственна идеологии КФА, в то время как модель латентных переменных есть не что иное, как регрессионная модель, включающая латентные конструкты.

В одной из первых нейропсихологических работ, использовавших МЛСУ, А. МасИнтош и Ф. ГонзалесЛима [31] продемонстрировали использование структурного моделирования для исследования функциональных связей между структурами мозга, формирующими слуховую систему. Три группы крыс изучались в разных экспериментальных условиях. В данном случае проводящие пути (аналоги структурных регрессионных путей в статистическом представлении модели) были уже известны из анатомии. Предметом интереса в данном исследовании являлись величина влияния каждого из проводящих путей мозга и изменение их взаимодействий в разных экспериментальных условиях. Меры степени соответствия были использованы как относительные показатели того, насколько ковариационные матрицы могут быть объяснены анатомией мозговых структур, вовлеченных в слуховую систему. Авторы описали результаты, касающиеся взаимодействия структур мозга, которые не были очевидны без использования МЛСУ анализа.

МЛП является, пожалуй, наиболее

Рис. 4. Компонент ЛМП, представляющий собой измерительную модель

Каждая из латентных перемен, задействованных в модели, была измерена двумя актуальными переменными. IQ матери измерялось посредством вербального (VIQ) и невербального (PIQ) интеллекта, IQ ребенка — ментальным (Ml) и моторным (MotI) индексами. Коэффициенты (l1-l6) представляют коэффициенты надежности, а коэффициенты (d1-d6) — измерительные ошибки.

Рис. 5. Полная модель латентных путей, объединяющая измерительную модель и модель латентных переменных

популярной моделью с точки зрения количества написанных о ней статей и монографий. Читатель, заинтересованный в том, чтобы узнать больше об этом типе моделей, может обратиться к книге К. Боллена [13].

МЛСУ: ЗА И ПРОТИВ

1. Исследователь не может напрямую ответить на вопрос о причинах и следствиях, независимо от того, работает ли он в рамках экспериментального или неэкспериментального исследования и являются ли статистические приемы, используемые исследователем, традиционными или модернистскими. Перед погружением в сложности и ограничения МЛСУ, исследователю следует быть уверенным в том, что никакой другой традиционный метод, позволяющий тестировать гипотезы о причинноследственных связях и требующий жестких допущений, не способен решить задачи, стоящие перед работой.

2. Реальной ценностью любого исследования является разработка теоретической канвы работы. Статистический метод, применяемый при анализе результатов и проверке гипотез, не должен являться, если только речь не идет о методической работе, самоцелью исследования, как, к сожалению, это часто случается при использовании МЛСУ. При проверке причинноследственных гипотез авторы порой забывают, что задачей исследования является попытка представить теоретическое объяснение эмпирических данных, а следствием — использование МЛСУ, а не наоборот.

3. Аккуратная операционализация конструктов и переменных, использованных в исследовании, и сбор данных высокого качества являются началом начал любого исследования. Никакая статистическая методология, к сожалению, не предоставляет возможности делать надежные заключения на основе плохих данных. МЛСУ предоставляет возможность изолировать ошибку измерения и другие компоненты остаточной дисперсии, улучшая тем самым достоверность измерения латентных переменных, однако следует помнить, что качество данных не может быть исправлено даже с помощью МЛСУ.

4. Мощность МЛСУ основывается на: а) ограничивающих и упрощающих модель допущениях; б) больших выборках испытуемых. Адекватность и полезность применения методов МЛСУ становятся сомнительными в условиях, когда ограничивающие статистические допущения не соблюдаются или исследователь

работает с маленькой выборкой испытуемых.

5. Математическая и статистическая элегантность МЛСУ может «навести тень на плетень » и затемнить проблемы, присущие как методам, так и теоретическим гипотезам исследования. В этой связи исследователь, осуществляющий поиск адекватной модели и применяющий при этом сложные статистические приемы, должен периодически проводить «тест на реальность «, переводя статистические находки на простой язык и убеждаясь в том, что он все еще может объяснить и интерпретировать происходящее с его моделью.

6. Модели нельзя сконструировать без упрощающих допущений. Это неизбежно и не несет серьезных статистических последствий при условии, что все допущения четко сформулированы. Важно понимать, что если набор данных соответствует ожидаемым значениям, вытекающим из определенной модели, это еще не доказывает, что построенная модель адекватно описывает реальную ситуацию. В дополнение к тому факту, что найдена модель, соответствующая эмпирическим данным в определенной степени, должны быть исключены все другие модели.

1. Akaike H. A new look at the statistical model identification // IEEB Transactions and Automatic Control AC19. 1974. P. 716723.

2. Anderson J. C., Gerbing D. W. Structural equation modeling in practice: A review and recommended twostep approach // Psychol. Bull. 1988. 103. P. 411423.

3. Baumrind D. Specious causal attributions in the social sciences: The formulated steppingstone theory of heroin use as exemplar // J. Personality and Social Psychol. 1993. 45. P. 12891298.

4. Bender P. M. Linear systems with multiple levels and types of latent variables // Joreskog K. G., Wold H. (eds.) Systems under indirect observation: causality, structure, prediction. Amsterdam: NorthHolland, 1982.

5. Bender P. M. Structural modeling and psychometrika: an historical perspective on growth and achievements // Psychometrika. 1986. 51. P. 3551.

6. Bender P. M. Drug use and personality in adolescence and young adulthood: Structural models with nonnormal variable // Child Devel. 1987. 58. P. 6579.

7. Bender P. M. EQS structural equations program manual. Los Angeles: BMDP Statistical Software, 1989.

8. Bender P. M., Bonnet D. G. Significance tests and goodness of fit in the analysis of covariance structures // Psychol. Bull. 1980. 88. P. 588606.

9. Bender P. M., Mooijaart A. Choice of structural model via parsimony: A rationale based on precision // Psychol. Bull. 1989. 106. P. 315317.

10. Bender P. M., Newcomb M. D. Personality, sexual behavior and drug use revealed through latent variable methods // Clin. Psychol. Rev. 1986. 6. P. 363385.

11. Bender P. M., Stein J. A. Structural equation models in medical research // Statistical Methods in Medical Research. 1992. 1. P. 159181.

12. Bender P. M., Weeks D. G. Linear structural equations with latent variables // Psychometrika. 1980. 45. P. 289308.

13. Bollen K. A. Structural equations with latent variables. New York: Wiley, 1989.

14. Buncher С. R., Succor P. A., Dietrich K. N. Structural equation modeling in environmental risk assessment // Environmental Health Prospetives. 1991. 90. P. 209213.

15. Campbell D. Т., Fiske D. W. Convergent and discriminant validation by the multitraitmultimethod matrix // Psychol. Bull. 1959. 56. P. 81195.

16. Cliff N. Some cautions concerning the application of causal modeling methods // Multivariate Behavioral Research. 1983. 18. P. 115126.

17. Cole D. A. Utility of confirmatory factor analysis in test validation research // J. Consult. and Clin. Psychol. 1987. 55. P. 584-594.

18. Connell J. P. A multidimensional measure of children’s perception of control // Child Devel. 1985. 56. P. 10181041.

19. Duncan О. D. Introduction to structural equation models. New York: Academic Press. 1975.

20. Freedman D. A. Statistics and the scientific method // Mason W., Fienberg S. (eds.) Cohort analysis in social research. New York: Springer. 1985.

21. Fransic D. J. An introduction to structural equation models // J. Clin. Exp. Neuropsychology. 1988. 10. P. 623-639.

22. Gollob H. F., Reichardt С. S. Taking account of time lags in causal models // Child Devel. 1987. 58. P. 8092.

23. Joreskog К. С. Analysing psychological data by structural analysis of covariance matrices // Magidson J.. (ed.) Advances in factor analysis and structural equation models. Lanham, MD: University Press of America, 1979.

24. Joreskog K. G. Statistical models and methods for analysis of longitudinal data // Magidson J. (ed.) Advances in factor analysis and structural equation models. Lanham, MD: University Press of America, 1979.

25. Joreskog К. С., Sorbom D. LISREL 17, a guide to the program and applications. Chicago: SPSS, 1988.

26. Heath A. C. el al. Testing hypotheses about direction of causation using cross sectional family data // Behav. Genet. 1993. 23. P. 2950.

27. Loehlin J. С. Latent variable models. An introduction to factor, path, and structural analysis. Hillsdale, NJ: Lawrence Eribaum Associates, 1987.

28. Lord F. M., Novick M. E. Statistical theories of mental test scores. Reading, MA: AddisonWesley, 1968.

29. Marsh H. W., Balla J. R., McDonald R. P. Goodnessoffit indexes in confirmatory factor analysis: the effect of sample size // Psychol. Bull. 1988. 103. P. 411-423.

30. Martin J. A. Structural equation modeling: A guide for the perplexed // Child Devel. 1987. 58. P. 3337.

31. McIntosh A. R., GonzalezLima F. Structural modeling of functional neural pathways mapped with 2deoxyglucose: Effects of acoustic startle habituation on the auditory system // Brain Research. 1991. 547. P. 295-302.

32. Millsap R. E., Everson H. Confirmatory measurement model comparisons using latent means // Multivariate Behavioral Reseach. 1991. 26. P. 479497.

33. Morris R. J., Bergan J.R., Fulginiti J. V. Structural equation modeling in clinical assessment research with children // J. Consult. Clin. Psychol. 1991. 59. P. 371379.

34. Newcomb M. D., Bentler P. M. Loneliness and social support: A confirmatory hierarchical analysis // Personality Social Psychol. Bull. 1986. 12. P. 520-535.

35. Raffalovich L. E., Bohmstedt G. W. Common, specific, and error variance components of factor models: Estimation with longitudinal data // Sociological Methods and Research. 1987. 15. P. 385405.

36. Scarr S. Constructing psychology: Making facts and fables for our times // Am. Psychologist. 1985. 40. P. 499512.

37. Wheaton B. et al. Assessing reliability and stability in panel models // Heise D. R. (Ed.) Sociological methodology. San Francisco: JosseyBass, 1977.

38. Wright S. On the nature of size factors // Genet. 1918. 3. P. 367-374.

Поступила в редакцию 28.IX 1993 г.

[1] Автор называет обсуждение основных типов моделей «несбалансированным » в результате неравномерного распределения представляемого материала в рамках статьи. Акцентуации в тексте этой работы сделаны на моделях, представляющих, с точки зрения автора, наиболее значительный интерес для психологов, а именно на тех, которые позволяют вычленить ошибку измерения из анализируемых переменных. Кроме того, регрессионные модели и модели латентных путей, которым в тексте уделено меньше внимания, многократно и подробно описаны как в отечественных (см., например, главу Б. Кочубея в коллективной монографии «Роль среды и нравственности в формировании индивидуальности человека «), так и зарубежных (см. Hcyduk L. Structural equation modelling with LISREL. 1981) источниках.

[2] LISREL 8 (последняя редакция этого пакета) представляет собой версию, облегчающую задачу составления программ для анализа. Эта версия позволяет использовать язык программирования, который существенно менее формализован и более доступен при обучении.

[3] Подробно процедуры оценки разных типов надежности и валидности в рамках LISREL описаны К. Болленом [13].

[4] Этот тип ошибки часто упоминается в литературе как «коррелирующая ошибка «. Это название хоть и неадекватно [11], тем не менее широко распространено.

[5] Для тех, кто по тем или иным причинам хотел бы поподробней ознакомиться с традициями регрессионного анализа, лучшим советом будет рекомендация прочесть книгу Якоба и Патриции Коэн, посвященную правилам, и секретам использования регрессионного подхода в науках о человеке (см. Cohen ]., Cohen P. Applied multiple regression / correlation analysis for the behavioral sciences. Lawrence Eribaum Associates. 1983).

Уравнения структурного моделирования Текст научной статьи по специальности « Компьютерные и информационные науки»

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ожерельева Татьяна Алексеевна

Статья исследует метод статистического анализа , называемый уравнения структурного моделирования. Описаны виды такого моделирования. Исходными данными являются эмпирические данные, которые получают на основе измерений, но чаще при проведении социологических или психологических обследований. Эти данные содержат скрытые переменные, которые задают структуру исследуемого объекта или субъекта. Метод состоит в выявлении скрытых переменных и нахождении структуры скрытых переменных. Показано, что сущность такого моделирования равнозначна построению информационной конструкции .

Structural Equation Modeling

The article explores the method of statistical analysis , which is called the equation of structural modeling. This article describes the types of such modeling. The initial data are empirical data based on measurements obtained. Empirical evidence obtained during the sociological or psychological examinations. This data contains the hidden variables which define the structure of the test object or subject. The method consists in identifying the latent variables and the structure finding hidden variables. The article argues that the essence of such a simulation is equivalent to the construction of an information construction.

Текст научной работы на тему «Уравнения структурного моделирования»

Международный электронный научный журнал ISSN 2307-2334 (Онлайн)

Адрес статьи: pnojournal.wordpress.com/archive17/17-02/ Дата публикации: 1.05.2017 № 2 (26). С. 63-67. УДК 159.9

Уравнения структурного моделирования

Статья исследует метод статистического анализа, называемый уравнения структурного моделирования. Описаны виды такого моделирования. Исходными данными являются эмпирические данные, которые получают на основе измерений, но чаще при проведении социологических или психологических обследований. Эти данные содержат скрытые переменные, которые задают структуру исследуемого объекта или субъекта. Метод состоит в выявлении скрытых переменных и нахождении структуры скрытых переменных. Показано, что сущность такого моделирования равнозначна построению информационной конструкции.

Ключевые слова: информация, философия информации, социология, скрытые параметры, структура, статистический анализ, информационная конструкция

Perspectives of Science & Education. 2017. 2 (26)

International Scientific Electronic Journal ISSN 2307-2334 (Online)

Available: psejournal.wordpress.com/archive17/17-02/ Accepted: 1 March 2017 Published: 1 May 2017 No. 2 (26). pp. 63-67.

Structural Equation Modeling

The article explores the method of statistical analysis, which is called the equation of structural modeling. This article describes the types of such modeling. The initial data are empirical data based on measurements obtained. Empirical evidence obtained during the sociological or psychological examinations. This data contains the hidden variables which define the structure of the test object or subject. The method consists in identifying the latent variables and the structure finding hidden variables. The article argues that the essence of such a simulation is equivalent to the construction of an information construction.

Keywords: information, information philosophy, sociology, hidden parameters, structure, statistical analysis, information construction

оделирование является методом научного познания, при котором исследуемый объект заменяют другим объектом — его моделью. Модель всесторонне изучают и на этой основе изучают объект исследования [1]. Моделирование позволяет с меньшими затратами воссоздать процессы поведения объекта моделирования и, если необходимо, выявить причины такого поведения. В настоящее время существуют разные виды моделирования объектов, процессов и ситуаций [2]. Моделирование различается по видам моделей и по задачам. Основными разновидностями процессов

моделирования считают: физическое (натурное), математическое, аналитическое, системное и структурное. Структурное моделирование также включает различные подходы. Одним из методов структурного моделирования является формирование информационных конструкций [3, 4], главная особенность которых является построение структуры. Другим распространенным методом структурного моделирования является применение уравнений структурного моделирования (Structural equation modeling — SEM) 5.

Современные формы SEM возникли с появлением компьютерных технологий в 1960-е и 1970-

е годы. SEM развивалась в трех различных направлениях: (1) система методов, основанных на уравнениях регрессии; (2) итерационные методы алгоритмов максимального правдоподобия для «анализа пути»; (3) алгоритмы анализа траектории на основе итерационных корреляций. Не менее десятка реализаций этого подхода привели к появлению обобщенного термина «уравнения структурного моделирования», включающего разные методы и алгоритмы.

Применение уравнений структурного моделирования реализуется в виде наборов математических моделей, компьютерных алгоритмов и статистических методов, которые соответствуют построению структурных конструкций данных. SEM включает в себя разнообразный набор методов: факторный анализ, «анализ пути», моделирование методом наименьших квадратов пути, скрытое моделирование роста. Это понятие не следует путать с соответствующей концепцией структурных моделей в эконометрики и со структурными моделями в экономике.

Уравнения структурного моделирования часто используют для оценки ненаблюдаемых скрытых конструкций. По этой причине они широко применяют модели измерения и анализа, которые определяют латентные переменные с использованием одной или более наблюдаемых переменных, а также структурную модель, которая включает отношения и связи между латентными переменными. Связи между структурными конструкциями, которые получают в результате решения SEM и эмпирическими данными могут быть оценены по независимым уравнениям регрессии.

Использование SEM оправдано в социальных науках из-за возможности выявлять отношения между ненаблюдаемыми структурными информационными конструкциями (латентных переменных) из наблюдаемых переменных [5]. Например, человеческий интеллект не может быть измерен непосредственно, а может быть измерен по косвенным признакам с последующим анализом. В этой связи следует подчеркнуть связь между SEM и латентным анализом [8].

В психологии SEM является популярным инструментом. Например, психологи выдвигают гипотезу исследования записей с вопросами, предназначенными для измерения интеллекта в соответствии с этой гипотезой [6]. После этого они используют SEM , чтобы проверить свою гипотезу, используя данные, полученные от опросов субъектов, которые прошли их интеллектуальный тест. С помощью SEM, «интеллект» оценивается как скрытая (латентная) переменная, для которой тестовые задания являются наблюдаемыми переменными.

Отличительными особенностями SEM являются две основные компоненты: структурная модель, показывающая возможные зависимости причинной связи между эндогенными и эк-

зогенными переменными, модели измерений, показывающие отношения между латентными переменными и их показателями.

Следует отметить методику, которая называется анализ пути (path analysis) или диаграммы пути (path diagrams) [9]. В статистике, анализ пути используется для описания направлений зависимостей среди множества переменных. Он включает в себя модели, эквивалентные любой форме множественного регрессионного анализа, факторного анализа, канонического корреляционного анализа, дискриминантного анализа, а также более общих семейств моделей в многомерном анализе дисперсии и ковариации анализов.

С концептуальных позиций path analysis и path diagrams представляют собой анализ информационной ситуации [10], которая формируется на основе специфических описаний, включающих латентные информационные единицы [11], которые составляют основу будущей структурной конструкции.

В упрощенной модели диаграммы пути (рис.1) две экзогенные переменные (Ex1 и Ex2) моделируются как два коррелята [12], которые имеют прямое и косвенное через эндогенную переменную En1 воздействие на результирующую переменную Ru2 (Ex1, Ex2, En1)^ большинстве реальных моделей, эндогенные переменные также зависят от факторов, находящихся вне модели (погрешности измерений). Таких внешние факторы изображаются «е» как ошибками в модели.

Рис.1. Упрощенная модель для иллюстрации диаграммы пути (path diagrams)

Модель, приведенная на рис.1 является явной. На практике возможны альтернативные модели. Например, можно предположить, что Ex1 имеет только косвенное воздействие на Ru2 через Еп1. Это предположение исключает прямую связь между Ex1 и Ru2. Показанную на рис1. Вместо прямой связи соответствие из этих двух моделей можно сравнить статистически. Этим и занимается методика анализа пути. На основе статистики строится система уравнений. Если линейная система уравнений изоморфна диа-

грамме пути, то это подтверждает правильность модели.

Построение модели подобной на рис.1 создает структурную модель и фактически является структурным анализом. При определении диаграммы путей в модели SEM, можно постулировать два типа отношений: свободных путей и фиксированных отношений. При применении метода свободных путей все связи типа на рис.1 моделируются. В этом случае проверяется, существует каждая связь или ее нет? . При фиксированных отношениях все связи типа на рис.1 задаются. Последняя ситуация на практике не встречается. Поэтому применяют промежуточную модель, когда часть путей задается, другая часть моделируется.

В процессе анализа устанавливают причинно-следственные связи между переменными и тем самым определяют структуру. Такая структура является вероятностной и может модифицироваться при появлении новых данных. Таким образом, на бесструктурной совокупности эмпирических данных начинает формироваться структура. Это называют подгонкой структуры.

Существуют разные меры оценки соответствия структуры связям между переменными. Для каждой меры соответствия принимается решение, что представляет собой достаточно хорошее соответствие между моделью и данными отражают другие сопутствующие факторы, такие как размер выборки, отношение показателей к факторам, а также общий показатель сложности модели. Например, очень большие выборки делают тест ХИ-квадрат чрезмерно чувствительным и более вероятно, указывают на отсутствие соответствия на модели данных [13, р.201].

Может потребоваться изменить модель для того, чтобы улучшить подгонку структуры и таким образом оценить наиболее вероятные соотношения между переменными.

Многие программы структурного анализа содержат индексы модификации структуры, которые могут вносить незначительные изменения. Индексы модификации приводят к изменению критерия Хи-квадрат (х2) и являются результатом высвобождения фиксированных параметров.

Изменения, которые улучшают модели могут быть помечены как потенциальные изменения, которые могут быть внесены в модель. Изменения в модели, в особенности структурной модели, должны быть проверены. Поэтому изменения должны быть описаны в терминах проверяемой теории или должны зафиксировать ограничения этой теории. В данном случае под теорией понимается теоретической обоснование структуры и теоретическое обоснование связей в структуре, подкрепленное аналитикой. Особенностью структуры является включение в нее скрытых (латентных) переменных. Изменения в модели свидетельствуют, что элементы структуры являлись нечеткими показателем скрытых перемен-

ных, определенных теорией [14] или гипотезой.

Можно перечислить основные методы SEM отчего этот подход и называют системой уравнений. Основная идея поиска структуры на эмпирической зависимости реализуется разными практическими методами (разными уравнениями). Перечислим некоторые.

Метод инвариантности измерения. Он включает моделирование в нескольких группах: Это методика, позволяющая проводить совместную оценку нескольких моделей, каждая из которых с различными подгруппами. Программные приложения включают алгоритмы генетики поведения, а также анализ различий между группами (например, пола, культуры, тестовые формы , написанные на разных языках, и т.д.).

Моделирование скрытого роста Методика включает регрессионный анализ на латентных переменных в предположении наличие некого роста. То есть это аналог нахождения тренда, но не на явных переменных, а на латентных.

Иерархические многоуровневые модели известный метод построения иерархической модели, например, на основе метода анализа иерархий [15]

Теория отклика элемента (item response theory -IRT) [16] известна также как теория скрытого признака. Это теория тестирования на основе нахождения отношений между «выступлениями на тестовом пункте и тестируемых» индивидуумов; уровнями производительности и общей мерой способности и так далее. Эта модель была разработана для социологических измерений.

В этой теории несколько различных статистических моделей используют для представления структуры связи отдельных факторов и тестируемого субъекта. Теория отклика элемента обрабатывает сложность каждого элемента. Сложность каждого элемента включается в структуру элементов, описывающую субъект исследования. Теория IRT основана на о том, что вероятность правильного ответа является математической функцией личности и элементов. Эта математическая функция задает структуру субъекта.

Латентный анализ [8]. Латентный анализ достаточно известное и широкое направление в психологии, социологии и медицине, поэтому останавливаться на нем не будем. Отметим только, что его основной целью является нахождение скрытых (латентных) переменных, а не нахождении структуры. Поэтому в SEM он используется как этап трансформации неявных переменных в явные переменные. Последующий этап анализа включает построение структуры как на явных переменных.

Модель смеси. В статистике модель смеси представляет собой вероятностную модель для представления субпопуляций в пределах общей популяции. Эта модель не требует, чтобы наблюдаемый набор данных идентифицировал подгруппу населения (субпопуляцию), к которому

принадлежит индивидуальное наблюдение [17]. Формально модель смеси соответствует распределению смеси, которая представляет распределение вероятностей наблюдений в общей численности населения (популяции). Модель смеси используют для формирования статистических выводов о свойствах подгрупп, без информации о личности субпопуляции. Типичная финитная модель смеси [17] представляет собой иерархическую модель, состоящую из следующих компонентов:

• N случайных величин, соответствующим наблюдениям, каждый предполагается распределять по смеси компонентов К, при этом каждый компонент, принадлежащих к той же параметрическое семейство распределений, но с различными параметрами

• N случайных скрытых переменных, соответствующим наблюдениям и определяющим идентичность компонента смеси каждого наблюдения, каждая распределены по К — мерного категориального распределения

• Набор весов смеси К, каждый из которых представляет собой вероятность, сумма которых равна 1

• Набор параметров К, каждый из которых определяет параметр соответствующего компонента смеси. Во многих случаях, каждый «параметр» на самом деле это набор параметров.

Кроме того, в байесовской постановке, смесь весов и параметры сами будут случайными величинами априорных распределений и будут размещены по переменным.

Существует еще ряд методов, но общий принцип всех уравнений состоят в статистической обработке наблюдений, применение каких либо

уравнений и построение структуры на основе решения данных уравнений связывающих эмпирические и скрытые параметры.

Уравнения структурного моделирования используются в настоящее время в области социологии, психологии и других социальных науках. Уравнения структурного моделирования часто используются для оценки ненаблюдаемой скрытой конструкции. Это означает, что фактически осуществляется построение информационной конструкции, но не в терминах информационных технологий, а в вероятностных и статистических терминах. В терминах информационных технологий подход в уравнениях структурного моделирования можно интерпретировать как анализ информационной ситуации. Элементы в теории уравнений структурного моделирования в терминах информационных технологий являются информационными единицами. Общий вывод, в теории информационных технологий содержатся средства для полного решения задач структурного моделирования. Само по себе название уравнения структурного моделирования является общепринятым, но нельзя считать удачным. По существу речь идет не об уравнениях, а о методах анализа эмпирических данных и построения некой скрытой структуры, которую называют конструкцией. Перенос этих статистических методов в область информационных технологий может существенно развить данное направление и способствовать обобщению и развитию теории.

1. Алексеев В. В. и др. Моделирование информационного воздействия на эргатический элемент в эрготехнических системах. — М. : Стенсвил, 2003.

2. Цветков В.Я. Информационные модели объектов, процессов и ситуаций// Дистанционное и виртуальное обучение- 2014. — №5. — с.4- 11.

3. Дешко И.П. Информационное конструирование: Монография. — М.: МАКСПресс, 2016. — 64с. ISBN 978 -5-31705244-7.

4. Tsvetkov V. Ya. Information Constructions // European Journal of Technology and Design, 2014, Vol (5), № 3. -p.147-152.

5. Markus, Keith (2007). «Structural Equation Modeling». In Rogelberg, Steve.Encyclopedia of Industrial and Organizational Psychology. Sage.pp. 774-777.ISBN 9781412952651.

6. Shelley, Mack (2007). «Structural Equation Modeling». In English, Fenwick. Encyclopedia of Educational Leadership and Administration . Sage. ISBN9781412939584.

7. Westland, J. Christopher (2015). Structural Equation Modeling: From Paths to Networks . New York: Springer.

8. Linda M. Collins; Stephanie T. Lanza (2010). Latent class and latent transition analysis for the social, behavioral, and health sciences. New York: Wiley

9. Eichler M. Granger causality and path diagrams for multivariate time series //Journal of Econometrics. — 2007. — V. 137. — №. 2. — p. 334-353.

10. Tsvetkov V. Ya. Information Situation and Information Position as a Management Tool // European researcher. Series A. 2012, Vol.(36), 12-1, p.2166- 2170.

11. Tsvetkov V. Ya. Information Units as the Elements of Complex Models // Nanotechnology Research and Practice, 2014, Vol.(1), № 1, р57-64.

12. Tsvetkov V. Ya. Framework of Correlative Analysis // European researcher. Series A. 2012. № 6-1 (23). С. 839-844.

13. Kline R. B. Principles and practice of structural equation modeling. 2011 //New York: Guilford Press. — 2010.

14. Loehlin, JC (2004). Latent Variable Models: An Introduction to Factor, Path, and Structural Equation Analysis . Psychology Press.

15. Кравченко Ю. А., Марков В. В. Принятие решений в интегрированных информационных моделях на основе

метода анализа иерархий //Известия Южного федерального университета. Технические науки. — 2012. — Т. 136. — №. 11 (136).

16. https://en.wikipedia.org/wiki/Item_response_theory дата доступа 12.01.2017.

17. Zivkovic Z. Improved adaptive Gaussian mixture model for background subtraction //Pattern Recognition, 2004. ICPR 2004. Proceedings of the 17th International Conference on. — IEEE, 2004. — V.2. — p.28-31.

ПРИМЕНЕНИЕ СТАТИСТИЧЕСКОГО МЕТОДА МОДЕЛИРОВАНИЯ С ПОМОЩЬЮ ЛИНЕЙНЫХ СТРУКТУРНЫХ УРАВНЕНИЙ В ПСИХОЛОГИИ: ЗА И ПРОТИВ.

Уравнения структурного моделирования Текст научной статьи по специальности « Компьютерные и информационные науки»

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Ожерельева Татьяна Алексеевна

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Ожерельева Татьяна Алексеевна

Structural Equation Modeling

Текст научной работы на тему «Уравнения структурного моделирования»