Математическая энциклопедия

ДИСПЕРСИОННЫЙ АНАЛИЗ

в математической статистике - статистический метод, предназначенный для выявления влияния отдельных факторов на результат эксперимента, а также для последующего планирования аналогичных экспериментов. Первоначально Д. а. был предложен Р. Фишером [1] для обработки результатов агрономич. опытов по выявлению условий, при к-рых испытываемый сорт сельскохозяйственной культуры дает максимальный урожай. Современные приложения Д. а. охватывают широкий круг задач экономики, социологии, биологии и техники и трактуются обычно в терминах статистич. теории выявления систематич. различий между результатами непосредственных измерений, выполненных при тех пли иных меняющихся условиях.

Если значения неизвестных постоянных a1, ... ,aIмогут быть измерены с помощью различных методов или измерительных средствМ1,...,MJ,и в каждом случае систематич. ошибкаbijможет, вообще говоря, зависеть как от выбранного методаMj,так и от неизвестного измеряемого значенияаi, то результаты таких измерений представляют собой суммы вида

где К- количество независимых измерений неизвестной величиныаiметодомMj,aуijk- случайная ошибкаk-гоизмерения величиныаiметодомMj(предполагается, что всеyijk- независимые одинаково распределенные случайные величины, имеющие нулевое математич. ожидание: Еуijk=0). Такая линейная модель наз. двухфакторной схемой Д. а.; первый фактор - истинное значение измеряемой величины, второй - метод измерения, причем в данном случае для каждой возможной комбинации значений первого и второго факторов осуществляется одинаковое количество Кнезависимых измерений (это допущение для целей Д.а. не является существенным и введено здесь лишь ради простоты изложения).

Примером подобной ситуации могут служить спортивные соревнования I спортсменов, мастерство к-рых оцениваетсяJсудьями, причем каждый участник соревнований выступает Краз (имеет К"попыток"). В этом случаеаi- истинное значение показателя мастерства спортсмена с номеромi, bij- систематич. ошибка, вносимая в оценку мастерстваi-го спортсмена судьей с номером j,xijk- оценка, выставленнаяj-м судьей г-му спортсмену после выполнений последнимk-йпопытки, аyijk- соответствующая случайная погрешность. Подобная схема типична для так наз. субъективной экспертизы качества нескольких объектов, осуществляемой группой независимых экспертов. Другой пример - статистич. исследование урожайности сельскохозяйственной культуры в зависимости от одного из J сортов почвы и J методов ее обработки, причем для каждого сорта г почвы и каждого метода обработки с номером J осуществляется kнезависимых экспериментов (в этом примереbij- истинное значение урожайности для г-го сорта почвы при j-м способе обработки,xijk- соответствующая экспериментально наблюдаемая урожайность вk-мопыте, аyijk- ее случайная ошибка, возникающая из-за тех или иных случайных причин; что же касается величинаi, то в агрономич. опытах их разумно считать равными нулю).

Положимcij=ai+bij,и пустьсi*, с*jи с**- результаты осредненийсijпо соответствующим индексам, т. е.

Пусть, кроме того, a=c**,bi=сi*-с**, gj=с*j**и dij=сij-сi*-с*j+c**. Идея Д. а. основана на очевидном тождестве

Если символом (cij)обозначить вектор размерностиIJ, получаемый из матрицы ||сij|| порядка IXJ с помощью какого-либо заранее фиксированного способа упорядочивания ее элементов, то (1) можно записать в виде равенства где все векторы имеют размерностьIJ, причем aij=a, bij=bi, gij=gj. Так как четыре вектора в правой части (2) ортогональны, то aij=a - наилучшее приближение функцииcijот аргументов i иjпостоянной величиной [в смысле минимальности суммы квадратов отклонений ]. В том же смысле aij+bij=a+bi- наилучшее приближениеcijфункцией, зависящей лишь от i, aij+gij=a+gj- наилучшее приближениеcijфункцией, зависящей лишь от j, a aij+bij+gij=a+bi+gj- наилучшее приближениеcijсуммой функций, из к-рых одна (напр., a+bi) зависит лишь от г, а другая - лишь от j. Этот факт, установленный Р. Фишером (см. [1]) в 1918, позднее послужил основой теории квадратичных приближений функций.

В примере, связанном со спортивными соревнованиями, функция dijвыражает "взаимодействие" г-го спортсмена и j-го судьи (положительное значение б/у означает "подсуживание", т. с. систематич. завышение /-м судьей оценки мастерства i-го спортсмена, а отрицательное значение б/у означает "засуживание", т. е. систематич. снижение оценки). Равенство всех б/у нулю - необходимое требование, к-рое надлежит предъявлять к работе группы экспертов. В случае же агрономич. опытов такое равенство рассматривается как гипотеза, подлежащая проверке по результатам экспериментов, поскольку основная цель здесь - отыскание таких значенийiи j, при к-рых функция (1) достигает максимального значения. Если эта гипотеза верна, то

и значит, выявление наилучших "почвы" и "обработки" может быть осуществлено раздельно, что приводит к существенному сокращению числа экспериментов (напр., можно при каком-либо одном способе обработки испытать все Iсортов "почвы" и определить наилучший сорт, а затем на этом сорте опробовать всеJспособов "обработки" и найти наилучший способ; общее количество экспериментов с повторениями будет равно (I+J) К).Если же гипотеза {все dij=0} неверна, то для определения max cijнеобходим описанный выше "полный план", требующий при КповторенияхIJКэкспериментов.

В ситуации спортивных соревнований функция gij=gjможет трактоваться как систематич. ошибка, допускаемая j-м судьей по отношению ко всем спортсменам. В конечном счете gj- характеристика "строгости" или "либеральности" j-го судьи. В идеале хотелось бы, чтобы все gjбыли нулевыми, но в реальных условиях приходится мириться с наличием ненулевых значений gjи учитывать это обстоятельство при подведении итогов экспертизы (напр., за основу сравнения мастерства спортсменов можно принять не последовательности истинных значений a+b1+gj, ..., a+bI+gj, a лишь результаты упорядочиваний этих чисел по их величине, поскольку при всех j=1,. . . , Jтакие упорядочивания будут одинаковыми). Наконец, сумма двух оставшихся функций aij+bij=a+biзависит лишь от iи поэтому может быть использована для характеризации мастерства г-го спортсмена. Однако здесь нужно помнить, что Поэтому упорядочивание всех спортсменов по значениям a+bi(или по a+ + bi+gjпри каждом фиксированном j) может не совпадать с упорядочиванием по значениямai. При практической обработке экспертных оценок этим обстоятельством приходится пренебрегать, так как Упомянутый полный план экспериментов не позволяет оценивать отдельноaiиbi*. Таким образом, число a+bi=ai+bi*характеризует не только мастерствоi-го спортсмена, но и в той или иной мере отношение экспертов к этому мастерству. Поэтому, напр., результаты субъективных экспертных оценок, осуществленных в разное время (в частности, на нескольких Олимпийских играх), едва ли можно считать сопоставимыми. В случае же агрономич. опытов подобные трудности не возникают, поскольку всеai=0 и значит, a+bi=bi*.

Истинные значения функций a, bi, giи dijнеизвестны и выражаются в терминах неизвестных функций cij.Поэтому первый этап Д. а. заключается в отыскании статистич. оценок для cijпо результатам наблюденийxijk.Несмещенная и имеющая минимальную дисперсию линейная оценка для cijвыражается формулой

Так как a, bi, gjи dij- линейные функции от элементов матрицы ||cij||, то несмещенные линейные оценки для этих функций, имеющие минимальную дисперсию, получаются в результате замены аргументов cijсоответствующими оценками, cij,т. е. причем случайные векторы и определенные так же, как введенные выше (aij),(bij), (gij).и (dij), обладают свойством ортогональности, и значит, они представляют собой некоррелированные случайные векторы (иными словами, любые две компоненты, принадлежащие разным векторам, имеют нулевой коэффициент корреляции). Кроме того, любая разность вида

некоррелирована с любой из компонентэтихчетырех векторов. Рассмотрим пять совокупностей случайных величин{xijk}, {xijk-xij*},Так как

то дисперсии эмпирич. распределений, соответствующих указанным совокупностям, выражаются формулами

Эти эмпирич. дисперсии представляют собой суммы квадратов случайных величин, любые две из к-рых некоррелированы, если только они принадлежат разным суммам; при этом относительно всехyijkсправедливо тождество

объясняющее происхождение термина "Д. а."" Пусть и пусть

в таком случае

где s2- дисперсия случайных ошибокyijk.

На основе этих формул и строится второй этап Д. а., посвященный выявлению влияния первого и второго факторов на результаты эксперимента (в агрономич. опытах первый фактор - сорт "почвы", второй - способ "обработки"). Напр., если требуется проверить гипотезу отсутствия "взаимодействия" факторов, к-рая выражается равенствомто разумно вычислить дисперсионное отношениеs23/s20= F3.Если это отношение значимо отличается от единицы, то проверяемая гипотеза отвергается. Точно так же для проверки гипотезы полезно отношениеs22/s20= F2,к-рое надлежит также сравнить с единицей; если при этом известно, чтото вместоF2целесообразно сравнить с единицей отношение

Аналогичным образом можно построить статистику, позволяющую дать заключение о справедливости или ложности гипотезы

Точный смысл понятия значимого отличия указанных отношений от единицы может быть определен лишь с учетом закона распределения случайных ошибокyijk.В Д. а. наиболее обстоятельно изучена ситуация, в к-рой всеyijkраспределены нормально. В этом случае - независимые случайные векторы, а - независимые случайные величины, причем

отношения подчиняются нецентральным распределениям хи-квадрат сfmстепенями свободы и параметрами нецентральности lт, m=0, 1, 2, 3, где

Если параметр нецентральности равен нулю, то нецентральное распределение хи-квадрат совпадает с обычным распределением хи-квадрат. Поэтому в случае справедливости гипотезы l3=0отношение подчиняется F-распре делению (распределению дисперсионного отношения) с параметрами f3и f0. Пусть х- такое число, для к-рого вероятность события{F3>x}равна заданному значению е, называемому уровнем значимости (таблицы функциих= х(e; f3, f0) имеются в большинстве пособий по математич. статистике). Критерием для проверки гипотезы l3=0 служит правило, согласно к-рому эта гипотеза отвергается, если наблюдаемое значениеF3превышает х;в противном случае гипотеза считается не противоречащей результатам наблюдений. Аналогичным образом конструируются критерии, основанные на статистикахF2иF*2.

Дальнейшие этапы Д. а. существенно зависят не только от реального содержания конкретной задачи, но также и от результатов статистич. проверки гипотез на втором этапе. Напр., в условиях агрономич. опытов справедливость гипотезы l3=0, как указано выше, позволяет более экономно спланировать аналогичные дальнейшие эксперименты (если помимо гипотезы l3=0 справедлива также и гипотеза l2=0, то это означает, что урожайность зависит лишь от сорта "почвы", и поэтому в дальнейших опытах можно воспользоваться схемой однофакторного Д. а.); если же гипотеза l3=0 отвергается, то разумно проверить, нет ли в данной задаче неучтенного третьего фактора? Если сорта "почвы" и способы ее "обработки" варьировались не в одном и том же месте, а в различных географич. зонах, то таким фактором могут быть климатич. или географич. условия, и "обработка" наблюдений потребует применения трехфакторного Д. а.

В случае экспертных оценок статистически подтвержденная справедливость гипотезы l3= 0 дает основание для упорядочивания сравниваемых объектов (напр., спортсменов) по значениям величинi=l, . .. , I.

Если же гипотеза l3=0отвергается (в задаче о спортивных соревнованиях это означает статистич. обнаружение "взаимодействия" нек-рых спортсменов и судей), то естественно попытаться перевычнслить все результаты заново, предварительно исключив из рассмотренияxijkс такими парами индексов (i, j), для к-рых абсолютные значения статистич. оценок dijпревышают нек-рый заранее установленный допустимый уровень. Это означает, что из матрицы||xij*||вычеркиваются нек-рые элементы, и значит, план Д. а. становится неполным.

Модели современного Д. а. охватывают широкий круг реальных экспериментальных схем (напр., схемы неполных планов, со случайно или неслучайно отобранными элементамиxij*). Соответствующие этим схемам статистич. выводы во многих случаях находятся в стадии разработки. В частности, еще (к 1978) далеки от окончательного решения те задачи,, в к-рых результаты наблюденийxijk=cij+yijkне являются одинаково распределенными случайными величинами; еще более трудная задача возникает в случае зависимости величинxijk.Неизвестно решение проблемы выбора факторов (даже в линейном случае). Суть этой проблемы заключается в следующем: пустьс=с(и, v)- непрерывная функция и пустьu=u(z, wu=u(z, w)- какие-либо линейные функции от переменных г иw.Фиксируя значения z1, . ..,zIи w1, . . ., wJ,можно при каждом заданном выборе линейных функций ии u.определитьcijформулойи построить Д. а. этих величин по результатам соответствующих наблюденийxijk. Проблема заключается в отыскании таких линейных функций u и u,к-рым соответствует минимальное значение суммы квадратов

где (предполагается, что функция с(и, v)неизвестна). В терминах Д. а. эта проблема сводится к статистич. отысканию таких факторовz=z(u, vw-w(u, v),к-рым соответствует "наименьшее взаимодействие".

Лит.:[1] Fisher R. A., Statistical methods for research workers, Edinburgh, 1925; [2] Шеффе Г., Дисперсионный анализ, пер. с англ., М., 1963; [3] Xальд А., Математическая статистика с техническими приложениями, пер. с англ., М., 1956; [4] Снедекор Д ж. У., Статистические методы в применении к исследованиям в сельском хозяйстве и биологии, пер. с англ., М., 1961.

Л. Н. Большее.


  1. дисперсионный анализв психологии метод статистический позволяющий анализировать влияние различных факторов признаков на исследуемую зависимую переменную. Был разработан биологом Р. Фишером ...Словарь практического психолога
  2. дисперсионный анализв психологии от лат. dispersio рассеивание статистический метод позволяющий анализировать влияние различных факторов признаков на исследуемую зависимую переменную. Мето...Большая психологическая энциклопедия
  3. дисперсионный анализДИСПЕРСИОННЫЙ АНАЛИЗ в химии совокупность методов определения дисперсности iт. е. характеристики размеров частиц в дисперсных системах. Д. а. включает различные способы о...Большая советская энциклопедия
  4. дисперсионный анализДИСПЕРСИОННЫЙ АНАЛИЗ в математике статистический метод выявления влияния отдельных факторов на результат эксперимента. Первоначально Д. а. был предложен англ статистиком ...Большая советская энциклопедия
  5. дисперсионный анализлат. dispersus рассеянный рассыпанный статистический метод для одновременного сравнения двух или более средних значений. Дат возможность определить существует ли значимая...Большая энциклопедия по психиатрии
  6. дисперсионный анализanalysis of variance variance analysis...Большой русско-английский словарь биологических терминов
  7. дисперсионный анализDispersionsanalyse f...Большой русско-немецкий медицинский словарь
  8. дисперсионный анализметод статистического анализа позволяющий определить достоверность гипотезы о различиях в средних значениях на основании сравнения дисперсий распределений. Этот метод име...Краткий социологический словарь
  9. дисперсионный анализдисперсиялы талдау...Орысша-қазақша «Электроника, радиотехника және байланыс» терминологиялық сөздік
  10. дисперсионный анализanalyse de la variance...Политехнический русско-французский словарь
  11. дисперсионный анализв психологии от лат. dispersio рассеивание статистический метод позволяющий анализировать влияние различных факторов признаков на исследуемую зависимую переменную. Мето...Прикладные аспекты современной психологии
  12. дисперсионный анализот лат. dispersio рассеивание статистический метод позволяющий анализировать влияние различных факторов признаков на исследуемую зависимую переменную. Целью Д. а. в инж...Психология труда, управления, инженерная психология и эргономика
  13. дисперсионный анализanalysis of variance...Русско-английский машиностроительный словарь
  14. дисперсионный анализvariance analysis analysis of variance...Русско-английский медицинский словарь
  15. дисперсионный анализanalysis of variance...Русско-английский морской словарь
  16. дисперсионный анализdispersion analysis variance analysis...Русско-английский политехнический словарь
  17. дисперсионный анализстат. analysis of variance variance analysis...Русско-английский психологический словарь
  18. дисперсионный анализvariance analysis analysis of variance...Русско-английский словарь по машиностроению
  19. дисперсионный анализanalysis of variance...Русско-английский словарь по нефти и газу
  20. дисперсионный анализdispersion analysis мат.u analysis of variance...Русско-английский словарь по физике
  21. дисперсионный анализanalysis of variance...Русско-английский словарь по электронике
  22. дисперсионный анализampLTmath.ampGT analysis of variance...Русско-английский технический словарь
  23. дисперсионный анализdispersion analysis...Русско-английский химический словарь
  24. дисперсионный анализvariance analysis...Русско-английский экономический словарь
  25. дисперсионный анализдысперсйны аналз...Русско-белорусский математический словарь
  26. дисперсионный анализanlisis de varianza...Русско-испанский автотранспортный словарь
  27. дисперсионный анализanlisis de varianza...Русско-испанский экономический словарь
  28. дисперсионный анализanalisi per dispersione...Русско-итальянский политехнический словарь
  29. дисперсионный анализanalisi della varianza...Русско-итальянский экономический словарь
  30. дисперсионный анализDispersionsanalyse Dispersoidanalyse Streuungszerlegung Varianzanalyse...Русско-немецкий политехнический словарь
  31. дисперсионный анализDispersionsanalyse Dispersoidanalyse Varianzanalyse...Русско-немецкий словарь по химии и химической технологии
  32. дисперсионный анализDispersionsanalyse Dispersoidanalyse Varianzanalyse...Русско-немецкий химический словарь
  33. дисперсионный анализStreuungszerlegung Varianzanalyse...Русско-немецкий экономический словарь
  34. дисперсионный анализдисперсйний аналз...Русско-украинский политехнический словарь
  35. дисперсионный анализanalyse par dispersion результатов измерений analyse de variance...Русско-французский словарь по химии
  36. дисперсионный анализanalza rozptylu...Русско-чешский словарь
  37. дисперсионный анализОдин из основных методов биометрии с помощью которого осуществляется статистическая оценка одного и более факторов влияющих на изменчивость хозяйственнополезных признаков...Термины и определения, используемые в селекции, генетике и воспроизводстве сельскохозяйственных животных
  38. дисперсионный анализодин из методов математической статистики применяемый для анализа результатов наблюдений зависящих от различных одновременно действующих факторов крые не поддаются как пр...Физическая энциклопедия
  39. дисперсионный анализсовокупность методов измерения размеров частиц дисперсной фазы или пор в случае тонкопористых тел. Определяют также дисперсность или удельную поверхность дисперсной систе...Химическая энциклопедия
  40. дисперсионный анализДИСПЕРСИОННЫЙ АНАЛИЗ analysis of variance Статистический метод основанный на разложении общей дисперсии variance какойлибо характеристики населения на составные части кор...Экономический словарь
  41. дисперсионный анализ. см. АНАЛИЗ ДИСПЕРСИОННЫЙ. Antinazi.Энциклопедия социологии...Энциклопедия социологии