Главная > Математика > Многомерный дисперсионный анализ
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

7.5. ДИСКРИМИНАНТНЫЕ ПРИЗНАКИ, ДИСКРИМИНАНТНЫЕ ФУНКЦИИ

Дискриминантные признаки представляют двоякий интерес. Во-первых, они нужны для классификации любых индивидов, т. е. для диагностики индивидов или их разделения на групп. Во-вторых, с их помощью можно взаимосвязи опытных данных перенести из исходного -мерного пространства в пространство более низкой размерности, благодаря чему они становятся доступны для интерпретации.

Элементарные дискриминантные признаки

В разделе 7.4 мы обсуждали свойство монотонности многомерного дистанта. Утверждалось, что с ростом размерности пространства признаков увеличиваются (или по крайней мере не уменьшаются) значения соответствующего дистанта и что при переходе от пространства признаков к его подпространствам дистант, вообще говоря, уменьшается. Можнб также показать, что пространство признаков, полученное из так называемых дискриминантных признаков, несмотря на понижение размерности, при некоторых обстоятельствах сохраняет значение исходного дистанта. Некоторые положения этого раздела основываются на доказательствах, приведенных в разделе 5.2.

«Элементарными дискриминантными признаками» в данном разделе мы будем называть признаки

Здесь у — переменный -мерный вектор из пространства наблюдений, в то время как и вопределены данными выборками. Величины также переменные. Правила (7.37) получения из называются элементарными дискриминантными функциями.

Эпитет «элементарные» к понятию дискриминантной функции введен в связи с тем, что значения признаков можно найти путем простых арифметических операций над матрицами, не обращаясь к решению проблемы собственных значений. Положив

получим для признака выражение

и для вектора всех элементарных дискриминантных признаков выражение

Числа называются весовыми коэффициентами.

Следует подчеркнуть отличие этих рассуждений от аналогичных в разделе 5.2. Там было введено бесконечное множество элементарных дискриминантных признаков, и даже определено линейное пространство, состоящее из дискриминантных признаков. Мы считаем более целесообразным в этой главе использовать понятие элементарного дискриминантного признака в узком смысле.

Элементарные дискриминантные признаки не являются линейно-независимыми в совокупности, так как

Можно показать, что многомерный дистант совокупности элементарных дискриминантных признаков равен дистанту исходных признаков:

Содержательно это означает, что элементарные дискриминантные признаки в целом имеют такое же значение для разделения групп и проведения классификации, как и исходных признаков. Если число групп не превосходит , то имеется линейно-независимых элементарных дискриминантных признаков. Следовательно, при преобразовании (7.41) число подлежащих рассмотрению признаков уменьшается. Снижение размерности позволяет упростить статистические вычисления; конечные результаты анализа легче интерпретировать. Если то переход к элементарным дискриминантным признакам не приводит к снижению размерности.

Отдельные элементарные дискриминантные признаки имеют содержательное истолкование. А именно признак особенно пригоден, чтобы выделить группу из множества всех остальных групп.

Пример. По данным о гипертиреозе из раздела 7.1 получаем следующие элементарные дискриминантные функвди:

Неэлементарные дискриминантные признаки

Наряду с элементарными имеются и так называемые неэлементарные дискриминантные признаки. Они являются результатом решения проблемы собственных значений

Если отличные от нуля характеристические корни уравнения (7.44), а соответствующие характеристические (нормированные) векторы, то величины

называются неэлементарными дискриминантными признаками.

Здесь ранг матрицы причем

т. е. число неэлементарных дискриминантных признаков не превышает числа исходных признаков и по крайней мере на 1 меньше числа групп. В соответствии с этим для двух групп существует только один дискриминантный признак.

Пусть

Тогда для вектора всех неэлементарных дискриминантных признаков получим

Числа весовые коэффициенты неэлементарных дискриминантных функций. матрицы выполняется условие ортонормированности

Признаки в совокупности линейно независимы. Можно показать, что они порождают то же линейное пространство, что и элементарные дискриминантные признаки.

Поэтому согласно (7.43) дистант признаков равен дистанту исходных признаков:

Неэлементарных дискриминантных признаков по крайней мере столько же, сколько элементарных. Сверх того они обладают определенным свойством оптимальности.

Среди всех признаков, которые можно получить путем линейных комбинаций признак имеет максимальный дистант. Среди всех пар признаков, которые можно образовать из исходных признаков -путем линейных комбинаций, пара имеет наибольшее значение дистанта. И т. д. для троек, четверок и более признаков.

Итак, наилучший признак; наилучшее дополнение к наилучшее дополнение к Следовательно, если нужно воспользоваться одним единственным дискриминантным признаком, т. е. представить все многообразие на прямой, то предпочитают признак Если необходима пара дискриминантных признаков, т. е. представление результата анализа на плоскости, то выбирают

Для имеем

Следовательно, характеристические корни можно интерпретировать как дистанты соответствующих дискриминантных признаков. Многомерный дистант нескольких неэлементарных дискриминантных признаков равен сумме соответствующих характеристических корней.

Преимущество неэлементарных дискриминантных признаков заключается в том, что согласно (7.49) их ковариационная матрица единична, т. е. их дисперсии равны 1, и внутри отдельных групп они некоррелированы.

Пример. По данным о гипертиреозе из раздела 7.1 имеем

Неэлементарные дискриминантные признаки:

Они будут использованы в разделе 7.7 для диагностики отдельных индивидов.

Неэлементарные признаки полезны для систематизации многомерных наблюдений именно этой оптимальностью. Они позволяют отделить существенную информацию от несущественной. Так как первые неэлементарные дискриминантные признаки обычно отражают наиболее важные взаимосвязи, с их помощью легче, чем непосредственно по исходным признакам, выдвигать и проверять научные гипотезы и теории. Таким образом, дисперсионный и дискриминантный анализы раскрывают структуру наблюдений.

Поясним эту точку зрения на примере исследования Баумана и др. [6], [71, где приведены результаты записи сигналов, снимавшихся с мозга крыс с помощью стальных проволочных электродов. Речь идет о так называемых вызванных потенциалах, т. е. о биоэлектрических импульсах, появляющихся как следствие определенных оптических или акустических раздражений, получаемых крысой (вспышки света, звуковые сигналы) (рис. 2). Электрические сигналы сопровождают обработку информации мозгом. В зависимости от ситуации, в которой находится животное (состояние бодрствования или сна, кратковременного возбуждения или угнетения), вызванные потенциалы имеют различную форму.

Каждый такой потенциал дает значения 45 признакам, а именно: значения амплитуд в 45 фиксированных моментах времени (рис. 2). Таким образом, каждому вызванному потенциалу соответствует -мерный вектор наблюдений.

В данном эксперименте различают 8 ситуаций и в соответствии с ними вызванные потенциалы разделяют на 8 групп:

группа 0: отсутствие психонервной нагрузки у животного (нормальное состояние);

группа 1: как в группе 0, но с дополнительной физической нагрузкой (животное непрерывно двигается по вибрирующей поверхности);

группа 2: наличие психонервной нагрузки у животного как результат условно-рефлекторного процесса обучения (фаза выработки условного рефлекса);

Рис. 2. Образец вызванного потенциала. Стрелками указаны моменты времени, в которые снимались значения амплитуды

группа 3: как в группе 2, но с упомянутой в группе 1 дополнительной физической нагрузкой;

группа 4: животное находится в фазе, когда появившийся рефлекс закрепляется путем многократных повторений (фаза закрепления рефлекса);

группа 5: как в группе 4, но с упомянутой дополнительной физической нагрузкой;

группа 6: более сильная психонервная нагрузка у животного с помощью усложненного процесса обучения (промежуточная фаза);

группа 7: как в группе 6, но с упомянутой дополнительной физической нагрузкой.

Проведенное исследование должно показать, каким образом обработка информации в мозгу зависит от внешних нагрузок.

Объемы выборок (число вызванных потенциалов) для каждой группы:

На рис. 3 представлены векторы средних значений полученные в результате вычислений (средний вызванный потенциал групп

С помощью -мерного дисперсионного и дискриминантного анализов можно узнать, существует ли значимое различие между средними вызванными потенциалами восьми групп и каково взаимное положение векторов средних значений восьми групп. Согласно (7.48) для каждого вектора средних значений определяется соответствующий вектор средних значений в дискриминантном пространстве

Рис. 3. Векторы средних значений (средние вызванные потенциалы) групп Электрические сигналы поступали из среднего мозга крыс:

а) эксперименты без нагрузки

1 — группа 0: контрольная (нормальное состояние),

2 — группа 2: фаза выработки условного рефлекса,

3 — группа 4: фаза закрепления условного рефлекса,

4 — группа 6: промежуточная фаза;

б) эксперименты с дополнительной физической нагрузкой

1 — группа 1: контрольная (нормальное состояние),

2 — группа 3: фаза выработки условного рефлекса,

3 — группа 5: фаза закрепления условного рефлекса,

4 — группа 7: промежуточная фаза

Если в этих -мерных векторах учитывать только первые две компоненты, которые, как мы знаем, составляют два наиболее избирательных дискриминантных признака то для средних значений восьми групп мы получим двумерную дискриминантную схему, представленную на рис. 4. На ней видны наиболее характерные черты и свойства использованного числового материала. Правда, наглядное представление взаимосвязей может при некоторых обстоятельствах привести к субъективной интерпретации, но, с другой стороны, — это важное эвристическое средство, помогающее формулированию научных гипотез.

В данном случае ясно, что различие между группами и 1, 2 и 3, 4 и 5, а также 6 и 7 относительно мало, т. е. дополнительная физическая нагрузка (вибрация) на организм животного имеет второстепенное значение для формы вызванного потенциала. Посмотрев внимательнее, мы заключаем, что контур, составленный из точек 1, 3, 5 и 7, соответствующих группам с нагрузкой в виде вибрации, получается приблизительно путем параллельного смещения контура, составленного из точек 0, 2, 4, и 6.

Рис. 4. Дискриминантная схема, наглядно представляющая взаимное расположение средних вызванных потенциалов для всех восьми групп

Это может означать, что нагрузка (вибрация) влечет за собой определенные аддитивные изменения вызванного потенциала, независимо от применяемой обучающей нагрузки. Далее из дискриминантной схемы видно, что обучающая нагрузка групп 2 или 3 (фаза выработки условного рефлекса) по сравнению с нормальным состоянием групп или 1 не приводит к существенным различиям между ними.

Выводы, полученные из дискриминантной схемы, должны быть увязаны с физической сущностью процесса и по возможности проверены путем дополнительных экспериментов. При более подробном изучении взаимосвязей можно дать содержательное истолкование отдельным направлениям в дискриминантной схеме, в частности дискриминантным признакам Наглядное представление взаимосвязей в

виде дискриминантной схемы поучительнее, чем применение критерия значимости или вычисление дистанта.

Здесь нам хотелось бы еще раз подчеркнуть, что многомерный критерий значимости для обсуждаемой здесь проблемы используется при сравнении векторов средних значений Процедура вычислений зависит от того, применяется грубый или уточненный критерий (см. раздел 7.2). Но в данном случае результаты обоих методов различаются мало. Так, упрощенный критерий (формулы дает

уточненный критерии (формулы (7.15)-(7.19)) дает

Размерность дискриминантного пространства

Для раскрытия структуры многомерных взаимосвязей очень важно решить вопрос о числе значимых линейных признаков. Это можно сделать с помощью критерия значимости, который в общей форме уже обсуждался в разделе 5.5. Здесь мы ограничимся описанием -критерия при больших Для проверки гипотезы, соответствует ли последним дискриминантным признакам дистант незначимо отличающийся от нуля, вычисляют статистику

Если вычисленное значение не превосходит критического значения -распределения с степенями свободы, то последние дискриминантных признака следует считать статистически незначимыми.

Чтобы в конкретной задаче найти статистически значимую размерность дискриминантного пространства, нужно проверять упомянутую гипотезу последовательно для Если для получаем значимое отклонение от нуля, и, напротив, для незначимое, то искомая размерность дискриминантного пространства.

Читатель, желающий использовать соответствующий критерий для небольшого числа , должен обратиться к разделу 5.5.

Пример. Для данных о гипертиреозе из раздела 7.1 покажем, что второй характеристический корень незначимо отличается от нуля. А именно расчетное значение в то время как соответствующее критическое значение Для данного примера, располагающего всего лишь 23 векторами наблюдений, -критерий следует рассматривать как подсобное средство.

<< Предыдущий параграф Следующий параграф >>
Оглавление