Байланысты: Статистические методы обработки медико-биологической информации
Назначение и содержание канонического корреляционного анализа. Канонический корреляционный анализ предназначен для изучения связи между входными факторами и выходными параметрами в их совокупности.
Для проведения канонического корреляционного анализа в исходной матрице наблюдений с размерами n×(k+l), где n – число наблюдавшихся объектов, k – число входных факторов и l – число выходных параметров, выделяют две группы переменных:
1. Left set – группа выходных параметров;
2. Right set – группа входных факторов.
Алгоритмом предусмотрено:
1. Определение ограниченного числа канонических переменных обобщающих выходные параметры l-ой группы, и такого же количества канонических переменных, обобщающих входные факторы 2-ой группы. При этом первая пара канонических переменных обобщает наибольшую часть дисперсии переменных, вторая пара - большую долю из оставшейся части дисперсии и т.д. Количество пар канонических переменных зависит от размерности матрицы наблюдений. Практика показала, что 2-3 пар канонических переменных достаточно для надежного представления всей совокупности переменных.
2. Формирование полей рассеяния объектов в координатах первой, второй, третьей пары канонических переменных для 1-ой и 2-ой группы, а после их формирования - расчет канонических коэффициентов корреляции: Саn rl - по паре первых, Саn r2 - по паре вторых, Саn r3 - по паре третьих канонических переменных.
По величине канонических коэффициентов корреляции судят о силе связи между совокупностями входных факторов и выходных параметров. Квадраты коэффициентов (Eigen value) характеризуют степень детерминации совокупности параметров совокупностью факторов для каждой пары канонических переменных. Значимость канонических коэффициентов корреляции детерминации оценивают по -критерию Пирсона. Коэффициенты считают значимыми при вероятности равной и более 0,95 или при уровне значимости р,05;
3. Расчёт факторной структуры канонических переменных (Factor structure), т.е. коэффициентов корреляции, характеризующих направление и силу корреляционной связи канонических переменных с наблюдавшимися входными факторами и выходными параметрами. В результате дается оценка важности входных факторов и информативности выходных параметров.
Такой анализ на начальном этапе исследования позволяет оценить достаточность связи между входными факторами и выходными параметрами с целью построения для них надежных моделей, а также выделить наиболее значимые факторы и информативные параметры откликов на воздействия.