Конечной целью статистического моделирования является нахождение оптимальных условий работы исследуемого объекта, что в большинстве случаев невозможно без получения математической модели этого объекта. Сложность вычислений адекватной модели по пассивным многомерным данным существенно зависит от размерности факторного пространства, а информационная емкость модели самым тесным образом зависит от качества выбранных для моделирования параметров (факторов) исследуемого объекта. Именно стремление сравнительно легко получить модель не только адекватную исходным экспериментальным данным, но и имеющую возможно большую информационную ёмкость заставляет исследователя стремиться сократить размерность факторного пространства до возможного минимума, а среди выбранных значимых факторов иметь наиболее информационно ёмкие.
Первым этапом на пути сокращения размерности факторного пространства является уменьшение количества столбцов таблицы исходных экспериментальных данных до числа плеяд, что можно сделать без существенной потери информации. С этой целью из каждой плеяды выделяется один представитель-фактор, который будем называть существенным, значимым, контролепригодным, в зависимости от решаемой задачи. Остальные факторы плеяды могут быть отброшены как несущественные (второстепенные) или, если они вызывают какой-либо дополнительный интерес, то исследователь легко может найти их уравнения парной корреляции с выделенным существенным фактором.
К сожалению, нет формальных правил для выделения из плеяд значимых факторов, это задача творческая, однако можно порекомендовать следующие приемы.
1. В первую очередь из плеяды надо выделить тот фактор, который имеет самую сильную корреляционную связь с выходным показателем (целевой функцией), поэтому при построении плеяды желательно включать в нее и целевую функцию на правах фактора.
2. Если есть возможность оценить факторы на однородность, как, например, описано в разделе 2.5., то при прочих равных условиях следует отдать предпочтение однородному фактору, то есть фактору, имеющему возможно большую корреляционную зависимость между его значениями, измеренными в разных условиях (по площади пластин, в разное время и т.п.). Можно также отдать предпочтение фактору, имеющему минимальную дисперсию (разброс).
3. Предпочтение следует также отдавать фактору, коэффициент точности которого, описанный в разделе 3.4. , максимален.
4. Если не удается явно выделить один из факторов, то для каждой плеяды можно применить один из экспертных методов ранжирования, описанных в разделе 5, которые позволяют выделить объективную информацию из субъективных высказываний специалистов.
5. При прочих равных условиях предпочтение следует отдавать фактору с лучшими метрологическими характеристиками (легко измерить с высокой точностью).
6. Если речь идет о технологическом процессе, следует отдавать предпочтение факторам, измеряемым на более ранней стадии этого процесса.
7. В обязательном порядке необходимо после выделения значимых факторов вновь составить корреляционную матрицу, введя в нее только выделенные факторы, с целью проверки их некоррелированности (слабой, незначимой коррелированности). Это необходимо потому, что плеяды составляются по самым сильным связям, но при этом возможны случаи, когда в разные плеяды попадают факторы, связанные меньшими, но все же достаточно сильными корреляционными зависимостями. В этих случаях один из факторов следует заменить на другой из той же плеяды и заново проверить вновь образованную матрицу на уровень корреляционных связей между параметрами.
