При планировании эксперимента какие переменные обычно выделяют. Формальное планирование и оценка валидности как условия установления экспериментального эффекта. Основные вопросы, на которые отвечает экспериментальный план

1. История возникновения планирования эксперимента

Планирование эксперимента – продукт нашего времени, однако истоки его теряются в глубине веков.

Истоки планирования эксперимента уходят в глубокую древность и связаны с числовой мистикой, пророчествами и суевериями.

Это собственно не планирование физического эксперимента, а планирование числового эксперимента, т.е. расположение чисел так, чтобы выполнялись некоторые строгие условия, например, на равенство сумм по строкам, столбцам и диагоналям квадратной таблицы, клеточки которой заполнены числами натурального ряда.

Такие условия выполняются в магических квадратах, которым, по-видимому, принадлежит первенство в планировании эксперимента.

Согласно одной легенде примерно в 2200 г. до н.э. китайский император Ю выполнял мистические вычисления с помощью магического квадрата, который был изображен на панцире божественной черепахи.

Квадрат императора Ю

Клетки этого квадрата заполнены числами от 1 до 9, и суммы чисел по строкам, столбцам и главным диагоналям равны 15.

В 1514 г. немецкий художник Альбрехт Дюрер изобразил магический квадрат в правом углу своей знаменитой гравюры-аллегории «Меланхолия». Два числа в нижнем горизонтальном ряду A5 и 14) составляют год создания гравюры. В этом состояло своеобразное «приложение» магического квадрата.

Квадрат Дюрера

В течение нескольких веков построение магических квадратов занимало умы индийских, арабских, немецких, французских математиков.

В настоящее время магические квадраты используются при планировании эксперимента в условиях линейного дрейфа, при планировании экономических расчетов и составлении рационов питания, в теории кодирования и т.д.

Построение магических квадратов является задачей комбинаторного анализа, основы которого в его современном понимании заложены Г. Лейбницем. Он не только рассмотрел и решил основные комбинаторные задачи, но и указал на большое практическое применение комбинаторного анализа: к кодированию и декодированию, к играм и статистике, к логике изобретений и логике геометрии, к военному искусству, грамматике, медицине, юриспруденции, технологии и к комбинации наблюдений. Последняя область применения наиболее близка к планированию эксперимента.

Одной из комбинаторных задач, имеющей прямое отношение к планированию эксперимента, занимался известный петербургский математик Л. Эйлер. В 1779 г. он предложил задачу о 36 офицерах как некоторый математический курьез.

Он поставил вопрос, можно ли выбрать 36 офицеров 6 рангов из 6 полков по одному офицеру каждого ранга от каждого полка и расположить их в каре так, чтобы в каждом ряду и в каждой шеренге было бы по одному офицеру каждого ранга и по одному от каждого полка. Задача эквивалентна построению парных ортогональных 6x6 квадратов. Оказалось, что эту задачу решить невозможно. Эйлер высказал предположение, что не существует пары ортогональных квадратов порядка п=1 (mod 4).

Задачей Эйлера, в частности, и латинскими квадратами вообще занимались впоследствии многие математики, однако почти никто из них не задумывался над практическим применением латинских квадратов.

В настоящее время латинские квадраты являются одним из наиболее популярных способов ограничения на рандомизацию при наличии источников неоднородностей дискретного типа в планировании эксперимента. Группировка элементов латинского квадрата, благодаря своим свойствам (каждый элемент появляется один и только один раз в каждой строке и в каждом столбце квадрата), позволяет защитить главные эффекты от влияния источника неоднородностей. Широко используются латинские квадраты и как средство сокращения перебора в комбинаторных задачах.

Возникновение современных статистических методов планирования эксперимента связано с именем Р. Фишера.

С 1918 г. он начал свою известную серию работ на Рочемстедской агробиологической станции в Англии. В 1935 г. появилась его монография «Design of Experiments», давшая название всему направлению.

Среди методов планирования первым был дисперсионный анализ (кстати, Фишеру принадлежит и термин «дисперсия»). Фишер создал основы этого метода, описав полные классификации дисперсионного анализа (однофакторный и многофакторный эксперименты) и неполные классификации дисперсионного анализа без ограничения и с ограничением на рандомизацию. При этом он широко использовал латинские квадраты и блок-схемы. Вместе с Ф. Йетсом он описал их статистические свойства. В 1942 г. А. Кишен рассмотрел планирование по латинским кубам, которое явилось дальнейшим развитием теории латинских квадратов.

Затем Р. Фишер независимо опубликовал сведения об ортогональных гипер-греко-латинских кубах и гипер-кубах. Вскоре после этого 1946–1947 гг.) Р. Рао рассмотрел их комбинаторные свойства. Дальнейшему развитию теории латинских квадратов посвящены работы X. Манна A947–1950 гг.).

Исследования Р. Фишера, проводившиеся в связи с работами по агробиологии, знаменуют начало первого этапа развития методов планирования эксперимента. Фишер разработал метод факторного планирования. Йегс предложил для этого метода простую вычислительную схему. Факторное планирование получило широкое распространение. Особенностью полного факторного эксперимента является необходимость ставить сразу большое число опытов.

В 1945 г. Д. Финни ввел дробные реплики от факторного эксперимента. Это позволило резко сократить число опытов и открыло дорогу техническим приложениям планирования. Другая возможность сокращения необходимого числа опытов была показана в 1946 г. Р. Плакеттом и Д. Берманом, которые ввели насыщенные факторные планы.

В 1951 г. работой американских ученых Дж. Бокса и К. Уилсона начался новый этап развития планирования эксперимента.

Эта работа подытожила предыдущие. В ней ясно сформулирована и доведена до практических рекомендаций идея последовательного экспериментального определения оптимальных условий проведения процессов с использованием оценки коэффициентов степенных разложений методом наименьших квадратов, движения по градиенту и отыскания интерполяционного полинома (степенного ряда) в области экстремума функции отклика («почти стационарной» области).

В 1954–1955 гг. Дж. Бокс, а затем Дж. Бокс и П. Юл показали, что планирование эксперимента можно использовать при исследовании физико-химических механизмов процессов, если априори высказаны одна или несколько возможных гипотез. Здесь планирование эксперимента пересекалось с исследованиями по химической кинетике. Интересно отметить, что кинетику можно рассматривать как метод описания процесса с помощью дифференциальных уравнений, традиции которого восходят к И. Ньютону. Описание процесса дифференциальными уравнениями, называемое детерминистическим, нередко противопоставляется статистическим моделям.

Бокс и Дж. Хантер сформулировали принцип ротатабельности для описания «почти стационарной» области, развивающейся в настоящее время в важную ветвь теории планирования эксперимента. В той же работе показана возможность планирования с разбиением на ортогональные блоки, указанная ранее независимо де Бауном.

Дальнейшим развитием этой идеи было планирование, ортогональное к неконтролируемому временному дрейфу, которое следует рассматривать как важное открытие в экспериментальной технике – значительное увеличение возможностей экспериментатора.


2. Математическое планирование эксперимента в научных исследованиях

2.1 Основные понятия и определения

Под экспериментом будем понимать совокупность операций совершаемых над объектом исследования с целью получения информации о его свойствах. Эксперимент, в котором исследователь по своему усмотрению может изменять условия его проведения, называется активным экспериментом. Если исследователь не может самостоятельно изменять условия его проведения, а лишь регистрирует их, то это пассивный эксперимент.

Важнейшей задачей методов обработки полученной в ходе эксперимента информации является задача построения математической модели изучаемого явления, процесса, объекта. Ее можно использовать и при анализе процессов и при проектировании объектов. Можно получить хорошо аппроксимирующую математическую модель, если целенаправленно применяется активный эксперимент. Другой задачей обработки полученной в ходе эксперимента информации является задача оптимизации, т.е. нахождения такой комбинации влияющих независимых переменных, при которой выбранный показатель оптимальности принимает экстремальное значение.

Опыт – это отдельная экспериментальная часть.

План эксперимента – совокупность данных определяющих число, условия и порядок проведения опытов.

Планирование эксперимента – выбор плана эксперимента, удовлетворяющего заданным требованиям, совокупность действий направленных на разработку стратегии экспериментирования (от получения априорной информации до получения работоспособной математической модели или определения оптимальных условий). Это целенаправленное управление экспериментом, реализуемое в условиях неполного знания механизма изучаемого явления.

В процессе измерений, последующей обработки данных, а также формализации результатов в виде математической модели, возникают погрешности и теряется часть информации, содержащейся в исходных данных. Применение методов планирования эксперимента позволяет определить погрешность математической модели и судить о ее адекватности. Если точность модели оказывается недостаточной, то применение методов планирования эксперимента позволяет модернизировать математическую модель с проведением дополнительных опытов без потери предыдущей информации и с минимальными затратами.

Цель планирования эксперимента – нахождение таких условий и правил проведения опытов при которых удается получить надежную и достоверную информацию об объекте с наименьшей затратой труда, а также представить эту информацию в компактной и удобной форме с количественной оценкой точности.

Пусть интересующее нас свойство (Y) объекта зависит от нескольких (n ) независимых переменных (Х 1 , Х 2 , …, Х n ) и мы хотим выяснить характер этой зависимости – Y=F(Х 1 , Х 2 , …, Х n) , о которой мы имеем лишь общее представление. Величина Y – называется «отклик», а сама зависимость Y=F(Х 1 , Х 2 , …, Х n) – «функция отклика».

Отклик должен быть определен количественно. Однако могут встречаться и качественные признаки Y . В этом случае возможно применение рангового подхода. Пример рангового подхода – оценка на экзамене, когда одним числом оценивается сложный комплекс полученных сведений о знаниях студента.

Независимые переменные Х 1 , Х 2 , …, Х n – иначе факторы, также должны иметь количественную оценку. Если используются качественные факторы, то каждому их уровню должно быть присвоено какое-либо число. Важно выбирать в качестве факторов лишь независимые переменные, т.е. только те которые можно изменять, не затрагивая другие факторы. Факторы должны быть однозначными. Для построения эффективной математической модели целесообразно провести предварительный анализ значимости факторов (степени влияния на функцию), их ранжирование и исключить малозначащие факторы.

Диапазоны изменения факторов задают область определения Y . Если принять, что каждому фактору соответствует координатная ось, то полученное пространство называется факторным пространством. При n=2 область определения Y представляется собой прямоугольник, при n=3 – куб, при n >3 – гиперкуб.

При выборе диапазонов изменения факторов нужно учитывать их совместимость, т.е. контролировать, чтобы в этих диапазонах любые сочетания факторов были бы реализуемы в опытах и не приводили бы к абсурду. Для каждого из факторов указывают граничные значения

, i =1,… n .

Регрессионный анализ функции отклика предназначен для получения ее математической модели в виде уравнения регрессии

где В 1 , …, В m – некоторые коэффициенты; е – погрешность.

Среди основных методов планирования, применяемых на разных этапах исследования, используют:

· планирование отсеивающего эксперимента, основное значение которого выделение из всей совокупности факторов группы существенных факторов, подлежащих дальнейшему детальному изучению;

· планирование эксперимента для дисперсионного анализа, т.е. составление планов для объектов с качественными факторами;

· планирование регрессионного эксперимента, позволяющего получать регрессионные модели (полиномиальные и иные);

· планирование экстремального эксперимента, в котором главная задача – экспериментальная оптимизация объекта исследования;

· планирование при изучении динамических процессов и т.д.

Инициатором применения планирования эксперимента является Рональд А. Фишер, другой автор известных первых работ – Френк Йетс. Далее идеи планирования эксперимента формировались в трудах Дж. Бокса, Дж. Кифера. В нашей стране – в трудах Г.К. Круга, Е.В. Маркова и др.

В настоящее время методы планирования эксперимента заложены в специализированных пакетах, широко представленных на рынке программных продуктов, например: StatGrapfics, Statistica, SPSS, SYSTAT и др.

2.2 Представление результатов экспериментов

При использовании методов планирования эксперимента необходимо найти ответы на 4 вопроса:

· Какие сочетания факторов и сколько таких сочетаний необходимо взять для определения функции отклика?

· Как найти коэффициенты В 0 , В 1 , …, B m ?

· Как оценить точность представления функции отклика?

· Как использовать полученное представление для поиска оптимальных значений Y ?

Геометрическое представление функции отклика в факторном пространстве Х 1 , Х 2 , …, Х n называется поверхностью отклика (рис. 1).


Рис. 1. Поверхность отклика

Если исследуется влияние на Y лишь одного фактора Х 1 , то нахождение функции отклика – достаточно простая задача. Задавшись несколькими значениями этого фактора, в результате опытов получаем соответствующие значения Y и график Y =F(X) (рис. 2).

Рис. 2. Построение функции отклика одной переменной по опытным данным

По его виду можно подобрать математическое выражение функции отклика. Если мы не уверены, что опыты хорошо воспроизводятся, то обычно опыты повторяют несколько раз и получают зависимость с учетом разброса опытных данных.

Если факторов два, то необходимо провести опыты при разных соотношениях этих факторов. Полученную функцию отклика в 3 х -мерном пространстве (рис. 1) можно анализировать, проводя ряд сечений с фиксированными значениями одного из факторов (рис. 3). Вычлененные графики сечений можно аппроксимировать совокупностью математических выражений.

Рис. 3. Сечения поверхности отклика при фиксированных откликах (а) и переменных (б, в)

При трех и более факторах задача становится практически неразрешимой. Если и будут найдены решения, то использовать совокупность выражений достаточно трудно, а часто и не реально.

2.3 Применение математического планирования эксперимента в научных исследованиях

В современной математической теории оптимального планирования эксперимента существует 2 основных раздела:

1. планирование эксперимента для изучения механизмов сложных процессов и свойств многокомпонентных систем.

2. планирование эксперимента для оптимизации технологических процессов и свойств многокомпонентных систем.

Планирование эксперимента – это выбор числа опытов и условий их проведения необходимых и достаточных для решения поставленной задачи с требуемой точностью.

Эксперимент, который ставится для решений задач оптимизации, называется экстремальным. Примерами задач оптимизации являются выбор оптимального состава многокомпонентных смесей, повышение производительности действующей установки, повышение качества продукции и снижение затрат на её получение. Прежде чем планировать эксперимент необходимо сформулировать цель исследования. От точной формулировки цели зависит успех исследования. Необходимо также удостовериться, что объект исследования соответствует предъявляемым ему требованиям. В технологическом исследовании целью исследования при оптимизации процесса чаще всего является повышение выхода продукта, улучшение качества, снижение себестоимости.

Эксперимент может проводиться непосредственно на объекте или на его модели. Модель отличается от объекта не только масштабом, а иногда природой. Если модель достаточно точно описывает объект, то эксперимент на объекте может быть перенесён на модель. Для описания понятия «объект исследования» можно использовать представление о кибернетической системе, которая носит название чёрный ящик.


Стрелки справа изображают численные характеристики целей исследования и называются выходными параметрами ( y ) или параметрами оптимизации .

Для проведения эксперимента необходимо воздействовать на поведение чёрного ящика. Все способы воздействия обозначаются через «x» и называются входными параметрами или факторами . Каждый фактор может принимать в опыте одно из нескольких значений, и такие значения называются уровнями . Фиксированный набор уровней и факторов определяет одно из возможных состояний чёрного ящика, одновременно они являются условиями проведения одного из возможных опытов. Результаты эксперимента используются для получения математической модели объекта исследования. Использование для объекта всех возможных опытов приводит к абсурдно большим экспериментам. В связи с этим эксперименты необходимо планировать.

Задачей планирования является выбор необходимых для эксперимента опытов, методов математической обработки их результатов и принятия решений. Частный случай этой задачи – планирование экстремального эксперимента. То есть эксперимента поставленного с целью поиска оптимальных условий функционирования объекта. Таким образом, планирование экстремального эксперимента – это выбор количества и условий проведения опытов, минимально необходимых для отыскания оптимальных условий. При планировании эксперимента объект исследования должен обладать обязательными свойствами:

1.управляемым

2.результаты эксперимента должны быть воспроизводимыми.

Эксперимент называется воспроизводимым , если при фиксированных условиях опыта получается один и тот же выход в пределах заданной относительно небольшой ошибки эксперимента (2%-5%). Эксперимент проводят при выборе некоторых уровней для всех факторов, затем он повторяется через неравные промежутки времени. И значения параметров оптимизации сравниваются. Разброс этих параметров характеризует воспроизводимость результатов. Если он не превышает заранее заданной величины, то объект удовлетворяет требованию воспроизводимости результатов.

При планировании эксперимента активное вмешательство предполагает процесс и возможность выбора в каждом опыте тех факторов, которые представляют интерес. Экспериментальное исследование влияния входных параметров (факторов) на выходные может производиться методом пассивного или активного эксперимента. Если эксперимент сводится к получению результатов наблюдения за поведение системы при случайных изменениях входных параметров, то он называется пассивным . Если же при проведении эксперимента входные параметры изменяются по заранее заданному плану, то такой эксперимент называется активным. Объект, на котором возможен активный эксперимент, называется управляемым. На практике не существует абсолютно управляемых объектов. На реальный объект обычно действуют как управляемый, так и неуправляемый факторы. Неуправляемые факторы действуют на воспроизводимость эксперимента. Если все факторы неуправляемы, возникает задача установления связи между параметром оптимизации и факторами по результатам наблюдений или по результатам пассивного эксперимента. Возможна также плохая воспроизводимость изменения факторов во времени.


3. Параметры оптимизации

3.1 Виды параметров оптимизации

Параметр оптимизации – это признак, по которому мы хотим оптимизировать процесс. Он должен быть количественным, задаваться числом. Множество значений, которые может принимать параметр оптимизации, называется областью его определения. Области определения могут быть непрерывными и дискретными, ограниченными и неограниченными. Например, выход реакции – это параметр оптимизации с непрерывной ограниченной областью определения. Он может изменяться в интервале от 0 до 100%. Число бракованных изделий, число кровяных телец в пробе крови – вот примеры параметров с дискретной областью определения, ограниченной снизу.

В зависимости от объекта и цели исследования параметры оптимизации могут быть весьма разнообразными (рис. 1).

Прокомментируем некоторые элементы схемы. Экономические параметры оптимизации, такие, как прибыль, себестоимость и рентабельность, обычно используются при исследовании действующих промышленных объектов, тогда как затраты на эксперимент имеет смысл оценивать в любых исследованиях, в том числе и лабораторных. Если цена опытов одинакова, затраты на эксперимент» пропорциональны числу опытов, которые необходимо поставить для решения данной задачи. Это в значительной мере определяет выбор плана эксперимента.

Среди технико-экономических параметров наибольшее распространение имеет производительность. Такие параметры, как долговечность, надежность и стабильность, связаны с длительными наблюдениями. Имеется некоторый опыт их использования при изучении дорогостоящих ответственных объектов, например радиоэлектронной аппаратуры.

Почти во всех исследованиях приходится учитывать количество и качество получаемого продукта. Как меру количества продукта используют выход, например, процент выхода готовой продукции.

Показатели качества чрезвычайно разнообразны. В нашей схеме они сгруппированы по видам свойств. Характеристики количества и качества продукта образуют группу технико-технологических параметров.

В группе «прочие» сгруппированы различные параметры, которые реже встречаются, но не являются менее важными. Сюда попали статистические параметры, используемые для улучшения характеристик случайных величин или случайных функций.

3.2 Требования к параметру оптимизации

Параметр оптимизации – это признак, по которому мы хотим оптимизировать процесс. Он должен быть количественным, задаваться числом. Мы должны уметь его измерять при любой возможной комбинации выбранных уровней факторов. Множество значений, которые может принимать параметр оптимизации, будем называть областью его определения. Области определения могут быть непрерывными и дискретными, ограниченными и неограниченными. Например, выход реакции – это параметр оптимизации с непрерывной ограниченной областью определения. Он может изменяться в интервале от 0 до 100%. Число бракованных изделий, число зерен на шлифе сплава, число кровяных телец в пробе крови – вот примеры параметров с дискретной областью определения, ограниченной снизу.

Уметь измерять параметр оптимизации – это значит располагать подходящим прибором. В ряде случаев такого прибора может не существовать или он слишком дорог. Если нет способа количественного измерения результата, то приходится воспользоваться приемом, называемым ранжированием (ранговым подходом). При этом параметрам оптимизации присваиваются оценки – ранги по заранее выбранной шкале: двухбалльной, пятибалльной и т.д. Ранговый параметр имеет дискретную ограниченную область определения. В простейшем случае область содержит два значения (да, нет; хорошо, плохо). Это может соответствовать, например, годной продукции и браку.

Ранг – это количественная оценка параметра оптимизации, но она носит условный (субъективный) характер. Мы ставим в соответствие качественному признаку некоторое число – ранг. Для каждого физически измеряемого параметра оптимизации можно построить ранговый аналог. Потребность в построении такого аналога возникает, если имеющиеся в распоряжении исследователя численные характеристики неточны или неизвестен способ построения удовлетворительных численных оценок. При прочих равных условиях всегда нужно отдавать предпочтение физическому измерению, так как ранговый подход менее чувствителен и с его помощью трудно изучать тонкие эффекты.

Пример: Технолог разработал новый вид продукта. Вам необходимо оптимизировать этот процесс.

Цель процесса – получение вкусного продукта, но такая формулировка цели еще не дает возможности приступить к оптимизации: необходимо выбрать количественный критерий, характеризующий степень достижения цели. Можно принять следующее решение: очень вкусный продукт получает отметку 5, просто вкусный продукт – отметку 4 и т.д.

Можно ли после такого решения переходить к оптимизации процесса? Нам важно количественно оценить результат оптимизации. Решает ли отметка эту задачу? Конечно, потому что, как мы договорились, отметка 5 соответствует очень вкусному продукту и т.д. Другое дело, что этот подход, называемый ранговым, часто оказывается грубым, нечувствительным. Но возможности такой количественной оценки результатов не должна вызывать сомнений.

Следующее требование: параметр оптимизации должен выражаться одним числом. Например: регистрация показания прибора.

Еще одно требование, связанное с количественной природой параметра оптимизации, – однозначность в статистическом смысле. Заданному набору значений факторов должно соответствовать одно с точностью до ошибки эксперимента значение параметра оптимизации. (Однако обратное неверно: одному и тому же значению параметра могут соответствовать разные наборы значений факторов.)

Для успешного достижения цели исследования необходимо, чтобы параметр оптимизации действительно оценивал эффективность функционирования системы в заранее выбранном смысле. Это требование является главным, определяющим корректность постановки задачи.

Представление об эффективности не остается постоянным в ходе исследования. Оно меняется по мере накопления информации и в зависимости от достигнутых результатов. Это приводит к последовательному подходу при выборе параметра оптимизации. Так, например, на первых стадиях исследования технологических процессов в качестве параметра оптимизации часто используется выход продукта. Однако в дальнейшем, когда возможность повышения выхода исчерпана, нас начинают интересовать такие параметры, как себестоимость, чистота продукта и т.д.

Говоря об оценке эффективности функционирования системы, важно помнить, что речь идет о системе в целом. Часто система состоит из ряда подсистем, каждая из которых может оцениваться своим локальным параметром оптимизации.

Следующее требование к параметру оптимизации – требование универсальности или полноты. Под универсальностью параметра оптимизации понимается его способность всесторонне характеризовать объект. В частности, технологические параметры оптимизации недостаточно универсальны: они не учитывают экономику. Универсальностью обладают, например, обобщенные параметры оптимизации, которые строятся как функции от нескольких частных параметров.

Желательно, чтобы параметр оптимизации имел физический смысл, был простым и легко вычисляемым.

Требование физического смысла связано с последующей интерпретацией результатов эксперимента.

Таким образом, параметр оптимизации должен быть:

– эффективным с точки зрения достижения цели;

– универсальным;

– количественным и выражаться одним числом;

– статистически эффективным;

– имеющим физический смысл, простым и легко вычисляемым.

В тех случаях, когда возникают трудности с количественной оценкой параметров оптимизации, приходится обращаться к ранговому подходу. В ходе исследования могут меняться априорные представления об объекте исследования, что приводит к последовательному подходу при выборе параметра оптимизации.

Из многих параметров, характеризующих объект исследования, только один, часто обобщенный, может служить параметром оптимизации. Остальные рассматриваются как ограничения.


4. Факторы оптимизации

4.1 Определение фактора

Фактором называется измеряемая переменная величина, принимающая в некоторый момент времени определенное значение. Факторы соответствуют способам воздействия на объект исследования.

Так же, как и параметр оптимизации, каждый фактор имеет область определения. Фактор считают заданным, если вместе с его названием указана область его определения.

Под областью определения понимается совокупность всех значений, которые в принципе может принимать данный фактор.

Совокупность значений фактора, которая используется в эксперименте, является подмножеством из множества значений, образующих область определения. Область определения может быть непрерывной и дискретной. Однако в основном, в задачах планирования эксперимента, используются дискретные области определения. Так, для факторов с непрерывной областью определения, таких, как температура, время, количество вещества и т.п., всегда выбираются дискретные множества уровней.

В практических задачах области определения факторов, как правило, ограничены. Ограничения могут носить принципиальный либо технический характер.

Факторы классифицируют в зависимости от того, является ли фактор переменной величиной, которую можно оценивать количественно: измерять, взвешивать, титровать и т.п., или же он – некоторая переменная, характеризующаяся качественными свойствами.

Факторы разделяются на количественные и качественные.

Качественные факторы – это разные вещества, разные технологические способы, аппараты, исполнители и т.д.

Хотя качественным факторам не соответствует числовая шкала в том смысле, как это понимается для количественных факторов, однако можно построить условную порядковую шкалу, которая ставит в соответствие уровням качественного фактора числа натурального ряда, т.е. производит кодирование. Порядок уровней может быть произволен, но после кодирования он фиксируется.

Качественным факторам не соответствует числовая шкала, и порядок уровней факторов не играет роли.

Время реакции, температура, концентрация реагирующих веществ, скорость подачи веществ, величина рН – это примеры наиболее часто встречающихся количественных факторов. Различные реагенты, адсорбенты, вулканизующие агенты, кислоты, металлы являются примером уровней качественных факторов.

4.2 Требования, предъявляемые к факторам при планировании эксперимента

При планировании эксперимента факторы должны быть управляемыми. Это значит, что экспериментатор, выбрав нужное значение фактора, может его поддерживать постоянным в течение всего опыта, т.е. может управлять фактором. Планировать эксперимент можно только в том случае, если уровни факторов подчиняются воле экспериментатора.

Пример: Вы изучаете процесс синтеза аммиака. Колонна синтеза установлена на открытой площадке. Является ли температура воздуха фактором, который можно включить в планирование эксперимента?

Температура воздуха – фактор неуправляемый. Мы еще не научились делать погоду по заказу. А в планировании могут участвовать только те факторы, которыми можно управлять, – устанавливать и поддерживать на выбранном уровне в течение опыта или менять по заданной программе. Температурой окружающей среды в данном случае управлять невозможно. Ее можно только контролировать.

Чтобы точно определить фактор, нужно указать последовательность действий (операций), с помощью которых устанавливаются его конкретные значения (уровни). Такое определение фактора будем называть операциональным. Так, если фактором является давление в некотором аппарате, то совершенно необходимо указать, в какой точке и с помощью какого прибора оно измеряется и как оно устанавливается. Введение операционального определения обеспечивает однозначное понимание фактора.

С операциональным определением связаны выбор размерности фактора и точность его фиксирования.

Точность замера факторов должна быть возможно более высокой. Степень точности определяется диапазоном изменения факторов. При изучении процесса, который длится десятки часов, нет необходимости учитывать доли минуты, а в быстрых процессах необходимо учитывать, быть может, доли секунды.

Факторы должны быть непосредственными воздействиями на объект. Факторы должны быть однозначны. Трудно управлять фактором, который, является функцией других факторов. Но в планировании могут участвовать сложные факторы, такие, как соотношения между компонентами, их логарифмы и т.п.

При планировании эксперимента обычно одновременно изменяется несколько факторов. Поэтому очень важно сформулировать требования, которые предъявляются к совокупности факторов. Прежде всего выдвигается требование совместимости. Совместимость факторов означает, что все их комбинации осуществимы и безопасны. Это очень важное требование.

При планировании эксперимента важна независимость факторов, т.е. возможность установления фактора на любом уровне вне зависимости от уровней других факторов. Если это условие невыполнимо, то невозможно планировать эксперимент.

Таким образом, установили, что факторы – это переменные величины, соответствующие способам воздействия внешней среды на объект.

Они определяют как сам объект, так и его состояние. Требования к факторам: управляемость и однозначность.

Управлять фактором – это значит установить нужное значение и поддерживать его постоянным в течение опыта или менять по заданной программе. В этом состоит особенность «активного» эксперимента. Планировать эксперимент можно только в том случае, если уровни факторов подчиняются воле экспериментатора.

Факторы должны непосредственно воздействовать на объект исследования.

Требования к совокупности факторов: совместимость и отсутствие линейной корреляции. Выбранное множество факторов должно быть достаточно полным. Если какой-либо существенный фактор пропущен, это приведет к неправильному определению оптимальных условий или к большой ошибке опыта. Факторы могут быть количественными и качественными.


5. Ошибки опыта

Изучение всех влияющих на исследуемый объект факторов одновременно провести невозможно, поэтому в эксперименте рассматривается их ограниченное число. Остальные активные факторы стабилизируются, т.е. устанавливаются на каких-то одинаковых для всех опытов уровнях.

Некоторые факторы не могут быть обеспечены системами стабилизации (например, погодные условия, самочувствие оператора и т.д.), другие же стабилизируются с какой-то погрешностью (например, содержание какого-либо компонента в среде зависит от ошибки при взятии навески и приготовления раствора). Учитывая также, что измерение параметра у осуществляется прибором, обладающим какой-то погрешностью, зависящей от класса точности прибора, можно прийти к выводу, что результаты повторностей одного и того же опыта у к будут приближенными и должны отличаться один от другого и от истинного значения выхода процесса. Неконтролируемое, случайное изменение и множества других влияющих на процесс факторов вызывает случайные отклонения измеряемой величины у к от ее истинного значения – ошибку опыта.

Каждый эксперимент содержит элемент неопределенности вследствие ограниченности экспериментального материала. Постановка повторных (или параллельных) опытов не дает полностью совпадающих результатов, потому что всегда существует ошибка опыта (ошибка воспроизводимости). Эту ошибку и нужно оценить по параллельным опытам. Для этого опыт воспроизводится по возможности в одинаковых условиях несколько раз и затем берется среднее арифметическое всех результатов. Среднее арифметическое у равно сумме всех n отдельных результатов, деленной на количество параллельных опытов n:


Отклонение результата любого опыта от среднего арифметического можно представить как разность y 2 – , где y 2 – результат отдельного опыта. Наличие отклонения свидетельствует об изменчивости, вариации значений повторных опытов. Для измерения этой изменчивости чаще всего используют дисперсию.

Дисперсией называется среднее значение квадрата отклонений величины от ее среднего значения. Дисперсия обозначается s 2 и выражается формулой:

где (n-1) – число степеней свободы, равное количеству опытов минус единица. Одна степень свободы использована для вычисления среднего.

Корень квадратный из дисперсии, взятый с положительным знаком, называется средним квадратическим отклонением, стандартом или квадратичной ошибкой:

Ошибка опыта является суммарной величиной, результатом многих ошибок: ошибок измерений факторов, ошибок измерений параметра оптимизации и др. Каждую из этих ошибок можно, в свою очередь, разделить на составляющие.

Все ошибки принято разделять на два класса: систематические и случайные (рисунок 1).

Систематические ошибки порождаются причинами, действующими регулярно, в определенном направлении. Чаще всего эти ошибки можно изучить и определить количественно. Систематическая ошибка – это ошибка, которая остаётся постоянно или закономерно изменяется при повторных измерениях одной и той же величины. Эти ошибки появляются вследствие неисправности приборов, неточности метода измерения, какого либо упущения экспериментатора, либо использования для вычисления неточных данных. Обнаружить систематические ошибки, а также устранить их во многих случаях нелегко. Требуется тщательный разбор методов анализа, строгая проверка всех измерительных приборов и безусловное выполнение выработанных практикой правил экспериментальных работ. Если систематические ошибки вызваны известными причинами, то их можно определить. Подобные погрешности можно устранить введением поправок.

Систематические ошибки находят, калибруя измерительные приборы и сопоставляя опытные данные с изменяющимися внешними условиями (например, при градуировке термопары по реперным точкам, при сравнении с эталонным прибором). Если систематические ошибки вызываются внешними условиями (переменной температуры, сырья и т.д.), следует компенсировать их влияние.

Случайными ошибками называются те, которые появляются нерегулярно, причины, возникновения которых неизвестны и которые невозможно учесть заранее. Случайные ошибки вызываются и объективными причинами и субъективными. Например, несовершенством приборов, их освещением, расположением, изменением температуры в процессе измерений, загрязнением реактивов, изменением электрического тока в цепи. Когда случайная ошибка больше величины погрешности прибора, необходимо многократно повторить одно и тоже измерение. Это позволяет сделать случайную ошибку сравнимой с погрешностью вносимой прибором. Если же она меньше погрешности прибора, то уменьшать её нет смысла. Такие ошибки имеют значение, которое отличается в отдельных измерениях. Т.е. их значения могут быть неодинаковыми для измерений сделанных даже в одинаковых условиях. Поскольку причины, приводящие к случайным ошибкам неодинаковы в каждом эксперименте, и не могут быть учтены, поэтому исключить случайные ошибки нельзя, можно лишь оценить их значения. При многократном определении какого-либо показателя могут встречаться результаты, которые значительно отличаются от других результатов той же серии. Они могут быть следствием грубой ошибки, которая вызвана невнимательностью экспериментатора.

Систематические и случайные ошибки состоят из множества элементарных ошибок. Для того чтобы исключать инструментальные ошибки, следует проверять приборы перед опытом, иногда в течение опыта и обязательно после опыта. Ошибки при проведении самого опыта возникают вследствие неравномерного нагрева реакционной среды, разного способа перемешивания и т.п.

При повторении опытов такие ошибки могут вызвать большой разброс экспериментальных результатов.

Очень важно исключить из экспериментальных данных грубые ошибки, так называемый брак при повторных опытах. Грубые ошибки легко обнаружить. Для выявления ошибок необходимо произвести измерения в других условиях или повторить измерения через некоторое время. Для предотвращения грубых ошибок нужно соблюдать аккуратность в записях, тщательность в работе и записи результатов эксперимента. Грубая ошибка должна быть исключена из экспериментальных данных. Для отброса ошибочных данных существуют определённые правила.

Например, используют критерий Стьюдента t(Р; f): Опыт считается бракованным, если экспериментальное значение критерия t по модулю больше табличного значения t(Р; f).

Если в распоряжении исследователя имеется экспериментальная оценка дисперсии S 2 (y k) с небольшим конечным числом степеней свободы, то доверительные ошибки рассчитываются с помощью критерий Стьюдента t(Р; f):

ε() = t (Р; f)* S(y k)/ = t (Р; f)* S()

ε(y k) = t(Р; f)* S(y k)


6. Результат прямого измерения – случайная величина, подчиняющаяся нормальному закону распределения

Результаты, которые получаются при экспериментальном исследовании какого-либо технологического процесса, зависят от целого ряда факторов. Поэтому результат исследования является случайной величиной, распределённой по нормальному закону распределения. Оно названо нормальным, т. к. именно это распределение для случайной величины является обычным и называется гаусовским или лапласским. Под распределением случайной величины понимают совокупность всех возможных значений случайной величины и соответствующих им вероятностей.

Законом распределения случайной величины называется всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующим им вероятностям.

При экспериментальном исследовании какого-либо технологического процесса измеряемый результат последнего является случайной величиной, на которую оказывает влияние огромное число факторов (изменение погодных условий, самочувствие оператора, неоднородность сырья, влияние износа измерительной и стабилизирующей аппаратуры и т.д. и т.п.). Именно поэтому результат исследования является случайной величиной, распределенной по нормальному закону. Однако если исследователь какой-либо активный фактор не заметил или отнес его к неактивным, а неконтролируемое изменение этого фактора может вызвать несоразмерно большое изменение эффективности процесса и параметра, характеризующего эту эффективность, то распределение вероятности последнего может нормальному закону не подчиниться.

Точно так же приведет к нарушению нормальности закона распределения наличие в массиве экспериментальных данных грубых ошибок. Именно поэтому в первую очередь проводят анализ на наличие в экспериментальных данных грубых ошибок с принятой доверительной вероятностью.

Случайная величина будет распределена по нормальному закону, если она представляет собой сумму очень большого числа взаимно зависимых случайных величин, влияния каждой из которых ничтожно мало. Если измерения искомой величины y проведены много раз, то результат можно наглядно представить, построив диаграмму, которая показывала бы, как часто получались те или иные значения. Такая диаграмма называется гистограммой. Что бы построить гистограмму нужно разбить весь диапазон измеренных значений на равные интервалы. И посчитать сколько раз каждая величина попадает в каждый интервал.

Если измерения продолжать до тех пор, пока число измеренных значений n не станет очень большим, то ширину интервала можно сделать очень малой. Гистограмма перейдёт в непрерывную прямую, которая называется кривой распределения .

В основе теории случайных ошибок лежат два предположения:

1.при большом числе измерений случайные погрешности одинаково велики, но с разными знаками встречаются одинаково часто;

2.большие (по абсолютной величине) погрешности встречаются реже, чем малые. Т. е. вероятность появления погрешности уменьшается с ростом её величины.

Согласно закону больших чисел при бесконечно большом числе измерений n, истинное значение измеряемой величины y равно среднеарифметическому значению всех результатов измерений ỹ

Для всех m-повторностей можно записать:

Разделив это уравнение на число повторностей m, получим после подстановки:

За экспериментальную оценку истинного значения (математического ожидания) критерия оптимальности у принимается среднеарифметическая оценка результатов всех т повторностей:

Если число m велико (m→∞), то будет справедливо равенство:

Таким образом, при бесконечно большом числе измерений истинное значение измеряемой величины y равно среднеарифметическому значению ỹ всех результатов произведённых измерений: y═ỹ, при m→∞.

При ограниченном числе измерений (m≠∞) среднеарифметическое значение y будет отличаться от истинного значения, т.е. равенство y═ỹ будет неточным, а приближённым: y≈ỹ и величину этого расхождения необходимо оценить.

Если в распоряжении исследователя имеется только единичный результат измерения y k , то оценка истинного значения измеряемой величины будет менее точной. чем среднеарифметическая оценка при любом числе повторностей: |y─ỹ|<|y-yk|.

Появление того или иного значения yk в процессе измерения является случайным событием. Функция плотности нормального распределения случайной величины характеризуется двумя параметрами:

· истинным значением y;

· среднеквадратичным отклонением σ.

Рисунок – 1а – кривая плотности нормального распределения; 1б –кривая плотности вероятности нормально распределенной случайной величины при различных дисперсиях

Плотность нормального распределения (рис. 1а) симметрична относительно y и достигает максимального значения при yk= y, стремится к 0 при увеличении.

Квадрат среднеквадратичного отклонения называется дисперсией случайной величины и является количественной характеристикой разброса результатов вокруг истинного значения y. Мера рассеяния результатов отдельных измерений yk от среднего значения ỹ должна выражаться в тех же единицах, то и значения измеряемой величины. В связи с этим в качестве показателя разброса гораздо чаще используют величину σ:

Значения этой величины определяют форму кривой распределения py. Площади под тремя кривыми одинаковы, но при малых значения σ кривые идут более круто и имеют большее значение py. С увеличением σ значение py уменьшается и кривая распределения растягивается вдоль оси y. Т.о. кривая 1 характеризует плотность распределения случайной величины, воспроизводимость которой в повторных измерениях лучше, чем воспроизводимость случайных величин имеющих плотность распределения 2, 4. На практике не возможно произвести слишком много замеров. Поэтому нельзя построить нормальное распределение, чтобы точно определить истинное значение y. В этом случае хорошим приближением к истинному значению можно считать ỹ, а достаточно точной оценкой ошибки выборочную дисперсию ρ²n, вытекающую из закона распределения, но относящуюся к конечному числу измерения. Такое название величины ρ²n объясняется тем, что из всего множества возможных значений yk, т.е. из генеральной совокупности выбирают лишь конечное число значений равное m, называемых выборкой, которая характеризуется выборочным средним значением и выборочной дисперсией.


7. Экспериментальные оценки истинных значений измеряемой случайной величины и её среднеквадратичного отклонения

Если в распоряжении исследователя находится конечное число независимых результатов повторности одного и того же опыта, то он может получить лишь экспериментальные оценки истинного значения и дисперсии результата опыта.

Оценки должны обладать следующими свойствами:

1.Несмещённости, проявляющейся в том, что теоретическое среднее совпадает с истинным значением измеряемого параметра.

2.Состоятельности, когда оценки при неограниченном увеличении числа измерений могут иметь сколь угодно малый доверительный интервал при доверительной вероятности.

3.Эффективности, проявляющейся в том, что из всех несмешанных оценок данная оценка будет иметь наименьшее рассеяние (дисперсию).

Экспериментальная оценка среднеквадратичного отклонения обозначается S с указанием в скобках символа анализируемой величины, т.е.

S (yk) – среднеквадратичного отклонение единичного результата.

S (y) – среднеквадратичное отклонение среднего результата.

Квадрат экспериментальной оценки среднеквадратичного отклонения S² является экспериментальной оценкой дисперсии:

Для обработки результатов наблюдения можно использовать следующую схему:

Определение среднего значения полученных результатов:


Определение отклонения от среднего значения для каждого результата:

Эти отклонения характеризуют абсолютную ошибку определения. Случайные ошибки имеют разные знаки, когда значение результата опыта превышает среднее значение, ошибка опыта считается положительной, когда значение результата опыта меньше среднего значения, ошибка считается отрицательной.

Чем точнее произведены измерения, тем ближе значение отдельных результатов и среднее значение.

Если по m результатам рассчитывают оценку истинного значения , а затем, используя те же результаты, рассчитывают оценки абсолютных отклонений:

то оценку дисперсии единичного результата находят по зависимости:

Разность между числом т независимых результатов у к и числом уравнений, в которых эти результаты уже были использованы для расчета неизвестных оценок, называют числом степеней свободы f :

Для оценки дисперсии эталонного процесса f=m.

Поскольку средняя оценка является более точной, чем единичная у к, дисперсия средних будет меньше дисперсииединичных результатов в m раз, если рассчитано по всем m единичным результатам у к :

Если в распоряжении исследователя имеется экспериментальная оценка дисперсии S 2 (y к) с небольшим конечным числом степеней свободы, то доверительные ошибки рассчитывают с помощью критерия Стьюдента t(P; f):

,

где Р – доверительная вероятность (Р=1-q, q– уровень значимости).

Проверка надёжности полученных результатов по критерию Стьюдента для проведенного числа опытов m при избранной доверительной вероятности (надёжности) Р=0,95; 0,99. Это значит, что 95% или 99% абсолютных отклонений результатов лежит в указанных пределах. Критерий t(P; f) с доверительной вероятностью Р показывает во сколько раз модуль разности между истинным значением определённой величины y и средним значением ỹ больше стандартного отклонения среднего результата.


8. Определение грубых ошибок среди результатов повторностей опыта

При статистическом анализе экспериментальных данных для процессов, негативный результат которых не создает ситуаций, опасных для жизни людей или утраты больших материальных ценностей, доверительная вероятность обычно принимают равной Р=0,95

Среди результатов y k повторностей опыта могут быть результаты, значительно отличающиеся от других. Это может быть связано либо с какой-то грубой ошибкой, либо с неизбежным случайным влиянием неучтенных факторов на результат данной повторности опыта.

Признаком наличия «выделяющегося» результата среди других является большая величина отклонения │▲y k │= y k – yˉ.

Если ▲y k >y пред, то такие результаты относятся к грубым ошибкам. Предельное абсолютное отклонение определяют в зависимости от сложившейся ситуации различными методами. Если, например, проводиться статистический анализ экспериментальных данных опыта с эталонным процессом (известно истинное значение результата опыта и ▲y k =y k -y) и если исследователь имеет в своем распоряжении оценку дисперсии S 2 (y k) с таким большим числом степеней свободы, то может принять f→∞ и S 2 (y k)=σ 2 , то для определения грубых ошибок можно применить правило «2-х сигм»: все результаты, абсолютные отклонения которых по модулю превышают величину двух среднеквадратичных отклонений с надежностью 0,95 считаются грубыми ошибками и исключаются из массива экспериментальных данных (вероятность исключения достоверных результатов равна уровню значимости q=0,05).

Если доверительная вероятность отличается от 0,95 то пользуются правилом «одной сигмы» (Р=0,68) или правилом «трех сигм» (Р=0,997), или по заданной вероятности Р=2Ф(t) – 1 находят Ф(t) по справочным данным и параметр t, по которому и рассчитывают абсолютное отклонение:

Если в распоряжении исследователя имеется лишь приближенная оценка дисперсии с небольшим (конечным) числом степеней свободы, то применение правила «сигм» может привести либо к необоснованному исключению достоверных результатов либо к необоснованному оставлению ошибочных результатов.

В этой ситуации для определения грубых ошибок можно применить критерий максимального отклонения r max (P, m), взятый из соответствующих таблиц. Для этого r max сравнивают с величиной r, равной

(22)

Если r > r max , то данный результат должен исключаться из дальнейшего анализа, оценка y ˉ должна быть пересчитана, изменяются абсолютные отклонения ▲y k и соответственно оценка дисперсии S 2 (y k) и S 2 (yˉ). Анализ на грубые ошибки повторяют при новых значениях оценок yˉ и S 2 (y k), прекращают его при r <= r max .

При пользовании формулой (22) следует применять оценку дисперсии, полученную по результатам повторностей опыта, среди которых находится сомнительный результат.

Для определения грубых ошибок существуют и другие методы, среди которых наиболее быстрым является метод «по размаху» , основанный на оценке максимальных различий полученных результатов. Анализ по этому методу проводят в такой последовательности:

1)располагают результаты y k в упорядоченный ряд, в котором максимальному результату присваивается номер первый (y1), а максимальному – наибольший (y m).

2)Если результатом, вызывающим сомнение, будет y m , рассчитывают отношение

(23)

если сомнительным результатом будет y 1 – отношение

3)при заданном уровни значимости q и известном числе повторностей m по приложению 6 находят табличное значение критерия α Т.

4)если α > α Т, то подозреваемый результат является ошибочным и его следует исключить.

После исключения грубой ошибки находят по таблице новую величину α Т и решают судьбу следующего «подозреваемого» результата, сравнивая α Т и рассчитанный для него α.

Если есть основание предполагать, что 2 наибольших (2 наименьших) результата являются «промахами», то их можно выявить в один прием, используя соответствующий столбец таблицы приложения 6 для определения α Т и рассчитывая α по формуле:

(25)


Средневзвешенные оценки дисперсии. Анализ однородности исходных оценок дисперсии

Если в распоряжении экспериментатора имеются результаты многократных измерений величин критерия оптимальности в опытах при различных условиях ведения процесса, то появляется возможность расчета средневзвешенной оценки дисперсии единичного результата, единой для всех опытов эксперимента.

В каждом из N опытов (номер опыта и = 1+ N ) оценка дисперсии единичного результата равна

где т и – число повторностей и-го опыта.

Средневзвешенная оценка дисперсии единичного результата рассчитывается по всем оценкам дисперсии единичного результата опытов:

а) при различных т и


где - число степеней свободы средневзвешенной оценки дисперсии; т и – 1 = f u – «вес» соответствующей и-ой оценки дисперсии, равный числу степеней свободы f u ;

б) прит и = т = const

где N(m-1)=f– число степеней свободы средневзвешенной оценки дисперсии.

Прежде чем пользоваться соотношениями (28) и (29) для расчета средневзвешенных уточненных оценок дисперсии (чем больше число степеней свободы, тем более точной будет оценка дисперсии), надо доказать однородность исходных оценок дисперсии.

Определение «однородные» в статистике означает «являющиеся оценкой одного и того же параметра» (в данном случае – дисперсии σ 2).

Если измеряемая случайная величина у ик распределена по нормальному закону во всем исследуемом диапазоне, то независимо от значений и дисперсия σ не будет изменять своей величины и оценки этой дисперсии должны быть однородными. Однородность этих оценок проявляется в том, что они могут отличаться друг от друга лишь незначительно, в пределах, зависящих от принятой вероятности и объема экспериментальных данных.

Если т и = т и f = const, то однородность оценок дисперсий можно проанализировать при помощи критерия Кохрена G kp . Вычисляют отношение максимальной дисперсии S 2 ( y uk ) max к сумме всех дисперсий


и сравнивают это отношение с величиной критерия Кохрена G kp ( P ; f ; N ). Если G < Gkp , то оценки однородны.

Таблица значений критерия Кохрена в зависимости от числа степеней свободы числителя f u , числа сравниваемых дисперсий N и принятого уровня значимости q = 1 – Р дана в приложении.

Если число повторностей в опытах различно ( f lt const), однородность оценок дисперсии можно проанализировать с помощью критерия Фишера F Т. Для этого из N оценок дисперсии выбирают 2: максимальную S 2 (y uk) max и минимальную S 2 (y uk) min . Если вычисленное значение F их отношения меньше Ft ,

то все N оценок дисперсии будут однородны.

Значения критерия Фишера F T даны в приложении в зависимости от принятого уровня значимости q и числа степеней свободы f 1 иf 2 оценок S 2 (y uk) max и S 2 (y uk) min соответственно.

Если оценки дисперсии непосредственно измеряемого параметра у оказались неоднородными, т.е. оценками различных дисперсий, то средневзвешенная оценка не может быть рассчитана. И кроме того, величины у к уже нельзя считать подчиняющимися нормальному закону, при котором дисперсия может быть лишь одной и неизменной при любом у.

Причиной нарушения нормального закона распределения может быть наличие оставшихся грубых ошибок (анализ на грубые ошибки либо не проводился, либо проведен недостаточно тщательно).

Другой причиной может быть наличие активного фактора, ошибочно отнесенного исследователем к неактивным и не снабженного системой стабилизации. Поскольку условия изменились, этот фактор стал значимо влиять на процесс.


9. Планирование и обработка результатов однофакторных экспериментов

9.1 Формализация экспериментальных данных методом наименьших квадратов

Влияние какого-либо фактора на выход процесса может быть выражено зависимостью у = f(C). Если конкретному значению С и соответствует единственное значение у и, то такая зависимость называется функциональной. Эту зависимость получают путем строгих логических доказательств, не нуждающихся в опытной проверке. Например, площадь квадрата ω может быть представлена функциональной зависимостью от размера стороны квадрата а: ω = а 2 .

Если у и остается неизменным в то время как С и изменяется, то у не зависит от С. Например, угол при вершине квадрата равный π/2, не зависит от размера стороны а и.

Если для оценки величин у и и С и используются данные наблюдений, величины случайные, то функциональная зависимость между ними существовать не может.

Измерив отдельно сторону а и площадь ω квадрата, можно убедиться, что полученные результаты не могут быть представлены с абсолютной точностью зависимостью ω = а 2 .

К формализации экспериментальных данных, т.е. построению по ним описывающей процесс зависимости, исследователь прибегает, когда не может составить эвристическую (детерминированную) математическую модель из-за недостаточного понимания механизма процесса или его чрезмерной сложности.

Полученная в результате формализации экспериментальных данных эмпирическая математическая модель имеет меньшую ценность, чем отражающая механизм процесса эвристическая математическая модель, которая может предсказать поведение объекта за пределами изученного диапазона изменения переменных.

Приступая к эксперименту с целью получения эмпирической математической модели, исследователь должен определить необходимый объем опытных данных с учетом количества принятых к исследованию факторов, воспроизводимости процесса, предполагаемой структуры модели и обеспечения возможности проверки адекватности уравнения.

Если по результатам эксперимента, состоящего из двух опытов, получено линейное однофакторное уравнение у = b 0 + b 1 С , то построенная по этому уравнению прямая обязательно пройдет через эти экспериментальные точки. Следовательно, для того чтобы проверить, насколько хорошо эта зависимость описывает данный процесс, надо поставить опыт хотя бы еще в одной точке. Этот дополнительный опыт дает возможность осуществить корректную процедуру проверки пригодности уравнения. Однако проверку обычно проводят не по одной дополнительной точке, которая не участвовала в определении коэффициентов уравнения, а по всем экспериментальным точкам, число которых (N) должно превышать число коэффициентов уравнения (N ")

Так как N > N ", решение такой системы требует специального подхода.

9.2 Симметричный и равномерный план однофакторного эксперимента

Задача в значительной степени упростится, если при планировании эксперимента, можно будет обеспечить условие:

При натуральной размерности факторов выполнить условие ΣC u =0 невозможно, т. к. в этом случае величина фактора должна иметь как положительные значения, так и отрицательные.

Если же точку отсчета величины фактора перенести в середину диапазона изменения фактора (центр эксперимента)

то появляется возможность удовлетворить условию в виде , где С " u =С u – С 0.

Для равномерного плана С u – С (u -1) = λ = const,

где λ – интервал варьирования фактора.

Условие может быть выполнено, если для обозначения величины фактора использовать безразмерные выражения:

отсюда легко увидеть, что условие эквивалентно условию и такие планы называют симметричными.

При составлении плана диапазон фактора ориентировочно ограничивают величинами С min и С max , назначенными после изучения литературы по теме исследования. От опыта к опыту предусматривают такое изменение величины фактора, которое позволило бы достоверно уловить имеющимися в распоряжении исследователя приборами изменение выхода процесса .

С учетом величины λ и диапазона (С max – C min) определяют число опытов, округляя его до нечетного N:


.

Затем определяют величины факторов в каждом из N опытов и уточняют исследуемый диапазон фактора С N – С 1:

=,

где х u – безразмерное выражение фактора, аналогичное полученному по соотношению

Для расчета коэффициентов уравнения используем формулу:

множители а ju и знаменатель l j берем из приложения.

Число опытов эксперимента может быть четным или нечетным, и, как правило, должно быть больше числа коэффициентов N" уравнения.

Чем больше разность (N – N"), тем с большей точностью можно получить оценки коэффициентов данного уравнения и тем в большей степени эти оценки будут освобождены от влияния случайных неуточненных факторов.

Планирование эксперимента

Учебное пособие

Воронеж 2013

ФГБОУВПО «Воронежский государственный технический университет»

Планирование эксперимента

Утверждено Редакционно-издательским советом университета в качестве учебного пособия

Воронеж 2013

УДК: 629.7.02

Попов эксперимента: учеб. пособие. Воронеж: ФГБОУВПО «Воронежский государственный технический университет», 20с.

В учебном пособии рассматривается вопрос планирования эксперимента. Издание соответствует требованиям Государственного образовательного стандарта высшего профессионального образования по направлению 652100 «Авиастроение», специальности 160201 «Самолето - и вертолетостроение », дисциплине «Планирование экспериментов и обработка результатов».

Учебное пособие разработано в рамках реализации федеральной целевой программы «Научные и научно-педагогические кадры инновационной России» на 2009 – 2013 годы, соглашение № 14.B37.21.1824, связанной с выполнением научно-исследовательской работы (проекта) по теме «Исследование, разработка конструкции неразрезных эллиптических обтекателей воздухозаборников двигателей летательных аппаратов и моделирование технологического процесса»

Табл. 3. Ил. 8. Библиогр.: 4 назв.

Научный редактор канд. техн. наук, доц.

Рецензенты: филиал «Иркут»» в г. Воронеже (зам. руководителя, канд. техн. наук, с. н.с.);

Канд. техн. наук

© Оформление. ФГБОУВПО «Воронежский государственный технический Университет», 2013

Введение

Традиционные методы исследований связаны с экспериментами, которые требуют больших затрат, сил и средств.


Эксперименты, как правило, являются многофакторными и связаны с оптимизацией качества материалов, отысканием оптимальных условий проведения технологических процессов, разработкой наиболее рациональных конструкций оборудования и т. д. Системы, которые служат объектом таких исследований, очень часто являются такими сложными, что не поддаются теоретическому изучению в разумные сроки. Поэтому, несмотря на значительный объем выполненных научно-исследовательских работ, из-за отсутствия реальной возможности достаточно полно изучить значительное число объектов исследования, как следствие, многие решения принимаются на основании информации, имеющей случайный характер, и поэтому далеки от оптимальных.

Исходя из выше изложенного возникает необходимость поиска пути, позволяющего вести исследовательскую работу ускоренными темпами и обеспечивающим принятие решений, близких к оптимальным. Этим путем и явились статистические методы планирования эксперимента, предложенные английским статистиком Рональдом Фишером (конец двадцатых годов). Он впервые показал целесообразность одновременного варьирования всеми факторами в противовес широко распространенному однофакторному эксперименту .

Применение планирования эксперимента делает поведение экспериментатора целенаправленным и организованным, существенно способствует повышению производительности труда и надежности полученных результатов. Важным достоинством является его универсальность, пригодность в огромном большинстве областей исследований. В нашей стране планирование эксперимента развивается с 1960 г. под руководством. Однако даже простая процедура планирования весьма непроста, что обусловлено рядом причин, таких как неверное применение методов планирования, выбор не самого оптимального пути исследования, недостаточность практического опыта, недостаточная математическая подготовленность экспериментатора и т. д.

Цель данного учебного пособия – ознакомление студентов с наиболее часто применяемыми и простыми методами планирования эксперимента, выработка навыков практического применения. Более подробно рассмотрена задача оптимизации процессов.

1 Основные понятия планирования эксперимента

Планирование эксперимента, имеет свою определенную терминологию. Рассмотрим общие термины.

Эксперимент - это система операций, воздействий и (или) наблюдений, направленных на получение информации об объекте при исследовательских испытаниях.

Опыт - воспроизведение исследуемого явления в определенных условиях проведения эксперимента при возможности регистрации его результатов. Опыт - отдельная элементарная часть эксперимента.

Планирование эксперимента - процедура выбора числа опытов и условий их проведения, необходимых для решения поставленной задачи с требуемой точностью. Все факторы, определяющие процесс, изменяются одновременно по специальным правилам, а результаты эксперимента представляются в виде математической модели.

Задачи, для решения которых может использоваться планирование эксперимента, чрезвычайно разнообразны. К ним относятся: поиск оптимальных условий, построение интерполяционных формул, выбор существенных факторов, оценка и уточнение констант теоретических моделей, выбор наиболее приемлемых из некоторого множества гипотез о механизме явлений, исследование диаграмм состав – свойство и т. д.

Поиск оптимальных условий является одной из наиболее распространенных научно-технических задач. Они возникают в тот момент, когда установлена возможность проведения процесса и необходимо найти наилучшие (оптимальные) условия его реализации. Такие задачи называются – задачами оптимизации. Процесс их решения называется – процессом оптимизации или просто оптимизацией. Примеры задачи оптимизации – выбор оптимального состава многокомпонентных смесей и сплавов, повышение производительности действующих установок, повышение качества продукции, снижение затрат на ее получение и т. п.


Выделяют следующие этапы построения математической модели

1. сбор и анализ априорной информации;

2. выбор факторов и выходных переменных, области экспериментирования;

3. выбор математической модели, с помощью которой будут представляться экспериментальные данные;

5. определение метода анализа данных;

6. проведение эксперимента;

7. проверка статистических предпосылок для полученных экспериментальных данных;

8. обработка результатов;

Факторы определяют состояние объекта. Основное требование к факторам - управляемость. Под управляемостью понимается установление нужного значения фактора (уровня) и поддержание его в течение всего опыта. В этом состоит особенность активного эксперимента. Факторы могут быть количественными и качественными. Примерами количественных факторов являются температура, давление, концентрация и т. п. Их уровням соответствует числовая шкала. Различные катализаторы, конструкции аппаратов, способы лечения, методики преподавания являются примерами качественных факторов. Уровням таких факторов не соответствует числовая шкала, и их порядок не играет роли.

Выходные переменные - это реакции (отклики) на воздействие факторов. Отклик зависит от специфики исследования и может быть экономическим (прибыль, рентабельность), технологическим (выход, надежность), психологическим, статистическим и т. д. Параметр оптимизации должен быть эффективным с точки зрения достижения цели, универсальным, количественным, выражаемым числом, имеющим физический смысл, быть простым и легко вычисляемым.

Затраты машинного времени можно значительно сократить, если на этапе оптимизации параметров использовать экспериментальную факторную математическую модель. Экспериментальные факторные модели, в отличие от теоретических, не используют физических законов, описывающих происходящие в объектах процессы, а представляют собой некоторые формальные зависимости выходных параметров от внутренних и внешних параметров объектов проектирования.

Экспериментальная факторная модель может быть построена на основе проведения экспериментов непосредственно на самом техническом объекте (физические эксперименты), либо вычислительных экспериментов на ЭВМ с теоретической моделью.

Рисунок 1

При построении экспериментальной факторной модели объект моделирования (проектируемая техническая система) представляется в виде "черного ящика", на вход которого подаются некоторые переменные Xи Z, а на выходе можно наблюдать и регистрировать переменные Y.

В процессе проведения эксперимента изменение переменных Xи Zприводит к изменениям выходных переменных Y. Для построения факторной модели необходимо регистрировать эти изменения и осуществить необходимую их статистическую обработку для определения параметров модели.

При проведении физического эксперимента переменными Xможно управлять, изменяя их величину по заданному закону. Переменные Z- неуправляемые, принимающие случайные значения. При этом значения переменных Xи Zможно контролировать и регистрировать с помощью соответствующих измерительных приборов. Кроме того, на объект воздействуют некоторые переменные Е, которые нельзя наблюдать и контролировать. Переменные X= (x1, х2,..., хn) называют контролируемыми управляемыми; переменные Z = (z1, z2,…… zm) - контролируемыми, но неуправляемыми, а переменные E = (ε1, ε2,..., εl) - неконтролируемыми и неуправляемыми.

Переменные X и Z называют факторами. Факторы X являются управляемыми и изменяются как детерминированные переменные, а факторы Z неуправляемые, изменяемые во времени случайным образом, т. е. Z представляют собой случайные процессы. Пространство контролируемых переменных - факторов X и Z - образует факторное пространство.

Выходная переменная Y представляет собой вектор зависимых переменных моделируемого объекта. Ее называют откликом, а зависимость Y от факторов Xи Z- функцией отклика. Геометрическое представление функции отклика называют поверхностью отклика.

Переменная Е действует в процессе эксперимента бесконтрольно. Если предположить, что факторы X и Z стабилизированы во времени и сохраняют постоянные значения, то под влиянием переменных E функция отклика Y может меняться как систематическим, так и случайным образом. В первом случае говорят о систематической помехе, а во втором - о случайной помехе. При этом полагают, что случайная помеха обладает вероятностными свойствами, не изменяемыми во времени.

Возникновение помех обусловлено ошибками методик проведения физических экспериментов, ошибками измерительных приборов, неконтролируемыми изменениями параметров ихарактеристик объекта и внешней среды.

В вычислительных экспериментах объектом исследования является теоретическая математическая модель, на основе которой необходимо получить экспериментальную факторную модель. Для ее получения необходимо определить структуру и численные значения параметров модели.

Под структурой модели понимается вид математических соотношений между факторами X, Z и откликом Y. Параметры представляют собой коэффициенты уравнений факторной модели. Структуру модели обычно выбирают на основе априорной информации об объекте с учетом назначения и последующего использования модели. Задача определения параметров модели полностью формализована. Она решается методами регрессионного анализа. Экспериментальные факторные модели называют также регрессионными моделями.

Регрессионную модель можно представить выражением

(1.1)

где В - вектор параметров факторной модели.

Вид вектор-функции φ определяется выбранной структурой модели и считается заданным, а параметры В подлежат определению на основе результатов эксперимента.

Различают эксперименты пассивные и активные.

Пассивным называется такой эксперимент, когда значениями факторов управлять нельзя, и они принимают случайные значения. В таком эксперименте существуют только факторы Z. В процессе эксперимента в определенные моменты времени измеряются значения факторов Z и функций откликов Y. После проведения N опытов полученная информация обрабатывается статистическими методами, позволяющими определить параметры факторной модели. Такой подход к построению математической модели лежит в основе метода статистических испытаний (Монте-Карло).

Активным называется такой эксперимент, когда значениями факторов задаются и поддерживают их неизменными в заданных уровнях в каждом опыте в соответствии с планом эксперимента. Следовательно, в этом случае существуют только управляемые факторы X.

Основные особенности экспериментальных факторных моделей следующие: они статистические; представляют собой сравнительно простые функциональные зависимости между оценками математических ожиданий выходных параметров объекта от eё внутренних и внешних параметров; дают адекватное описание установленных зависимостей лишь в области факторного пространства, в которой реализован эксперимент. Статистически регрессионная модель описывает поведение объекта в среднем, характеризуя его неслучайные свойства, которые в полной мере проявляются лишь при многократном повторении опытов в неизменных условиях.

2 Основные принципы планирования эксперимента

Для получения адекватной математической модели необходимо обеспечить выполнение определенных условий проведения эксперимента. Модель называют адекватной, если в оговоренной области варьирования факторов X полученные с помощью модели значения функций отклика Y отличаются от истинных не более чем на заданную величину. Методы построения экспериментальных факторных моделей рассматриваются в теории планирования эксперимента.

Цель планирования эксперимента - получение максимума информации о свойствах исследуемого объекта при минимуме опытов. Такой подход обусловлен высокой стоимостью экспериментов, как физических, так и вычислительных, и вместе с тем необходимостью построения адекватной модели.

При планировании активных экспериментов используются следующие принципы:

– отказ от полного перебора всех возможных состояний объекта;

– постепенное усложнение структуры математической модели;

– сопоставление результатов эксперимента с величиной случайных помех;

– рандомизация опытов;

Детальное представление о свойствах поверхности отклика может быть получено лишь при условии использования густой дискретной сетки значений факторов, покрывающей все факторное пространство. В узлах этой многомерной сетки находятся точки плана, в которых проводятся опыты. Выбор структуры факторной модели основан на постулировании определенной степени гладкости поверхности отклика. Поэтому с целью уменьшения количества опытов принимают небольшое число точек плана, для которых осуществляется реализация эксперимента.

При большом уровне случайной помехи получается большой разброс значений функции отклика Yв опытах, проведенных в одной и той же точке плана. В этом случае оказывается, что чем выше уровень помехи, тем с большей вероятностью простая модель окажется работоспособной. Чем меньше уровень помехи, тем точнее должна быть факторная модель.

Кроме случайной помехи при проведении эксперимента может иметь место систематическая помеха. Наличие этой помехи практически никак не обнаруживается и результат ее воздействия на функцию не поддается контролю. Однако если путем соответствующей организации проведения опытов искусственно создать случайную ситуацию, то систематическую помеху можно перевести в разряд случайных. Такой принцип организации эксперимента называют рандомизациейсистематически действующих помех.

Наличие помех приводит к ошибкам эксперимента. Ошибки подразделяют на систематические и случайные, соответственно наименованиям вызывающих их факторов - помех.

Рандомизацию опытов осуществляют только в физических экспериментах. Следует отметить, что в этих экспериментах систематическую ошибку может порождать наряду с отмеченными ранее факторами также неточное задание значений управляемых факторов, обусловленное некачественной калибровкой приборов для их измерения (инструментальная ошибка), конструктивными или технологическими факторами.

К факторам в активном эксперименте предъявляются определенные требования. Они должны быть:

– управляемыми(установка заданных значений и поддержание постоянными в процессе опыта);

– совместными(их взаимное влияние не должно нарушать процесс функционирования объекта);

–независимыми(уровень любого фактора должен устанавливаться независимо от уровней остальных);

– однозначными(одни факторы не должны быть функцией других);

– непосредственно влияющими на выходные параметры.

Выбор параметров оптимизации (критериев оптимизации) является одним из главных этапов работы на стадии предварительного изучения объекта исследования, т. к. правильная постановка задачи зависит от правильности выбора параметра оптимизации, являющегося функцией цели.

Под параметром оптимизации понимают характеристику цели, заданную количественно. Параметр оптимизации является реакцией (откликом) на воздействие факторов, которые определяют поведение выбранной системы.

Реальные объекты или процессы, как правило, очень сложны. Они часто требуют одновременного учета нескольких, иногда очень многих, параметров. Каждый объект может характеризоваться всей совокупностью параметров, или любым подмножеством этой совокупности, или одним – единственным параметром оптимизации. В последнем случае прочие характеристики процесса уже не выступают в качестве параметра оптимизации, а служат ограничениями. Другой путь – построение обобщенного параметра оптимизации как некоторой функции от множества исходных.

Параметр оптимизации (Функции отклика) – это признак, по которому оптимизируется процесс. Он должен быть количественным, задаваться числом. Множество значений, которые может принимать параметр оптимизации, называется областью его определения. Области определения могут быть непрерывными и дискретными, ограниченными и неограниченными. Например, выход реакции – это параметр оптимизации с непрерывной ограниченной областью определения. Он может изменяться в интервале от 0 до 100%. Число бракованных изделий, число зерен на шлифе сплава, число кровяных телец в пробе крови – вот примеры параметров с дискретной областью определения, ограниченной снизу.

Количественная оценка параметра оптимизации на практике не всегда возможна. В таких случаях пользуются приемом, называемым ранжированием. При этом параметрам оптимизации присваиваются оценки – ранги по заранее выбранной шкале: двухбалльной, пятибалльной и т. д. Ранговый параметр имеет дискретную ограниченную область определения. В простейшем случае область содержит два значения (да, нет; хорошо, плохо). Это может соответствовать, например, годной продукции и браку.

2.1 Виды параметров оптимизации

В зависимости от объекта и цели параметры оптимизации могут быть весьма разнообразными. Введем некоторую классификацию . Реальные ситуации, как правило довольно сложны. Они часто требуют нескольких, иногда очень многих, параметров. В принципе каждый объект может характеризоваться сразу всей совокупностью параметров, приведенных на рисунке 2, или любым подмножеством из этой совокупности. Движение к оптимуму возможно, если выбран один-единственный параметр оптимизации. Тогда прочие характеристики процесса уже не выступают в качестве параметров оптимизации, а служат ограничениями. Другой путь - построение обобщенного параметра оптимизации как некоторой функции от множества исходных .

Прокомментируем некоторые элементы схемы.

Экономические параметры оптимизации, такие, как прибыль, себестоимость и рентабельность, обычно используются при исследовании действующих промышленных объектов, тогда как затраты на эксперимент имеет смысл оценивать в любых исследованиях, в том числе и лабораторных. Если цена опытов одинакова, затраты на эксперимент пропорциональны числу опытов, которые необходимо поставить для решения данной задачи. Это в значительной мере определяет выбор плана эксперимента.

Среди технико-экономических параметров наибольшее распространение имеет производительность. Такие параметры, как долговечность, надежность и стабильность, связаны с длительными наблюдениями. Имеется некоторый опыт их использования при изучении дорогостоящих ответственных объектов, например радиоэлектронной аппаратуры.

Почти во всех исследованиях приходится учитывать количество и качество получаемого продукта. Как меру количества продукта используют выход, например, процент выхода химической реакции, выход годных изделий.

Показатели качества чрезвычайно разнообразны. В схеме они сгруппированы по видам свойств. Характеристики количества и качества продукта образуют группу технико-технологических параметров.

Под рубрикой «прочие» сгруппированы различные параметры, которые реже встречаются, но не являются менее важными. Сюда попали статистические параметры, используемые для улучшения характеристик случайных величин или случайных функций. В качестве примеров назовем задачи на минимизацию дисперсии случайной величины, на уменьшение числа выбросов случайного процесса за фиксированный уровень и т. д. Последняя задача возникает, в частности, при выборе оптимальных настроек автоматических регуляторов или при улучшении свойств нитей (проволока, пряжа, искусственное волокно и др.).

2.2 Требования к параметрам оптимизации

1) параметр оптимизации должен быть количественным.

2) параметр оптимизации должен выражаться одним числом. Иногда это получается естественно, как регистрация показания прибора. Например, скорость движения машины определяется числом на спидометре. Часто приходится проводить некоторые вычисления. Так бывает при расчете выхода реакции. В химии часто требуется получать продукт с заданным отношением компонентов, например, А:В=3:2. Один из возможных вариантов решения подобных задач состоит в том, чтобы выразить отношение одним числом (1,5) и в качестве параметра оптимизации пользоваться значением отклонений (или квадратов отклонений) от этого числа.

3) однозначность в статистическом смысле. Заданному набору значений факторов должно соответствовать одно значение параметра оптимизации, при этом обратное неверно: одному и тому же значению параметра могут соответствовать разные наборы значений факторов.

4) наиболее важным требованием к параметрам оптимизации является его возможность действительно эффективной оценки функционирования системы. Представление об объекте не остается постоянным в ходе исследования. Оно меняется по мере накопления информации и в зависимости от достигнутых результатов. Это приводит к последовательному подходу при выборе параметра оптимизации. Так, например, на первых стадиях исследования технологических процессов в качестве параметра оптимизации часто используется выход продукта. Однако в дальнейшем, когда возможность повышения выхода исчерпан, начинают интересоваться такими параметрами, как себестоимость, чистота продукта и т. д. Оценка эффективности функционирования системы может осуществляться как для всей системы в целом, так и оценкой эффективности ряда подсистем, составляющих данную систему. Но при этом необходимо учитывать возможность того, что оптимальность каждой из подсистем по своему параметру оптимизации «не исключает возможность гибели системы в целом». Это означает, что попытка добиться оптимума с учетом некоторого локального или промежуточного параметра оптимизации может оказаться неэффективной или даже привести к браку.

5) требование универсальности или полноты. Под универсальностью параметра оптимизации понимают его способность всесторонне охарактеризовать объект. В частности, технологические параметры недостаточно универсальны: они не учитывают экономику. Универсальностью обладают, например, обобщенные параметры оптимизации, которые строятся как функции от нескольких частных параметров.

6) параметр оптимизации желательно должен иметь физический смысл, быть простым и легко вычисляем. Требование физического смысла связано с последующей интерпретацией результатов эксперимента. Не представляет труда объяснить, что значит максимум извлечения, максимум содержания ценного компонента. Эти и подобные им технологические параметры оптимизации имеют ясный физический смысл, но иногда для них может не выполняться, например, требование статистической эффективности. Тогда рекомендуется переходить к преобразованию параметра оптимизации. Второе требование, т. е. простота и легко вычисляемость, также весьма существенны. Для процессов разделения термодинамические параметры оптимизации более универсальны. Однако на практике ими пользуются мало: их расчет довольно труден. Из приведенных двух требований первое является более существенным, потому что часто удается найти идеальную характеристику системы и сравнить ее с реальной характеристикой.

2.3Факторы

После выбора объекта исследования и параметра оптимизации нужно рассмотреть все факторы, которые могут влиять на процесс. Если какой-либо существенный фактор окажется неучтенным и принимал произвольные значения, не контролируемые экспериментатором, то это значительно увеличит ошибку опыта. При поддержании этого фактора на определенном уровне может быть получено ложное представление об оптимуме, т. к. нет гарантии, что полученный уровень является оптимальным.

С другой стороны большое число факторов увеличивает число опытов и размерность факторного пространства.

Выбор факторов эксперимента является весьма существенным, от этого зависит успех оптимизации.

Фактор – измеряемая переменная величина, принимающая в некоторый момент времени определенное значение и влияющая на объект исследования.

Факторы должны иметь область определения, внутри которой задаются его конкретные значения. Область определения может быть непрерывной или дискретной. При планировании эксперимента значения факторов принимаются дискретными, что связано с уровнями факторов. В практических задачах области определения факторов имеют ограничения, которые носят либо принципиальный, либо технический характер.

Факторы разделяются на количественные и качественные.

К количественным относятся те факторы, которые можно измерять, взвешивать и т. д.

Качественные факторы – это различные вещества, технологические способы, приборы, исполнители и т. п.

Хотя к качественным факторам не соответствует числовая шкала, но при планировании эксперимента к ним применяют условную порядковую шкалу в соответствии с уровнями, т. е. производится кодирование. Порядок уровней здесь произволен, но после кодирования он фиксируется.

2.3.1 Требования к факторам эксперимента

1) Факторы должны быть управляемыми, это значит, что выбранное нужное значение фактора можно поддерживать постоянным в течение всего опыта. Планировать эксперимент можно только в том случае, если уровни факторов подчиняются воле экспериментатора. Например, экспериментальная установка смонтирована на открытой площадке. Здесь температурой воздуха мы не можем управлять, ее можно только контролировать, и потому при выполнении опытов температуру, как фактор, мы не можем учитывать.

2) Чтобы точно определить фактор, нужно указать последовательность действий (операций), с помощью которых устанавливаются его конкретные значения. Такое определение называется операциональным. Так, если фактором является давление в некотором аппарате, то совершенно необходимо указать, в какой точке и с помощью какого прибора оно измеряется и как оно устанавливается. Введение операционального определения обеспечивает однозначное понимание фактора.

3) Точность замеров факторов должна быть возможно более высокой. Степень точности определяется диапазоном изменения факторов. В длительных процессах, измеряемых многими часами, минуты можно не учитывать, а в быстрых процессах приходится учитывать доли секунды.

Исследование существенно усложняется, если фактор измеряется с большой ошибкой или значения факторов трудно поддерживать на выбранном уровне (уровень фактора «плывет»), то приходится применять специальные методы исследования, например, конфлюэнтный анализ .

4) Факторы должны быть однозначны. Трудно управлять фактором, который является функцией других факторов. Но в планировании могут участвовать другие факторы, такие, как соотношения между компонентами, их логарифмы и т. п. Необходимость введения сложных факторов возникает при желании представить динамические особенности объекта в статической форме. Например, требуется найти оптимальный режим подъема температуры в реакторе. Если относительно температуры известно, что она должна нарастать линейно, то в качестве фактора вместо функции (в данном случае линейной) можно использовать тангенс угла наклона, т. е. градиент.

5) При планировании эксперимента одновременно изменяют несколько факторов, поэтому необходимо знать требования к совокупности факторов. Прежде всего выдвигается требование совместимости. Совместимость факторов означает, что все их комбинации осуществимы и безопасны. Несовместимость факторов наблюдается на границах областей их определения. Избавиться от нее можно сокращением областей. Положение усложняется, если несовместимость проявляется внутри областей определения. Одно из возможных решений – разбиение на подобласти и решение двух отдельных задач.

6) При планировании эксперимента важна независимость факторов, т. е. возможность установления фактора на любом уровне вне зависимости от уровней других факторов. Если это условие невыполнимо, то невозможно планировать эксперимент.

2.3.2 Требования к совокупности факторов

При планировании эксперимента обычно одновременно изменяется несколько факторов. Поэтому очень важно сформулировать требования, которые предъявляются к совокупности факторов. Прежде всего выдвигается требование совместимости. Совместимость факторов означает, что все их комбинации осуществимы и безопасны. Это очень важное требование. Представьте себе, что вы поступили легкомысленно, не обратили внимания на требование совместимости факторов и запланировали такие условия опыта, которые могут привести к взрыву установки или осмолению продукта. Согласитесь, что такой результат очень далек от целей оптимизации.

Несовместимость факторов может наблюдаться на границах областей их определения. Избавиться от нее можно сокращением областей. Положение усложняется, если несовместимость проявляется внутри областей определения. Одно из возможных решений - разбиение на подобласти и решение двух отдельных задач.

При планировании эксперимента важна независимость факторов, т. е. возможность установления фактора на любом уровне вне зависимости от уровней других факторов. Если это условие невыполнимо, то невозможно планировать эксперимент. Итак, мы подошли ко второму требованию - отсутствию корреляции между факторами. Требование некоррелированности не означает, что между значениями факторов нет никакой связи. Достаточно, чтобы связь не была линейной.

3 Планирование эксперимента

3.1 План эксперимента

При проведении активного эксперимента задается определенный план варьирования факторов, т. е. эксперимент заранее планируется

План эксперимента - совокупность данных, определяющих число, условия и порядок реализации опытов.

Планирование эксперимента - выбор плана эксперимента, удовлетворяющего заданным требованиям.

Точка плана - упорядоченная совокупность численных значений факторов, соответствующая условиям проведения опыта, т. е. точка факторного пространства, в которой проводится эксперимент. Точке плана с номером i соответствует вектор-строка (3.1):

(3.1)

Общая совокупность таких векторов Xi, i= 1, Lобразует план эксперимента, а совокупность различных векторов, число которых обозначим N, - спектр плана.

В активном эксперименте факторы могут принимать только фиксированные значения. Фиксированное значение фактора называют уровнем фактора. Количество принимаемых уровней факторов зависит от выбранной структуры факторной модели и принятого плана эксперимента. Минимальный Xjmin и максимальный Хimах, j=l, n (n - число факторов) уровни всех факторов выделяют в факторном пространстве некоторый гиперпараллелепипед, представляющий собой область планирования. В области планирования находятся все возможные значения факторов, используемые в эксперименте.

Вектор задает точку центра областипланирования. Координаты этой точки Xj0 обычно выбирают из соотношения (3.2)

(3.2)

Точку Х0называют центром эксперимента. Она определяет основной уровень факторов Хj0, j = 1,n. Центр эксперимента стремятся выбрать как можно ближе к точке, которая соответствует искомым оптимальным значениям факторов. Для этого используется априорная информация об объекте.

Интервалом (или шагом) варьирования фактора Xj называют величину, вычисляемую по формулам (3.3, 3.4):

(3.3)

Факторы нормируют, а их уровни кодируют. В кодированном виде верхний уровень обозначают +1, нижний -1, а основной 0. Нормирование факторов осуществляют на основе соотношения (3.5, 3.6):

xj =(Xj-X0j)/ΔXj, (3.5)

Рисунок 3 – Геометрическое представление области планирования при двух факторах: Х1 и Х2

Точки 1,2,3,4 являются точкамиплана эксперимента. Например, значения факторов Х1и Х2в точке 1равны соответственно X1min иХ2min, а нормированные их значения xlmin = -1, х2min = -1.

После установления нулевой точки выбирают интервалы варьирования факторов. Это связано с определением таких значений факторов, которые в кодированных величинах соответствуют +1 и –1. Интервалы варьирования выбирают с учетом того, что значения факторов, соответствующие уровням +1 и –1, должны быть достаточно отличимы от значения, соответствующему нулевому уровню. Поэтому во всех случаях величина интервала варьирования должна быть больше удвоенной квадратичной ошибки фиксирования данного фактора. С другой стороны, чрезмерное увеличение величины интервалов варьирования нежелательно, т. к. это может привести к снижению эффективности поиска оптимума. А очень малый интервал варьирования уменьшает область эксперимента, что замедляет поиск оптимума.

При выборе интервала варьирования целесообразно учитывать, если это возможно, число уровней варьирования факторов в области эксперимента. От числа уровней зависят объем эксперимента и эффективность оптимизации.

План эксперимента удобно представлять в матричной форме.

Матрица планапредставляет собой прямоугольную таблицу, содержащую информацию о количестве и условиях проведения опытов. Строки матрицы плана соответствуют опытам, а столбцы - факторам. Размерность матрицы плана L х n, где L- число опытов, n- число факторов. При проведении повторных (дублирующих) опытов в одних и тех же точках плана матрица плана содержит ряд совпадающих строк.

4.7. Экспериментальные планы

Экспериментальный план – это тактика экспериментального исследования, воплощенная в конкретной системе операций планирования эксперимента. Основными критериями классификации планов являются:

Состав участников (индивид или группа);

Количество независимых переменных и их уровней;

Виды шкал представления независимых переменных;

Метод сбора экспериментальных данных;

Место и условия проведения эксперимента;

Особенности организации экспериментального воздействия и способа контроля.

Планы для групп испытуемых и для одного испытуемого. Все экспериментальные планы можно разделить по составу участников на планы для групп испытуемых и планы для одного испытуемого.

Эксперименты с группой испытуемых имеют следующие преимущества: возможность обобщения результатов эксперимента на популяцию; возможность использования схем межгрупповых сравнений; экономия времени; применение методов статистического анализа. К недостаткам данного типа экспериментальных планов можно отнести: влияние индивидуальных различий между людьми на результаты эксперимента; проблему репрезентативности экспериментальной выборки; проблему эквивалентности групп испытуемых.

Эксперименты с одним испытуемым – это частный случай «планов с маленьким N». Дж. Гудвин указывает на следующие причины использования таких планов: потребности в индивидуальной валидности, так как в экспериментах с большим N возникает проблема, когда обобщенные данные не характеризуют ни одного испытуемого. Эксперимент с одним испытуемым проводится также в уникальных случаях, когда в силу ряда причин невозможно привлечь много участников. В этих случаях целью эксперимента является анализ уникальных явлений и индивидуальных характеристик.

Эксперимент с маленьким N, по мнению Д. Мартина, имеет следующие преимущества: отсутствие сложных статистических подсчетов, легкость в интерпретации результатов, возможность изучения уникальных случаев, привлечение одного-двух участников, широкие возможности манипуляции независимыми переменными. Ему свойственны и некоторые недостатки, в частности сложность процедур контроля, затруднение при обобщении результатов; относительная неэкономичность по времени.

Рассмотрим планы для одного испытуемого.

Планирование временных серий. Основным показателем влияния независимой переменной на зависимую при реализации такого плана является изменение характера ответов испытуемого во времени. Простейшая стратегия: схема А – В. Испытуемый первоначально выполняет деятельность в условиях А, а затем в условиях В. Для контроля «эффекта плацебо» применяется схема: А – В – А. («Эффект плацебо» – это реакции испытуемых на «пустые» воздействия, соответствующие реакциям на реальные воздействия.) В данном случае испытуемый не должен заранее знать, какое из условий является «пустым», а какое реальным. Однако эти схемы не учитывают взаимодействия воздействий, поэтому при планировании временных серий, как правило, применяют схемы регулярного чередования (А – В – А – В), позиционного уравнивания (А – В – В – А) или случайного чередования. Применение более «длинных» временных серий увеличивает возможность обнаружения эффекта, но приводит к ряду негативных последствий – утомлению испытуемого, снижению контроля за другими дополнительными переменными и т. п.

План альтернативных воздействий является развитием плана временных серий. Его специфика заключается в том, что воздействия А и В рандомизированно распределяются во времени и предъявляются испытуемому раздельно. Затем сравниваются эффекты от каждого из воздействий.

Реверсивный план применяется для изучения двух альтернативных форм поведения. Первоначально регистрируется базовый уровень проявления обеих форм поведения. Затем предъявляется комплексное воздействие, состоящее из специфического компонента для первой формы поведения и дополнительного для второй. Через определенное время сочетание воздействий видоизменяют. Эффект двух комплексных воздействий оценивается.

План возрастания критериев часто используется в психологии обучения. Суть его состоит в том, что регистрируется изменение поведения испытуемого в ответ на прирост воздействия. При этом следующее воздействие предъявляется лишь после выхода испытуемого на заданный уровень критерия.

При проведении экспериментов с одним испытуемым следует учитывать, что основные артефакты практически неустранимы. Кроме того, в этом случае, как ни в каком другом, проявляется влияние установок экспериментатора и отношений, которые складываются между ним и испытуемым.

Р. Готтсданкер предлагает различать качественные и количественные экспериментальные планы . В качественных планах независимая переменная представлена в номинативной шкале, т. е. в эксперименте используются два или более качественно разных условия.

В количественных экспериментальных планах уровни независимой переменной представлены в интервальных, ранговых или пропорциональных шкалах, т. е. в эксперименте используются уровни выраженности того или иного условия.

Возможна ситуация, когда в факторном эксперименте одна переменная будет представлена в количественном, а другая – в качественном виде. В таком случае план будет комбинированным.

Внутригрупповые и межгрупповые экспериментальные планы. Т.В. Корнилова определяет два типа экспериментальных планов по критерию количества групп и условий проведения эксперимента: внутригрупповые и межгрупповые. К внутригрупповым относятся планы, в которых влияние вариантов независимой переменной и измерение экспериментального эффекта происходят в одной группе. В межгрупповых планах влияние вариантов независимой переменной осуществляется в разных экспериментальных группах.

Преимуществами внутригруппового плана являются: меньшее количество участников, устранение факторов индивидуальных отличий, уменьшение общего времени проведения эксперимента, возможность доказательства статистической значимости экспериментального эффекта. К недостаткам относятся неконстантность условий и проявление «эффекта последовательности».

Преимуществами межгруппового плана являются: отсутствие «эффекта последовательности», возможность получения большего количества данных, сокращение времени участия в эксперименте для каждого испытуемого, уменьшение эффекта выбывания участников эксперимента. Главным недостатком межгруппового плана является неэквивалентность групп.

Планы с одной независимой переменной и факторные планы. По критерию количества экспериментальных воздействий Д. Мартин предлагает различать планы с одной независимой переменной, факторные планы и планы с серией экспериментов. В планах с одной независимой переменной экспериментатор манипулирует одной независимой переменной, которая может иметь неограниченное количество вариантов проявления. В факторных планах (подробно о них см. с. 120) экспериментатор манипулирует двумя и более независимыми переменными, исследует все возможные варианты взаимодействия их разных уровней.

Планы с серией экспериментов проводятся для постепенного исключения конкурирующих гипотез. В конце серии экспериментатор приходит к верификации одной гипотезы.

Доэкспериментальные, квазиэкспериментальные планы и планы истинных экспериментов. Д. Кэмпбелл предложил разделить все экспериментальные планы для групп испытуемых на следующие группы: доэкспериментальные, квазиэкспериментальные и планы истинных экспериментов. В основе этого деления лежит близость реального эксперимента к идеальному. Чем меньше артефактов провоцирует тот или иной план и чем строже контроль дополнительных переменных, тем ближе эксперимент к идеальному. Доэкспериментальные планы менее всего учитывают требования, предъявляемые к идеальному эксперименту. В.Н. Дружинин указывает, что они могут служить лишь иллюстрацией, в практике научных исследований их следует по возможности избегать. Квазиэкспериментальные планы являются попыткой учета реалий жизни при проведении эмпирических исследований, они специально создаются с отступлением от схем истинных экспериментов. Исследователь должен осознавать источники артефактов – внешних дополнительных переменных, которые он не может контролировать. Квазиэкспериментальный план применяется тогда, когда применение лучшего плана невозможно.

Систематизированные признаки доэкспериментальных, квазиэкспериментальных планов и планов истинных экспериментов приводятся в нижеследующей таблице.

При описании экспериментальных планов будем пользоваться символизацией, предложенной Д. Кэмпбеллом: R – рандомизация; X – экспериментальное воздействие; O – тестирование.

К доэксперименталъным планам относятся: 1) исследование единичного случая; 2) план с предварительным и итоговым тестированием одной группы; 3) сравнение статистических групп.

При исследовании единичного случая однократно тестируется одна группа после экспериментального воздействия. Схематично этот план можно записать в виде:

Контроль внешних переменных и независимой переменной полностью отсутствует. В таком эксперименте нет никакого материала для сравнения. Результаты могут быть сопоставлены лишь с обыденными представлениями о реальности, научной информации они не несут.

План с предварительным и итоговым тестированием одной группы часто применяется в социологических, социально-психологических и педагогических исследованиях. Его можно записать в виде:

В этом плане отсутствует контрольная группа, поэтому нельзя утверждать, что изменения зависимой переменной (разница между O1 и O2), регистрируемые в ходе тестирования, вызваны именно изменением независимой переменной. Между начальным и итоговым тестированием могут произойти и другие «фоновые» события, воздействующие на испытуемых вместе с независимой переменной. Этот план не позволяет контролировать также эффект естественного развития и эффект тестирования.

Сравнение статистических групп будет точнее назвать планом для двух неэквивалентных групп с тестированием после воздействия. Он может быть записан в таком виде:

Этот план позволяет учитывать эффект тестирования, благодаря введению контрольной группы контролировать ряд внешних переменных. Однако с его помощью невозможно учесть эффект естественного развития, так как нет материала для сравнения состояния испытуемых на данный момент с их начальным состоянием (предварительное тестирование не проводилось). Для сравнения результатов контрольной и экспериментальной групп используют t-критерий Стьюдента. Однако следует учитывать, что различия в результатах тестирования могут быть обусловлены не экспериментальным воздействием, а различием в составе групп.

Квазиэкспериментальные планы являются своеобразным компромиссом между реальностью и строгими рамками истинных экспериментов. Существуют следующие типы квазиэкспериментальных планов в психологическом исследовании: 1) планы экспериментов для неэквивалентных групп; 2) планы с предварительным и итоговым тестированием различных рандомизированных групп; 3) планы дискретных временных серий.

План эксперимента для неэквивалентных групп направлен на установление причинно-следственной зависимости между переменными, однако в нем отсутствует процедура уравнивания групп (рандомизация). Этот план может быть представлен следующей схемой:

К проведению эксперимента в данном случае привлекаются две реальные группы. Обе группы тестируются. Затем одна группа подвергается экспериментальному воздействию, а другая – нет. Затем обе группы повторно тестируются. Результаты первого и второго тестирования обеих групп сопоставляют, для сравнения используют t-критерий Стьюдента и дисперсионный анализ. Различие O2 и O4 свидетельствует о естественном развитии и фоновом воздействии. Для выявления действия независимой переменной необходимо сравнивать 6(O1 O2) и 6(O3 O4), т. е. величины сдвигов показателей. Значимость различия приростов показателей будет свидетельствовать о влиянии независимой переменной на зависимую. Этот план аналогичен плану истинного эксперимента для двух групп с тестированием до и после воздействия (см. с. 118). Главным источником артефактов является различие в составе групп.

План с предварительным и итоговым тестированием различных рандомизированных групп отличается от плана истинного эксперимента тем, что предварительное тестирование проходит одна группа, а итоговое – эквивалентная группа, которая подверглась воздействию:

Главный недостаток этого квазиэкспериментального плана – невозможность контролировать эффект «фона» – влияние событий, происходящих наряду с экспериментальным воздействием в период между первым и вторым тестированием.

Планы дискретных временных серий подразделяются на несколько видов в зависимости от количества групп (одной или нескольких), а также в зависимости от количества экспериментальных воздействий (одиночного или серии воздействий).

План дискретных временных серий для одной группы испытуемых состоит в том, что первоначально определяется исходный уровень зависимой переменной на группе испытуемых с помощью серии последовательных замеров. Затем применяют экспериментальное воздействие и проводят серию аналогичных замеров. Сравнивают уровни зависимой переменной до и после воздействия. Схема этого плана:

Главный недостаток плана дискретных временных серий в том, что он не дает возможности отделить результат влияния независимой переменной от влияния фоновых событий, которые происходят в течение исследования.

Модификацией этого плана является квазиэксперимент по схеме временных серий, в котором воздействие перед замером чередуется с отсутствием воздействия перед замером. Его схема такова:

ХO1 – O2ХO3 – O4 ХO5

Чередование может быть регулярным или случайным. Этот вариант подходит лишь в том случае, когда эффект воздействия обратим. При обработке данных, полученных в эксперименте, серии разбивают на две последовательности и сравнивают результаты замеров, где было воздействие, с результатами замеров, где оно отсутствовало. Для сравнения данных используется t-критерий Стьюдента с числом степеней свободы n – 2, где n – число ситуаций одного типа.

Планы временных серий часто реализуются на практике. Однако при их применении нередко наблюдается так называемый «эффект Хотторна». Впервые его обнаружили американские ученые в 1939 г., когда проводили исследование на заводе Хотторна в Чикаго. Предполагалось, что изменение системы организации труда позволит повысить его производительность. Однако в ходе эксперимента любые изменения в организации труда приводили к повышению его производительности. В результате оказалось, что само по себе участие в эксперименте повысило мотивацию к труду. Испытуемые поняли, что ими лично интересуются, и стали работать продуктивнее. Чтобы контролировать этот эффект, должна использоваться контрольная группа.

Схема плана временных серий для двух неэквивалентных групп, из которых одна не получает воздействия, выглядит так:

O1O2O3O4O5O6O7O8O9O10

O1O2O3O4O5O6O7O8O9O10

Такой план позволяет контролировать эффект «фона». Обычно он используется исследователями при изучении реальных групп в образовательных учреждениях, клиниках, на производстве.

Еще один специфический план, который нередко используется в психологии, называют экспериментом ex-post-facto. Он часто применяется в социологии, педагогике, а также в нейропсихологии и клинической психологии. Стратегия применения этого плана состоит в следующем. Экспериментатор сам не воздействует на испытуемых. В качестве воздействия выступает некоторое реальное событие из их жизни. Экспериментальная группа состоит из «испытуемых», подвергшихся воздействию, а контрольная группа – из людей, не испытавших его. При этом группы по возможности уравниваются на момент своего состояния до воздействия. Затем проводится тестирование зависимой переменной у представителей экспериментальной и контрольной групп. Данные, полученные в результате тестирования, сопоставляются и делается вывод о влиянии воздействия на дальнейшее поведение испытуемых. Тем самым план ex-post-facto имитирует схему эксперимента для двух групп с их уравниванием и тестированием после воздействия. Его схема такова:

Если удается достичь эквивалентности групп, то этот план становится планом истинного эксперимента. Он реализуется во многих современных исследованиях. Например, при изучении посттравматического стресса, когда люди, перенесшие воздействия природной или техногенной катастрофы, или участники боевых действий тестируются на наличие посттравматического синдрома, их результаты сопоставляются с результатами контрольной группы, что позволяет выявить механизмы возникновения подобных реакций. В нейропсихологии травмы головного мозга, поражения определенных структур, рассматриваемые как «экспериментальное воздействие», предоставляют уникальную возможность для выявления локализации психических функций.

Планы истинных экспериментов для одной независимой переменной отличаются от других следующим:

1) использованием стратегий создания эквивалентных групп (рандомизация);

2) наличием как минимум одной экспериментальной и одной контрольной групп;

3) итоговым тестированием и сравнением результатов групп, получавших и не получавших воздействие.

Рассмотрим подробнее некоторые экспериментальные планы для одной независимой переменной.

План для двух рандомизированных групп с тестированием после воздействия. Его схема выглядит так:

Этот план применяют в том случае, если нет возможности или необходимости проводить предварительное тестирование. При равенстве экспериментальной и контрольной групп данный план является наилучшим, поскольку позволяет контролировать большинство источников артефактов. Отсутствие предварительного тестирования исключает как эффект взаимодействия процедуры тестирования и экспериментального задания, так и сам эффект тестирования. План позволяет контролировать влияние состава групп, стихийного выбывания, влияние фона и естественного развития, взаимодействие состава группы с другими факторами.

В рассмотренном примере использовался один уровень воздействия независимой переменной. Если же она имеет несколько уровней, то количество экспериментальных групп увеличивается до числа уровней независимой переменной.

План для двух рандомизированных групп с предварительным и итоговым тестированием. Схема плана выглядит следующим образом:

R O1 Х O2

Этот план применяется в том случае, если существуют сомнения в результатах рандомизации. Главный источник артефактов – взаимодействие тестирования и экспериментального воздействия. В реальности также приходится сталкиваться с эффектом неодновременности тестирования. Поэтому наилучшим считается проведение тестирования членов экспериментальной и контрольной групп в случайном порядке. Предъявление-непредъявление экспериментального воздействия также лучше проводить в случайном порядке. Д. Кэмпбелл отмечает необходимость контроля «внутригрупповых событий». Данный экспериментальный план хорошо контролирует эффект фона и эффект естественного развития.

При обработке данных обычно используются параметрические критерии t и F (для данных в интервальной шкале). Вычисляют три значения t: 1) между O1 и O2; 2) между O3 и O4; 3) между O2 и O4. Гипотезу о значимости влияния независимой переменной на зависимую можно принять в том случае, если выполняются два условия: 1) различия между O1 и O2 значимы, а между O3 и O4 незначимы и 2) различия между O2 и O4 значимы. Иногда удобнее сравнивать не абсолютные значения, а величины прироста показателей б(1 2) и б (3 4). Эти значения также сравниваются по t-критерию Стьюдента. В случае значимости различий принимается экспериментальная гипотеза о влиянии независимой переменной на зависимую.

План Соломона представляет собой объединение двух предыдущих планов. Для его реализации необходимы две экспериментальные (Э) и две контрольные (К) группы. Его схема выглядит так:

С помощью этого плана можно контролировать эффект взаимодействия предварительного тестирования и эффект экспериментального воздействия. Эффект экспериментального воздействия выявляется при сравнении показателей: O1 и O2; O2 и O4; O5 и O6; O5 и O3. Сравнение O6, O1 и O3 позволяет выявить влияние фактора естественного развития и фоновых воздействий на зависимую переменную.

Теперь рассмотрим план для одной независимой переменной и нескольких групп.

План для трех рандомизированных групп и трех уровней независимой переменной применяется в тех случаях, когда необходимо выявление количественных зависимостей между независимой и зависимой переменными. Его схема выглядит так:

При реализации этого плана каждой группе предъявляется лишь один уровень независимой переменной. При необходимости можно увеличить количество экспериментальных групп в соответствии с количеством уровней независимой переменной. Для обработки данных, полученных с помощью такого экспериментального плана, могут применяться все вышеперечисленные статистические методы.

Факторные экспериментальные планы применяются для проверки сложных гипотез о взаимосвязях между переменными. В факторном эксперименте проверяются, как правило, два типа гипотез: 1) гипотезы о раздельном влиянии каждой из независимых переменных; 2) гипотезы о взаимодействии переменных. Факторный план заключается в том, чтобы все уровни независимых переменных сочетались друг с другом. Число экспериментальных групп при этом равно числу сочетаний.

Факторный план для двух независимых переменных и двух уровней (2 х 2). Это наиболее простой из факторных планов. Его схема выглядит так.



Данный план выявляет эффект воздействия двух независимых переменных на одну зависимую. Экспериментатор сочетает возможные переменные и уровни. Иногда используются четыре независимые рандомизированные экспериментальные группы. Для обработки результатов применяется дисперсионный анализ по Фишеру.

Существуют более сложные версии факторного плана: 3 х 2 и 3 х 3 и т. д. Дополнение каждого уровня независимой переменной увеличивает число экспериментальных групп.

«Латинский квадрат». Является упрощением полного плана для трех независимых переменных, имеющих два и более уровней. Принцип латинского квадрата состоит в том, что два уровня разных переменных встречаются в экспериментальном плане только один раз. Тем самым значительно сокращаются количество групп и экспериментальная выборка в целом.

Например, для трех независимых переменных (L, M, N) с тремя уровнями у каждой (1, 2, 3 и N(A, В, С)) план по методу «латинского квадрата» будет выглядеть так.

В этом случае уровень третьей независимой переменной (А, В, С) встречается в каждой строке и в каждой колонке по одному разу. Комбинируя результаты по строкам, столбцам и уровням, можно выявить влияние каждой из независимых переменных на зависимую, а также степень попарного взаимодействия переменных. Применение латинских букв А, В, С для обозначения уровней третьей переменной традиционно, поэтому метод и получил название «латинский квадрат».

«Греко-латинский квадрат». Этот план применяется в случае, если необходимо исследовать влияние четырех независимых переменных. Он строится на основе латинского квадрата для трех переменных, при этом к каждой латинской группе плана присоединяется греческая буква, обозначающая уровни четвертой переменной. Схема для плана с четырьмя независимыми переменными, каждая из которых имеет три уровня, будет выглядеть так:

Для обработки данных, полученных в плане «греко-латинский квадрат», применяется метод дисперсионного анализа по Фишеру.

Главная проблема, которую позволяют решить факторные планы, – определение взаимодействия двух и более переменных. Эту задачу невозможно решить, применяя несколько обычных экспериментов с одной независимой переменной. В факторном плане вместо попыток «очистить» экспериментальную ситуацию от дополнительных переменных (с угрозой для внешней валидности) экспериментатор приближает ее к реальности, вводя некоторые дополнительные переменные в разряд независимых. При этом анализ связей между изучаемыми признаками позволяет выявить скрытые структурные факторы, от которых зависят параметры измеряемой переменной.

Формальное планирование как выбор схем сочетается с обоснованием достоверности или значимости получаемых эмпирических результатов. Выделяют следующие задачи формального планирования исследования:

  • - обеспечение внутренней валидности эксперимента;
  • - обеспечение условий для принятия решений об экспериментальном эффекте, или эффекте действия НП;
  • - применение схем обработки данных, адекватных метрике использованных шкал и способу сбора данных.

В узком смысле к "планированию эксперимента" относятся два момента, связанные с учетом последующих статистических решений.

Во-первых, обсуждение вопроса о том, как будет оцениваться экспериментальный эффект. Решение может касаться указанного выбора между мерами связи и мерами различий. Статистические меры связи могут быть использованы для установления ковариации между НП и ЗП, а меры различий могут свидетельствовать об отсутствии различий в значениях ЗП между разными экспериментальными условиями. Соответствующие статистические гипотезы уже не включают предположений о законообразном действии НП, а формируются только как гипотезы о сравнении выборочных показателей ЗП (средних, дисперсий и т.д.). При одном и том же экспериментальном плане возможно использование разных планов обработки данных. Вид экспериментальной гипотезы иногда подсказывает, какой способ установления экспериментального факта по выборочным значениям ЗП следует предпочесть. Часто одни и те же данные можно обрабатывать разными способами, чтобы убедиться в преимуществах того или иного способа представления полученных зависимостей.

Во-вторых, установление минимального эффекта, достаточного для вынесения суждения о полученных различиях в экспериментальном и контрольном условиях или наблюдаемой связи между изменениями НП и ЗП. Под формальным планированием эксперимента иногда понимают математическое планирование. Оно начинается с выбора математической модели, описывающей события и взаимосвязи между ними, а также включает указанные ранее моменты определения минимальных эффектов и а-, р- ошибок при отвержении и неотвержении нуль-гипотез.

Здравый смысл или теоретически обоснованные ожидания позволяют принять решение о том, какие изменения в значениях ЗП можно считать достаточными для вывода о результате действия НП. Таким образом, математическое планирование может приводить к формализации решений о минимальном эффекте, но не может заменить собой его обоснования.

Установление минимального эффекта включает также определение вероятности ошибок первого и второго рода (а- и р- уровень), о которых было сказано в главе 5. Для а- ошибки принимается общее правило указания процента или возможной вероятности отвергнуть нуль-гипотезу как гипотезу об отсутствии различий или отсутствии связи, когда она верна. Для р- ошибки в силу ее связи с величиной устанавливаемого эффекта такого общего правила нет.

Последнее касается практически всех видов использования количественной оценки психологических эффектов, что не следует путать с установлением количественных закономерностей, или количественными законами в психологии. Количественно оценивается и влияние качественно представленной НП на любую ЗП - как качественную, так и количественную. Непараметрическая и параметрическая статистика позволяют это делать при учете шкал каждой из двух переменных.

Психолог, переходя на уровень проверки статистических гипотез, начинает работать с выборочными значениями переменных и вероятностными моделями для оценки статистических гипотез, обсуждая или как бы вынося за скобки вопрос о применимости соответствующих моделей с точки зрения содержания переменных.

Например, вопрос о приемлемости использования модели случайного распределения применительно к показателям измерения познавательной потребности человека, измеренной с помощью той или иной психологической методики, решается положительно только для того исследователя, который считает соответствующую базисную переменную познавательной мотивации случайно варьирующей в выборке. Если выборка испытуемых такова, что можно "подозревать" более высокий уровень выраженности познавательной мотивации у всех испытуемых (в случае так называемых селективных выборок), то модель случайного распределения оказывается неадекватной. Психолог может не иметь предварительных данных о виде распределения измеряемых показателей, но в рамках решения вопросов о применимости тех или иных методов статистической обработки данных он становится на определенные позиции выбора статистических критериев. Формальное планирование и здесь включает оценку содержательной интерпретации данных.

Формальное планирование эксперимента психолог должен завершить указанием схемы (плана) управления НП, которая, в свою очередь, будет существенно определять способы обработки данных. Установление экспериментального эффекта - результат использования определенного плана сбора данных, которые подлежат обработке с целью проверки статистических гипотез.

Обработка данных - необходимый элемент установления экспериментальных эффектов, включая статистические решения.

Первый этап - это представление значений ЗП в таком виде, который позволяет использовать те или иные планы обработки данных. Последние данные не повторяют прямо экспериментальных схем, но могут быть в разной степени адекватны им. Один из аспектов этой адекватности - логичный переход от содержательной (экспериментальной) гипотезы к формулировке статистических гипотез (в первую очередь это нуль-гипотеза как гипотеза об отсутствии различий между выборочными значениями ЗП).

Второй этап - правильный выбор статистических критериев с точки зрения учета шкалы, которой соответствует измеренная психологическая переменная (шкалы наименований, порядка, интервалов, отношений). С учетом этих составляющих психолог осуществляет обратный ход размышлений о возможности выбора между экспериментальной и контргипотезами: от статистических решений к выводу об экспериментально установленном факте и далее к достоверным выводам о том, следует ли считать экспериментальную гипотезу выдержавшей эмпирическую проверку.

Напомним, что эмпирическая верификация гипотезы это оценка соответствия эмпирических данных предполагавшейся связи между НП и ЗП. Установление экспериментальных фактов - самый строгий способ эмпирической проверки, но не "доказательство" в собственном смысле. Любой экспериментальный факт является результатом принятия решения, поэтому всякого рода апелляции к фактам как доказательствам рассматриваются как ошибки выводов, или артефактные выводы.

1. История возникновения планирования эксперимента

Планирование эксперимента – продукт нашего времени, однако истоки его теряются в глубине веков.

Истоки планирования эксперимента уходят в глубокую древность и связаны с числовой мистикой, пророчествами и суевериями.

Это собственно не планирование физического эксперимента, а планирование числового эксперимента, т.е. расположение чисел так, чтобы выполнялись некоторые строгие условия, например, на равенство сумм по строкам, столбцам и диагоналям квадратной таблицы, клеточки которой заполнены числами натурального ряда.

Такие условия выполняются в магических квадратах, которым, по-видимому, принадлежит первенство в планировании эксперимента.

Согласно одной легенде примерно в 2200 г. до н.э. китайский император Ю выполнял мистические вычисления с помощью магического квадрата, который был изображен на панцире божественной черепахи.

Квадрат императора Ю

Клетки этого квадрата заполнены числами от 1 до 9, и суммы чисел по строкам, столбцам и главным диагоналям равны 15.

В 1514 г. немецкий художник Альбрехт Дюрер изобразил магический квадрат в правом углу своей знаменитой гравюры-аллегории «Меланхолия». Два числа в нижнем горизонтальном ряду A5 и 14) составляют год создания гравюры. В этом состояло своеобразное «приложение» магического квадрата.

Квадрат Дюрера

В течение нескольких веков построение магических квадратов занимало умы индийских, арабских, немецких, французских математиков.

В настоящее время магические квадраты используются при планировании эксперимента в условиях линейного дрейфа, при планировании экономических расчетов и составлении рационов питания, в теории кодирования и т.д.

Построение магических квадратов является задачей комбинаторного анализа, основы которого в его современном понимании заложены Г. Лейбницем. Он не только рассмотрел и решил основные комбинаторные задачи, но и указал на большое практическое применение комбинаторного анализа: к кодированию и декодированию, к играм и статистике, к логике изобретений и логике геометрии, к военному искусству, грамматике, медицине, юриспруденции, технологии и к комбинации наблюдений. Последняя область применения наиболее близка к планированию эксперимента.

Одной из комбинаторных задач, имеющей прямое отношение к планированию эксперимента, занимался известный петербургский математик Л. Эйлер. В 1779 г. он предложил задачу о 36 офицерах как некоторый математический курьез.

Он поставил вопрос, можно ли выбрать 36 офицеров 6 рангов из 6 полков по одному офицеру каждого ранга от каждого полка и расположить их в каре так, чтобы в каждом ряду и в каждой шеренге было бы по одному офицеру каждого ранга и по одному от каждого полка. Задача эквивалентна построению парных ортогональных 6x6 квадратов. Оказалось, что эту задачу решить невозможно. Эйлер высказал предположение, что не существует пары ортогональных квадратов порядка п=1 (mod 4).

Задачей Эйлера, в частности, и латинскими квадратами вообще занимались впоследствии многие математики, однако почти никто из них не задумывался над практическим применением латинских квадратов.

В настоящее время латинские квадраты являются одним из наиболее популярных способов ограничения на рандомизацию при наличии источников неоднородностей дискретного типа в планировании эксперимента. Группировка элементов латинского квадрата, благодаря своим свойствам (каждый элемент появляется один и только один раз в каждой строке и в каждом столбце квадрата), позволяет защитить главные эффекты от влияния источника неоднородностей. Широко используются латинские квадраты и как средство сокращения перебора в комбинаторных задачах.

Возникновение современных статистических методов планирования эксперимента связано с именем Р. Фишера.

С 1918 г. он начал свою известную серию работ на Рочемстедской агробиологической станции в Англии. В 1935 г. появилась его монография «Design of Experiments», давшая название всему направлению.

Среди методов планирования первым был дисперсионный анализ (кстати, Фишеру принадлежит и термин «дисперсия»). Фишер создал основы этого метода, описав полные классификации дисперсионного анализа (однофакторный и многофакторный эксперименты) и неполные классификации дисперсионного анализа без ограничения и с ограничением на рандомизацию. При этом он широко использовал латинские квадраты и блок-схемы. Вместе с Ф. Йетсом он описал их статистические свойства. В 1942 г. А. Кишен рассмотрел планирование по латинским кубам, которое явилось дальнейшим развитием теории латинских квадратов.

Затем Р. Фишер независимо опубликовал сведения об ортогональных гипер-греко-латинских кубах и гипер-кубах. Вскоре после этого 1946–1947 гг.) Р. Рао рассмотрел их комбинаторные свойства. Дальнейшему развитию теории латинских квадратов посвящены работы X. Манна A947–1950 гг.).

Исследования Р. Фишера, проводившиеся в связи с работами по агробиологии, знаменуют начало первого этапа развития методов планирования эксперимента. Фишер разработал метод факторного планирования. Йегс предложил для этого метода простую вычислительную схему. Факторное планирование получило широкое распространение. Особенностью полного факторного эксперимента является необходимость ставить сразу большое число опытов.

В 1945 г. Д. Финни ввел дробные реплики от факторного эксперимента. Это позволило резко сократить число опытов и открыло дорогу техническим приложениям планирования. Другая возможность сокращения необходимого числа опытов была показана в 1946 г. Р. Плакеттом и Д. Берманом, которые ввели насыщенные факторные планы.

В 1951 г. работой американских ученых Дж. Бокса и К. Уилсона начался новый этап развития планирования эксперимента.

Эта работа подытожила предыдущие. В ней ясно сформулирована и доведена до практических рекомендаций идея последовательного экспериментального определения оптимальных условий проведения процессов с использованием оценки коэффициентов степенных разложений методом наименьших квадратов, движения по градиенту и отыскания интерполяционного полинома (степенного ряда) в области экстремума функции отклика («почти стационарной» области).

В 1954–1955 гг. Дж. Бокс, а затем Дж. Бокс и П. Юл показали, что планирование эксперимента можно использовать при исследовании физико-химических механизмов процессов, если априори высказаны одна или несколько возможных гипотез. Здесь планирование эксперимента пересекалось с исследованиями по химической кинетике. Интересно отметить, что кинетику можно рассматривать как метод описания процесса с помощью дифференциальных уравнений, традиции которого восходят к И. Ньютону. Описание процесса дифференциальными уравнениями, называемое детерминистическим, нередко противопоставляется статистическим моделям.

Бокс и Дж. Хантер сформулировали принцип ротатабельности для описания «почти стационарной» области, развивающейся в настоящее время в важную ветвь теории планирования эксперимента. В той же работе показана возможность планирования с разбиением на ортогональные блоки, указанная ранее независимо де Бауном.

Дальнейшим развитием этой идеи было планирование, ортогональное к неконтролируемому временному дрейфу, которое следует рассматривать как важное открытие в экспериментальной технике – значительное увеличение возможностей экспериментатора.


2. Математическое планирование эксперимента в научных исследованиях

2.1 Основные понятия и определения

Под экспериментом будем понимать совокупность операций совершаемых над объектом исследования с целью получения информации о его свойствах. Эксперимент, в котором исследователь по своему усмотрению может изменять условия его проведения, называется активным экспериментом. Если исследователь не может самостоятельно изменять условия его проведения, а лишь регистрирует их, то это пассивный эксперимент.

Важнейшей задачей методов обработки полученной в ходе эксперимента информации является задача построения математической модели изучаемого явления, процесса, объекта. Ее можно использовать и при анализе процессов и при проектировании объектов. Можно получить хорошо аппроксимирующую математическую модель, если целенаправленно применяется активный эксперимент. Другой задачей обработки полученной в ходе эксперимента информации является задача оптимизации, т.е. нахождения такой комбинации влияющих независимых переменных, при которой выбранный показатель оптимальности принимает экстремальное значение.

Опыт – это отдельная экспериментальная часть.

План эксперимента – совокупность данных определяющих число, условия и порядок проведения опытов.

Планирование эксперимента – выбор плана эксперимента, удовлетворяющего заданным требованиям, совокупность действий направленных на разработку стратегии экспериментирования (от получения априорной информации до получения работоспособной математической модели или определения оптимальных условий). Это целенаправленное управление экспериментом, реализуемое в условиях неполного знания механизма изучаемого явления.

В процессе измерений, последующей обработки данных, а также формализации результатов в виде математической модели, возникают погрешности и теряется часть информации, содержащейся в исходных данных. Применение методов планирования эксперимента позволяет определить погрешность математической модели и судить о ее адекватности. Если точность модели оказывается недостаточной, то применение методов планирования эксперимента позволяет модернизировать математическую модель с проведением дополнительных опытов без потери предыдущей информации и с минимальными затратами.

Цель планирования эксперимента – нахождение таких условий и правил проведения опытов при которых удается получить надежную и достоверную информацию об объекте с наименьшей затратой труда, а также представить эту информацию в компактной и удобной форме с количественной оценкой точности.



Случайные статьи

Вверх