Контрольные карты (IV). Предварительный анализ: проверка однородности средних значений.

Мы дошли до финального этапа предварительного анализа, ради которого выполнялись все предыдущие расчёты. Ранее мы пришли к выводу о нормальности распределения данных в выборках и к выводу о наличии неоднородности дисперсии четвёртой выборки с остальными, на основании чего исключили эту выборку из дальнейшего рассмотрения. Теперь мы можем оценить однородность средних значений оставшихся трёх выборок.

     Проверку однородности средних мы будем проводить двумя методами - по t-критерию Стьюдента (сравнение средних попарно) и при помощи множественного рангового критерия Дункана (сравнение нескольких средних).


Исходные данные:

 

Выборка 1

Ацидиметрическое определение H2SO4 в электролите лужения

(титрование заместителя)

Выборка 2

Йодометрическое определение меди в электролите меднения

(титрование заместителя)

Выборка 3

Комплексонометрическое определение никеля в электролите никелирования

(прямое титрование)

Выборка 4 (исключена)

Комплексонометрическое определение свободного кобальта в электролите золочения

(обратное титрование)

x1 0,52 0,99 0,83 3,38
x2 0,62 0,90 0,85 2,41
x3 0,67 1,29 0,87 2,69
x4 0,72 0,77 1,03 2,90
x5 0,83 0,75 1,1 3,23
x6 0,84 1,19 1,19 2,84
x7 0,87 0,38 1,3 1,15
x8 0,91 1,07 1,36 4,17
x9 1,10 1,50 1,38 5,06
x10 1,29 0,89 1,61 2,05

Средние значения каждой выборки:
x1cредн. = ∑xi1/n1 = (0,52+0,62+0,67+0,72+0,83+0,84+0,87+0,91+1,10+1,29)/10 = 0,84

x2cредн. = ∑xi2/n2 = 0,97

x3cредн. = ∑xi3/n3 = 1,15

x4cредн. = ∑xi4/n4 = 2,99.
Дисперсии каждой выборки:

S12 = ( ∑(xi1– x¯1)2) / (n1-1) = [(0,84-0,52)2+(0,84-0,62)2+…+(0,84-1,29)2]/(10-1) = 0,0522

S22 = ( ∑(xi2– x¯2)2) / (n2-1) = 0,0989

S32 = ( ∑(xi3– x¯3)2) / (n3-1) = 0,0689

S42 = ( ∑(xi4– x¯4)2) / (n4-1) = 1,1792.

  Выборка 1 Выборка 2 Выборка 3 Выборка 4
xcредн. 0,84 0,97 1,15 2,99
S2 0,0522 0,0989 0,0689 1,1792
  1. Оценка по t-критерию Стьюдента.

   Средние значения будем сравнивать попарно. Для сравнения средних найдём статистику tдля случая однородных дисперсий и сравним её с табличным значением tν,αпри уровне значимости α=0,05 и степени свободы ν=m1+m2-2=10+10-2=18. Случай неоднородных дисперсий рассмотрен в книге по ссылке ниже.

ст1

А) Выборка 1 и 2.

xcредн. 0,84 0,97 1,15
S2 0,0522 0,0989 0,0689

1) Вычисляем среднюю дисперсию воспроизводимости:

S2a = ((m1-1)•S12+(m2-1)•S12)/(m1+m2-2), в нашем случае формула упрощается и имеет вид

S2a =(S12 + S22)/2 = (0,0522+0,0989)/2 = 0,0755

2) Вычисляемстатистику t:

t = (x1‾ - x2‾)/[(S2a)0,5•(1/m1+1/m2)0,5] = (0,97-0,84)/[(0,0755)0,5•(1/10+1/10)0,5] = 1,1064

Табличное значение t18;0,05=2,101

t=1,106 < t18;0,05=2,101, различие незначимо.

Б) Выборка 1 и 3.

xcредн. 0,84 0,97 1,15
S2 0,0522 0,0989 0,0689

1) Вычисляем среднюю дисперсию воспроизводимости:

S2a =(S12 + S22)/2 = (0,0522+0,0689)/2 = 0,0606

2) Вычисляемстатистику t:

t = (x1‾ - x2‾)/[(S2a)0,5•(1/m1+1/m2)0,5] = (0,97-0,84)/[(0,0606)0,5•(1/10+1/10)0,5] = 2,862

t=2,862 >t18;0,05=2,101, различие значимо.

В) Выборка 2 и 3.

xcредн. 0,84 0,97 1,15
S2 0,0522 0,0989 0,0689

1) Вычисляем среднюю дисперсию воспроизводимости:

S2a =(S12 + S22)/2 = (0,0989+0,0689)/2 = 0,0839

2) Вычисляемстатистику t:

t = (x1‾ - x2‾)/[(S2a)0,5•(1/m1+1/m2)0,5] = (1,15-0,97)/[(0,0839)0,5•(1/10+1/10)0,5] = 1,382

t=1,382< t18;0,05=2,101, различие незначимо.

Подтвердим наши выводы при помощи критерия Дункана.

  1. Оценка при помощи множественного рангового критерия Дункана.

   Критерий применяется для сравнения большого количества выборок.

1) Распределяем (ранжируем) средние значения выборок от большего к меньшему:

1,15 0,97 0,84

2) Вычисляем степень свободы для вычисления дисперсии воспроизводимости:

ν = n•(m-1)=3•(10-1)=27, где

n – количество сравниваемых средних (n=3), m – объём каждой выборки (m = 10).

3) Вычисляем дисперсию воспроизводимости:

S2a = ∑Si2/n = (0,0522+0,0989+0,0689)/3 = 0,0733

4) Вычисляем нормированную ошибку среднего:

S = (S2a/m)0,5 = (0,0733/10)0,5 = 0,0856


Находим в справочной таблице значимые ранги критерия Дункана для уровня значимости α=0,05, степени свободы ν=27 и количества значимых рангов n-1=3-1=2.

ду1

В таблице нет значений для ν=27. Мы считаем использование линейной интерполяции в данном случае не оправданным и просто берём значения для меньшей степени свободы ν=26: 2,91; 3,06.

Для удобства сведём данные в таблицу:

Градации 3 2 1
Обозначения* х1 х2 х3
Средние 1,15 0,97 0,84
Ранги - 2,91 3,06

* изначальные обозначения средних значений выборок на этапе ранжирования были изменены для удобства последующих расчётов.

5) Вычисляем наименьшие значимые ранги (НЗР):

р=n=3

НЗРn=2,91х0,0856 = 0,2491

р=n-1=2

НЗРn-1=3,06х0,0856 = 0,2619

   Далее вычисляются разности между средними значениями, начиная с крайних (х1 и х3); эта разность сравнивается с НЗР при р=n=3, затем находится разность максимального среднего и первого, которое превосходит минимальное (х1 и х2), и сравнивается с НЗР при р=n-1=2 и т.д. Это сравнение продолжается для второго по величине среднего (х2); оно сравнивается с наименьшими и т.д., пока не будут исследованы все n(n-1)/2 возможные пары. Если разница между двумя средними будет меньше соответствующего НЗР, то можно считать, что эти средние не различаются. Количество сравниваемых пар в нашем случае n(n-1)/2 = 3•(3-1)/2 = 3:

х13 = 0,31 >0,2619 различие значимо

х12 = 0,18 < 0,2491    различие не значимо

х23 = 0,13 <0,2491     различие не значимо

Примечание: напомним, что индексы величин x в данном случае указывают не на принадлежность к изначальным выборкам, а на величины средних, где х1 – самое большое, х3 – самое малое значение. Индексы были присвоены на этапе ранжирования.

Вывод: Данные анализа по t-критерию и множественного рангового критерия Дункана позволяют сделать вывод об однородности средних значений выборок №1 и №2; №2 и №3, и неоднородности средних значений выборок №1 и №3. Таким образом, мы можем наносить результаты анализов по методикам №1 и №2 или №2 и №3 на одну контрольную карту. Мы будем считать данные методик №1 и №2 более однородными, т.к. критерии по ним получились меньшими в сравнении с методиками №2 и №3, хотя при условии однородности можно группировать их произвольно. Таким образом, для четырёх рассмотренных методик мы будем составлять три контрольные карты.
   В ходе вычислений на стадии предварительного анализа мы убедились в нормальности распределения (фактически в удовлетворительной настройке процесса), в однородности данных и исключили необходимость построения одной контрольной карты из четырёх возможных.

   В следующей части мы рассмотрим построение контрольной карты для результатов анализов по методикам, из которых были взяты выборки 1 и 2.

Литература:

1. Агаянц И.М. Азы статистики в мире химии: Обработка экспериментальных данных – СПб: Научные основы и технологии, 2015. – 618 с.