Обработка экспериментальных данных (I). Определение количества повторных измерений.

    Ранее мы рассматривали в основном обработку данных рутинного анализа по утверждённым методикам из тех или иных нормативных документов. В процессе внедрения новых электролитов, растворов для подготовки поверхности и финальной обработки не всегда удаётся найти ГОСТированные методы определения, поэтому приходится разрабатывать новые методы анализа или адаптировать имеющиеся в НД. Поэтому мы рассмотрим обработку экспериментальных данных на более ранних стадиях – адаптация и разработка новых методик анализа.

    Рассмотрим определение наименьшего количества параллельных измерений на примере разработки методики определения количества полиметилгидридсилоксана (ПМГС) в составе для  гидрофобизирования поверхности фосфатированных оцинкованных и стальных деталей. Согласно рецептуре в растворе гидрофобизирования должно быть 3-7 массовых процента ПМГС. Для технологического контроля раствора гидрофобизирования была разработана методика упрощённого весового определения, основанная на испарении растворителя из бинарной смеси «ПМГС – растворитель» с последующим взвешиванием ПМГС; параллельно определяется коэффициента летучести ПМГС, поправка на который учитывается при расчётах.

    В первоначальный момент разработки метода контроля технолог гальванического участка и инженер-химик совместно должны оценить пределы погрешности метода контроля. Точность анализа должна, с одной стороны, обеспечивать стабильность управления процессом на производственном участке, а, с другой стороны, не должна содержать «погони» за избыточной точностью, приводящей к излишним трудозатратам со стороны аналитической лаборатории. Для управляемости на производственном участке процесса гидрофобизирования критичным будет вести определение с точностью со среднеквадратичной выборочной ошибкой (коэффициент вариации) 16%, что соответствует 40%-ной относительной ошибке определения при 95% доверительной вероятности (Р=95%) в случае трёх параллельных измерений (соответствует предельной ситуации С=(5+/-2)%, что при значительных усилиях позволяет поддерживать рабочую концентрацию в ванне около 5%). В свою очередь для аналитической лаборатории критичным будет проводить измерения с точностью 0,5% и менее, заложенной в ГОСТ 20841.2-75 «Продукты кремнийорганические. Методы определения массовой доли кремния», которая в принципе ограничивает возможности лаборатории. Соответственно, оптимальная точность анализа будет находиться где-то в интервале от 0,5 до 40%.

   Ошибка определения в 40% держит процесс на грани управляемости при значительных усилиях специалистов производства, ошибка в 0,5% излишне перегружает специалистов аналитической лаборатории выполнением достаточно трудоёмких и продолжительных процедур, поэтому оптимальным пределом погрешности, с которым будет удобно работать гальваническому участку, был выбран 5-10% при Р=95%. Это тот интервал недостоверности, который технолог производственного участка может без дополнительных усилий компенсировать выдержкой концентрации целевого компонента на срединном рецептурном значении.

Примечание: подобными рассуждениями нельзя руководствоваться при входном контроле материалов. В этом случае принимается только тот предел погрешности, который заложен в НД.

     При анализе эталонного раствора (3,1% ПМГС) получены следующие данные: 3,05; 3,08; 3,10; 3,11; 3,07%. Также были проведены измерения для растворов 6,2% и 8,9%, но они показали лучшие результаты (меньший размах результатов измерения), поэтому мы исключили их из рассмотрения, а необходимое количество измерений будем рассчитывать по данным выборки с худшей воспроизводимостью результатов.

    Определим количество повторных измерений, которое необходимо проводить для получения результатов с заданной точностью. Расчёт проведём для точности 1%, 2% и 5%.

1) Определим выборочное среднее значение:

х¯ = (∑ хi)/n = (3,05+3,08+3,10+3,11+3,07)/5 = 3,082

2) Рассчитаем выборочную дисперсию:

S2 = ( ∑(хi – х¯)2 ) / (n-1) = 0,00057

3) Выборочное стандартное (среднеквадратичное) отклонение:

S = √ S2 = 0,02387

4) Коэффициент вариации:

V = S/100х¯ = 0,77465

5) Доверительные интервалы для генерального среднего Х:

х¯ - t•S/√n < X < х¯ + t•S/√n, где t – критерий Стьюдента, который выбирается по таблице 1 при числе степеней свободы f= n–1 (в нашем случае при 5 параллельных измерениях f=5-1=4) и доверительной вероятности Р=95%.

Styudent

t (4; 0,95) = 2,78

3,082 – 2,78•0,02387/√5 < X < 3,082 + 2,78•0,02387/√5

3,052 < X < 3,112

6) Необходимое число наблюдений:

Ориентировочный расчёт.

m0 = V2•t2/T2 , где

T – относительная ошибка, %,

t – показатель достоверности (критерий Стьюдента) при числе степеней свободы f→∞, t(∞; 0,95) = 1,96,

V – коэффициент вариации.

Расчётное значение округляется до следующего целого числа.

Для T=1%

m0 = V2•t2/T2 = (0,77465^2)•(1,96^2)/(1^2) = 2,305 → 3 измерения,

Для T=2%

m0 = V2•t2/T2 = (0,77465^2)•(1,96^2)/(2^2) = 0,576 → 1 измерение,

Для T=5% (это вычисление производить не обязательно, т.к. мы уже получили минимальный результат на более высоком уровне точности)

m0 = V2•t2/T2 = (0,77465^2)•(1,96^2)/(5^2) = 0,092 → 1 измерение.

Уточнённый расчёт:

m0 = (V2•t2)•(1±(1/2n) 0,5)2/T2, где

T – относительная ошибка, %,

t – показатель достоверности (критерий Стьюдента) при числе степеней свободы f=4. t (4; 0,95) = 2,78,

V – коэффициент вариации.

Для T=1%

m0min = (V2•t2)•(1-(1/2n) 0,5)2/T2 = (0,77465^2)•(2,78^2)•(1-(1/(2•5)) 0,5)2/(1^2) = 2,168 → 3 измерения,

m0max = (V2•t2)•(1+(1/2n) 0,5)2/T2 = (0,77465^2)•(2,78^2)•(1+(1/(2•5)) 0,5)2/(1^2) = 8,034 → 9 измерений.

Т.о. необходимо 6±3 измерения.

Для T=2%

m0min = (0,77465^2)•(2,78^2)•(1-(1/(2•5))0,5)2/(2^2) = 0,542 → 1 измерение,

m0max = (0,77465^2)•(2,78^2)•(1+(1/(2•5))0,5)2/(2^2) = 2,009 → 3 измерения.

Т.о. необходимо 2±1 измерения.

Для T=5% расчёт приводить не будем – если количество измерений достаточно для точности 2%, то очевидно, что их достаточно для более низких уровней точности.

Вывод: количество измерений, которое мы произвели, было достаточно для получения результата с заранее установленной точностью 5 процентов. Количество проведённых измерений даже больше количества необходимых измерений, поэтому в будущем при рутинном анализе мы сможем либо принять такое количество параллельных измерений, либо сократить их количество, например, до удобных нам трёх. При этом мы сможем гарантировать относительную ошибку в 2%.

Далее рассмотрим исключение грубых ошибок при измерениях – см. «Обработка экспериментальных данных (II). Исключение грубых промахов».

Литература:

1. Агаянц И.М. Азы статистики в мире химии: Обработка экспериментальных данных – СПб: Научные основы и технологии, 2015. – 618 с.