Обработка экспериментальных данных (II). Исключение грубых промахов.

   В процессе измерений могут возникать случайные ошибки разного рода, приводящие к появлению резко выделяющихся значений в выборках, т.н. грубых промахов. Такие данные могут значительно искажать результаты последующей обработки данных, поэтому необходимо иметь инструменты для проверки однородности результатов повторных измерений, т.е. гипотезы о том, что все измерения, входящие в полученную совокупность, можно рассматривать как значения одной и той же случайной величины, подчиняющейся закону нормального распределения. Если имеются подозрения на неоднородность, то  необходимо оценить подозрительные результаты и исключить такие данные из последующих расчётов.

       Допустим, при измерении микротвёрдости гальванопластического никелевого осадка, полученного из электролита после введения новой добавкой, мы получили следующие данные:

616 618 616  618 634 624 620 624 618 626

  Сомнения вызывает значение 634 кгс/мм2. Мы должны оценить, является ли это значение грубым промахом, вызванным ошибкой исполнителя измерения, либо оно всё-таки принадлежит той же генеральной совокупности и просто находится в хвосте распределения. Рассмотрим три инструмента оценки подозрительных результатов: проверка по критерию Романовского, проверка по Q-критерию и оценка R-распределения.

Проверка по критерию Романовского.

   Данный способ применяется при малом числе параллельных измерений. При расчёте сомнительный результат исключается, а по остальным результатам вычисляют среднее значение и дисперсию. Сомнительный результат отбрасывается из дальнейших расчётов, если соблюдается неравенство:

‌‌‌‌‌‌׀xmax(min) - x‾‌‌‌׀/S ≥ t’табл, где

xmax(min) – сомнительный результат, самый большой или самый маленький в выборке,

x‾ – среднее арифметическое оставшихся значений после исключения сомнительного результата,

t’ табл – табличное значение критерия Романовского,

S – среднее квадратичное отклонение выборка после исключения сомнительного результата.

Значение критерия Романовского берут из таблицы при числе степеней свободы f=n (где n – число параллельных измерений за вычетом сомнительного результата) и уровне значимости 5%.

Kriteriy Romanovskogo

    Если результат не будет признан грубым промахом, его включают в расчёты. Таким образом проверяют все сомнительные (самые большие и малые) результаты в выборке.

Проведём расчёты для нашей выборки:

[616; 618; 616; 618; 624; 620; 624; 618; 626], исключив из неё значение 634.

1. Определим выборочное среднее значение:

х¯ = (∑ хi)/n = (616+618+…626)/9 = 620

2) Рассчитаем выборочную дисперсию:

S2 = ( ∑(хi – х¯)2 )/(n-1) = [(620-616)2 + (620-618)2 + … + (620-626)2]/(9-1) = 14

3) Выборочное стандартное (среднеквадратичное) отклонение:

S = √S2 = √14 = 3,742

4) Критерий Романовского:

t’ = ‌‌‌‌‌‌׀xmax(min) - x‾‌‌‌׀/S = ‌‌‌‌‌‌׀634 - 620‌‌‌׀/3,742 = 3,742      >     t’табл (9; 0,05) = 2,431 (см. таблицу выше).

Результат 634 можно признать грубым промахом.

Проверка по Q-критерию.

Данный критерий также подходит для небольшого числа параллельных измерений. Для расчётов располагают опытные данные в порядке возрастания или убывания в зависимости от того, меньшее значение подозрительно или большее; подозрительный результат оказывается последним. Затем вычисляется Q-критерий:

Q =  ‌‌‌‌‌‌׀xn- xn-1‌‌‌׀/‌‌‌‌‌‌׀xn – x1‌‌׀, где

x1‌‌ – первое значение ранжированного ряда,

xn-1 – предпоследнее значение ранжированного ряда,

xn – последнее значение ранжированного ряда (сомнительный результат).

‌‌‌‌‌‌׀xn – x1‌‌׀ – размах выборки.

Сомнительный результат исключают, если величина расчётного значения Q больше величины табличного Qтабл при числе степеней свободы f=n, который находят по таблице:

Q kriteriy

Расчёт для нашей выборки:

[616; 618; 616; 618; 634; 624; 620; 624; 618; 626]

1) Ранжируем результаты (распределяем от меньшего к большему):

[616; 616; 618; 618; 618; 620; 624; 624; 626; 634]

2) Вычисляем Q-критерий:

Q = ‌‌‌‌‌‌׀xn- xn-1‌‌‌׀/‌‌‌‌‌‌׀xn – x1׀ = ‌‌‌‌‌‌׀634 - 626‌‌‌׀/‌‌‌‌‌‌׀634 – 616‌׀ = 0,444   >   Qтабл(10; 0,05) = 0,412 (см. таблицу выше).

Результат 634 можно признать грубым промахом.

Проверка при помощи R-распределения.

   Для расчётов этим способом вычисляют среднее значение выборочных величин, включая сомнительную. Далее вычисляется среднее квадратичное отклонение и параметр R для подозрительного значения по формуле:

Rmax(min)  = ׀x‾ - xmax(min)‌‌‌׀/(S•√(n-1)/n)), где

xmax(min)‌‌‌ – сомнительный результат, самый большой или самый маленький в выборке,

x‾ – среднее арифметическое значение,

S – среднеквадратичное отклонение,

n – количество измерений.

Табличное значение R находят по таблице при числе степеней f=n-2.

R raspredelenie

Если расчётное значение R больше табличного, сомнительное значение отбрасывают.

Расчёт для нашей выборки:

[616; 618; 616; 618; 634; 624; 620; 624; 618; 626]

1. Определим выборочное среднее значение (с подозрительным значением):

х¯ = (∑ хi)/n = (616+618+…634)/10 = 621,4

2) Рассчитаем выборочную дисперсию:

S2 = ( ∑(хi – х¯)2 )/(n-1) = [(620-616)2 + (620-618)2 + … + (620-634)2]/(10-1) = 32,0444

3) Выборочное стандартное (среднеквадратичное) отклонение:

S = √S2 = √32,0444 = 5,6608

4) Вычисляем параметр R:

R = ׀x‾ - xmax(min)‌‌‌׀/(S•√(n-1)/n)) = ׀621,4 - 634‌‌‌׀/[5,6608•√(10-1)/10)] = 2,346    >    Rтабл (8; 0,05)=2,294 (см. таблицу выше).

Результат 634 можно признать грубым промахом.

Вывод: Проверка по всем трём критериям показала, что результат 634 кгс/мм2 является грубым промахом, поэтому его можно исключить из дальнейших расчётов. Далее проводится  проверка самого большего и самого меньшего значения из оставшихся девяти значений  аналогичным способом. Проверка заканчивается, когда все расчётные значения не превышают табличные значения. В этом случае результаты измерений признаются однородными, и продолжаются дальнейшие вычисления на их основе.

Примечание: Проверку наличия грубых промахов рекомендуется совмещать с проверкой на достаточность количества измерений – см. «Обработка экспериментальных данных (I). Определение количества повторных измерений».

Литература:

1. Агаянц И.М. Азы статистики в мире химии: Обработка экспериментальных данных – СПб: Научные основы и технологии, 2015. – 618 с.