Вы выбрали данные о продажах из 1С. Прежде чем обрабатывать их, следует посмотреть на эти данные более внимательно. Скорее всего в выбранных данных нет признака привезен данный товар "под заказ" или продан из наличия на складе, придется разбираться с этим исходя из данных статистики.
В качестве примера возьмем данные о продаже товара "Клипса автомобильная".
За весь период выборки она продавалась 25 раз.
(3,5,1,100,2,5,4,8,7,6,4,3,2,1,3,5,6,7,5,4,2,5,3,1,9)
Посмотрев на данные, легко понять, что 100 шт. привозилось, под заказ. Эта продажа портит нам всю статистику. На первом этапе анализа данных необходимо фильтровать подобные продажи (промахи).
Для удаления промахов можно воспользоваться простым, но эффективным методом "Правилом 3 сигм".
Для применения правила рассчитаем z-значения для случаев продаж.
z-значение показывает, сколько стандартных отклонений между случаем продажи и средним. Воспользуемся формулой для расчета z-показателя:
z = (x - m) / s
где:
x - это одно необработанное значение данных.
m - среднее значение;
s - стандартное отклонение
В соответствии с "Правилом 3 сигм" значение считается выбросом (промахом), если его z-оценка меньше -3 или больше 3.
При этом должны соблюдаться два важных условия:
1. Первое условие применения "Правила 3 сигм" гласит, что распределение значений должно быть нормальным.
2. Второе условие заключается в том, что выборка данных должна быть достаточно большой. На практике считают, что число значений в выборке должно быть больше 25.
При больших значениях выборок более квалифицированно фильтровать промахи можно с использованием таблиц вероятности крайних членов вариационного ряда. Это регламентировано ГОСТ 11.002-73.
Возвращаясь к нашему примеру рассчитаем z значение для продажи в 100 шт.
x=100;
m= (3+5+1+100+2+5+4+8+7+6+4+3+2+1+3+5+6+7+5+4+2+5+3+1+9) /5=8.0
s=19.3
Тогда z=4.8.
z>3, поэтому значение 100 нужно исключить из рассчётов как промах.
Данный пример фильтрации промахов часто встречается в жизни, в частности, он используется в программе оптимизации складских остатков https://yadmina.ru/main/sklad/
Сборник:
Статистика продаж. Оптимизация товарных запасов. Теория очередей. Теория вероятностей.