Метод экспоненциального сглаживания статистический метод. Прогнозирование на основе метода экспоненциального сглаживания. Пример решения задачи

Экспоненциальное сглаживание – более сложный метод взвешенного среднего. Каждый новый прогноз основан на предыдущем прогнозе плюс процент разницы между этим прогнозом и фактическим значением ряда в этой точке.

F t = F t -1 + (A t -1 - F t -1) (2)

Где: F t – прогноз для периода t

F t -1 – прогноз для периода t-1

– сглаживающая константа

A t - 1 – фактический спрос или продажи для периода t-1

Константа сглаживания представляет собой процент от ошибки про­гноза. Каждый новый прогноз равен предыдущему прогнозу плюс процент от предыдущей ошибки.

Чувствительность корректировки прогноза к ошибке определена кон­стантой сглаживания , чем ближе её значение к 0 , тем медленнее прогноз будет приспосабливаться к ошибкам прогноза (т.е. тем больше степень сгла­живания). Наоборот, чем ближе значение к 1,0 , тем выше чувствитель­ность и меньше сглаживание.

Выбор константы сглаживания – в основном вопрос свободного вы­бора или метода проб и ошибок. Цель состоит в том, чтобы выбрать такую константу сглаживания, чтобы, с одной стороны, прогноз остался достаточно чувствительным к реальным изменениям данных временного ряда, а с дру­гой – хорошо сглаживал скачки, вызванные случайными факторами. Обычно используемые значения находятся в диапазоне от 0,05 до 0,50.

Экспоненциальное сглаживание – один из наиболее широко исполь­зуемых методов прогнозирования, частично из – за минимальных требова­ний по хранению данных и легкости вычисления, а частично из-за той лёгко­сти, с которой система коэффициентов значимости может быть изменена простым изменением значения .

Таблица 3. Экспоненциальное сглаживание

Период Фактиче­ский спрос α= 0,1 α = 0,4
прогноз ошибка прогноз ошибка
10 000 - - - -
11 200 10 000 11 200-10 000=1 200 10 000 11 200-10 000=1 200
11 500 10 000+0,1(11 200-10 000)=10 120 11 500-10 120=1 380 10 000+0,4(11 200-10 000)=10 480 11 500-10 480=1 020
13 200 10 120+0,1(11 500-10 120)=10 258 13 200-10 258=2 942 10 480+0,4(11 500-10 480)=10 888 13 200-10 888=2 312
14 500 10 258+0,1(13 200-10 258)=10 552 14 500-10 552=3 948 10 888+0,4(13 200-10 888)=11 813 14 500-11 813=2 687
- 10 552+0,1(14 500-10 552)=10 947 - 11 813+0,4(14 500-11 813)=12 888 -



Методы для тенденции

Существует два важных метода, которые можно использовать для разработки прогнозов, когда присутствует тенденция. Один из них предпола­гает использование уравнения тенденции; другой – расширение экспонен­циального сглаживания.

Уравнение тенденции:

Линейное уравнение тенденции имеет следующий вид:

Y t = a + δ∙ t (3)

Где: t – определённое число периодов времени от t= 0 ;

Y t – прогноз периода t ;

α – значение Y t при t=0

δ – наклон линии.

Коэффициенты прямой α и δ , могут быть вычислены из статистических данных за определённый период, с использованием следующих двух урав­нений:

δ= , (4)

α = , (5)

Где: n – число периодов,

y – значение временного ряда

Таблица 3. Уровень тенденции.

Период (t) Год Уровень продаж (y) t∙y t 2
10 000 10 000
11 200 22 400
11 500 34 500
13 200 52 800
14 500 72 500
Итого: - 60 400 192 200

Вычислим коэффициенты линии тенденции:

δ=

Таким образом, линия тенденции Y t = α + δ ∙ t

В нашем случае, Y t = 43 900+1 100 ∙t ,

Где t = 0 для периода 0.

Составим уравнение для периода 6 (2015 год) и 7 (2016 год):

– прогноз на 2015 год.

Y 7 = 43 900+1 100*7= 51 600

Построим график:

Экспоненциальное сглаживание тенденций

Разновидность простого экспоненциального сглаживания может ис­пользоваться, когда временной ряд выявляет тенденцию. Эта разновидность называется экспоненциальным сглаживание, учитывающим тенденцию или, иногда, двойным сглаживанием. Оно отличается от простого экспоненциаль­ного сглаживания, которое используется только тогда, когда данные изме­няются вокруг некоторого среднего значения или имеют скачкообразные или постепенные изменения.

Если ряд выявляет тенденцию и при этом используется простое экспо­ненциальное сглаживание, то все прогнозы будут запаздывать по отноше­нию к тенденции. Например, если данные увеличиваются, то каждый про­гноз будет занижен. Наоборот, уменьшение данных даёт завышенный про­гноз. Графическое отображение данных может показать, когда двойное сглаживание будет предпочтительнее, чем простое.

Скорректированный тенденцией прогноз (TAF) состоит из двух элемен­тов: сглаженной ошибки и фактора тенденции.

TAF t +1 = S t + T t , (6)

Где: S t – сглаженный прогноз;

T t – оценка текущей тенденции

И S t = TAF t + α 1 (A t - TAF t) , (7)

T t = T t-1 + α 2 (TAF t –TAF t-1 – T t-1) (8)

Где α 1 , α 2 – сглаживающие константы.

Чтобы использовать этот метод, нужно выбрать значения α 1 , α 2 (обыч­ным путём подбора) и сделать начальный прогноз и оценку тенденций.

Таблица 4. Экспоненциальное сглаживание тенденции.

Очевидно, что в методе взвешенного скользящего среднего существует множество способов задавать значения весов так, чтобы их сумма была равной 1. Один из таких способов называется экспоненциальным сглаживанием. В этой схеме метода взвешенного среднего для любого t > 1 прогнозируемое значение в момент времени t+1 представляет собой взвешенную сумму фактического объема продаж , за период времени t и прогнозируемого объема продаж , за период времени t Другими словами,

Экспоненциальное сглаживание имеет вычислительные преимущества перед скользящим средним. Здесь, чтобы вычислить , необходимо знать только значения , и , (вместе со значением α). Например, если компании нужно спрогнозировать спрос для 5000 наименований изделий в каждый период времени, то в этом случае необходимо хранить 10001 значений данных (5000 значений , 5000 значений , и значение α), в то время как для выполнения прогноза на основе скользящего среднего по 8 узлам требовалось 40000 значений данных. В зависимости от поведения данных, возможно, потребуется хранить различные значения α для каждого изделия, но даже в этом случае количество хранимой информации значительно меньше, чем при использовании скользящего среднего. Положительная особенность экспоненциального сглаживания состоит в том, что, сохраняя α и последний прогноз, все предыдущие прогнозы также неявно сохраняются.

Рассмотрим некоторые свойства модели экспоненциального сглаживания. Для начала заметим, что если t > 2, то в формуле (1) t можно заменить на t–1, т.е. Подставив это выражение в первоначальную формулу (1), получим

Выполняя последовательно аналогичные подстановки, получим следующее выражение для

Поскольку из неравенства 0 < α < 1 следует, что 0 < 1 – α < 1, то Другими словами, наблюдение , имеет больший вес, чем наблюдение , которое, в свою очередь, имеет больший вес, чем . Это иллюстрирует основное свойство модели экспоненциального сглаживания - коэффициенты при убывают при уменьшении номера k. Также можно показать, что сумма всех коэффициентов (включая коэффициент при ), равна 1.

Из формулы (2) видно, что значением является взвешенная сумма всех предыдущих наблюдений (включая последнее наблюдение ). Последнее слагаемое суммы (2) является не статистическим наблюдением, а «предположением» (можно предположить, например, что ). Очевидно, что с ростом t влияние , на прогноз уменьшается, и в определенный момент им можно будет пренебречь. Даже если значение α достаточно малое (такое, что (1 – α) приблизительно равно 1), значение будет быстро убывать.

Значение параметра α сильно влияет на функционирование модели прогнозирования, поскольку α представляет собой вес самого последнего наблюдения . Это значит, что следует назначать большее значение α в том случае, когда в модели наиболее прогностическим является именно последнее наблюдение. Если же α близко к 0, это означает практически полное доверие к прошлому прогнозу и игнорирование последнего наблюдения.

Перед Виктором возникла проблема: как наилучшим образом подобрать значение α. Вновь, в этом поможет средство Поиск решения. Чтобы найти оптимальное значение α (т.е. такое, при котором прогнозная кривая будет менее всего отклоняться от кривой значений временного ряда), выполните следующие действия.

  1. Выберите команду Сервис -> Поиск решения.
  2. В открывшемся диалоговом окне Поиск решения установите целевую ячейку G16 (см. лист «Экспо») и укажите, что ее значение должно быть минимальным.
  3. Укажите, что изменяемой ячейкой является ячейка В1.
  4. Введите ограничения В1 > 0 и B1 < 1
  5. Щелкнув на кнопке Выполнить, получите результат, показанный на рис. 8.

Опять, как и в методе взвешенного скользящего среднего, наилучший прогноз будет получен, если назначить весь вес последнему наблюдению. Следовательно, оптимальное значение α равно 1, при этом среднее абсолютных отклонений равно 6,82 (ячейка G16). Виктор получил прогноз, который уже видел ранее.

Метод экспоненциального сглаживания хорошо работает в ситуациях, когда интересующая нас переменная ведет себя стационарно, а ее отклонения от постоянного значения вызваны случайными факторами и не носят регулярного характера. Но: вне зависимости от значения параметра α методом экспоненциального сглаживания не удастся спрогнозировать монотонно возрастающие или монотонно убывающие данные (прогнозируемы значения будут всегда меньше или больше наблюдаемых, соответственно). Также можно показать, что в модели с сезонными изменениями получить удовлетворительные прогнозы этим методом не удастся.

Если статистические данные монотонно изменяются или подвержены сезонным изменениям, необходимы специальные методы прогнозирования, которые будут рассмотрены ниже.

Метод Хольта (экспоненциальное сглаживание с учетом тренда)

,

Метод Хольта позволяет прогнозировать на k периодов времени вперед. Метод, как видно, использует два параметра α и β. Значения этих параметров находятся в пределах от 0 до 1. Переменная L, указывает на долгосрочный уровень значений или базовое значение данных временного ряда. Переменная Т указывает на возможное возрастание или убывание значений за один период.

Рассмотрим работу этого метода на новом примере. Светлана работает аналитиком в большой брокерской фирме. На основе имеющихся у нее квартальных отчетов компании Startup Airlines она хочет спрогнозировать доход этой компании в следующем квартале. Имеющиеся данные и диаграмма, построенная на их основе, находятся в рабочей книге Startup.xls (рис. 9). Видно, что данные имеют явный тренд (почти монотонно возрастают). Светлана хочет применить метод Хольта, чтобы спрогнозировать значение прибыли на одну акцию на тринадцатый квартал. Для этого необходимо задать начальные значения для L и Т Есть несколько вариантов выбора: 1) L равно значению прибыли на одну акцию за первый квартал и T = 0; 2) L равно среднему значению прибыли на одну акцию за 12 кварталов и T равно среднему изменению за все 12 кварталов. Существуют и другие варианты начальных значений для L и Т, но Светлана выбрала первый вариант.

Она решила воспользоваться средством Поиск решения, чтобы найти оптимальное значение параметров α и β, при которых значение среднего абсолютных ошибок в процентах было бы минимально. Для этого нужно выполнить такие действия.

Выбрать команду Сервис -> Поиск решения.

В открывшемся диалоговом окне Поиск решения задать ячейку F18 целевой и указать, что ее значение следует минимизировать.

В поле Изменяя ячейки ввести диапазон ячеек В1:В2. Добавить ограничения В1:В2 > 0 и В1:В2 < 1.

Кликнуть на кнопке Выполнить.

Полученный прогноз показан на рис. 10.

Как видно, оптимальными оказались значения α = 0,59 и β = 0,42, при этом среднее абсолютных ошибок в процентах равно 38%.

Учет сезонных изменений

При прогнозировании на основе данных временного ряда следует учитывать сезонные изменения Сезонные изменения - это колебания вверх и вниз с постоянным периодом в значениях переменной.

Например, если посмотреть на объемы продаж мороженого по месяцам, то можно увидеть в теплые месяцы (с июня по август в северном полушарии) более высокий уровень продаж, чем зимой, и так каждый год. Здесь сезонные колебания имеют период в 12 месяцев. Если используются данные, собранные по неделям, то структура сезонных колебаний будет повторяться через каждые 52 недели Другой пример анализируются еженедельные отчеты о количестве постояльцев, которые оставались на ночь в отеле, расположенном в бизнес-центре города Предположительно можно сказать, что большое число клиентов ожидается в ночи на вторник, среду и четверг, меньше всего клиентов будет в ночи на субботу и воскресенье, и среднее число постояльцев ожидается в ночи на пятницу и понедельник. Такая структура данных, отображающая количество клиентов в разные дни недели, будет повторяться через каждые семь дней.

Процедура, которая позволяет сделать прогноз с учетом сезонных изменений, состоит из таких четырех этапов

1) На основе исходных данных определяется структура сезонных колебаний и период этих колебаний.

3) На основе данных, из которых исключена сезонная составляющая, делается наилучший возможный прогноз.

4) К полученному прогнозу добавляется сезонная составляющая.

Проиллюстрируем этот подход на данных об объемах сбыта угля (измеряемого в тысячах тонн) в США на протяжении девяти лет Фрэнк работает менеджером в компании Gillette Coal Mine, ему необходимо спрогнозировать спрос на уголь на ближайшие два квартала. Он ввел данные по всей угольной отрасли в рабочую книгу Уголь.xls и построил по этим данным график (рис. 11). На графике видно, что объемы продаж выше среднего уровня в первом и четвертом кварталах (зимнее время года) и ниже среднего во втором и третьем кварталах (весенне-летние месяцы).

Исключение сезонной составляющей

Сначала необходимо вычислить среднее значение всех отклонений за один период сезонных изменений. Чтобы исключить сезонную составляющую в пределах одного года, используются данные за четыре периода (квартала). А чтобы исключить сезонную составляющую из всего временного ряда, вычисляется последовательность скользящих средних по T узлам, где T - продолжительность сезонных колебаний Для выполнения необходимых вычислений Фрэнк использовал столбцы С и D, как показано на рис. ниже. Столбец С содержит значения скользящего среднего по 4 узлам на основе данных, которые находятся в столбце В.

Теперь надо назначить полученные значения скользящего среднего средним точкам последовательности данных, на основе которых эти значения были вычислены. Эта операция называется центрированием значений. Если T нечетное, то первое значение скользящего среднего (среднее значений от первой до T-й точки) надо присвоить (T + 1)/2 точке (например, если T = 7, то первое скользящее среднее будет назначено четвертой точке). Аналогично среднее значений от второй до (T + 1)-й точки центрируется в (T + 3)/2 точке и т. д. Центр n-го интервала находится в точке (T+(2n-1))/2.

Если T четное, как в рассматриваемом случае, то задача несколько усложняется, поскольку здесь центральные (средние) точки расположены между точками, по которым вычислялось значение скользящего среднего. Поэтому центрированное значение для третьей точки вычисляется как среднее первого и второго значений скользящего среднего. Например, первое число в столбце D отцентрированных средних на рис. 12, слева равняется (1613 + 1594)/2 = 1603. На рис. 13 показаны графики исходных данных и отцентрированных средних.

Далее находим отношения значений точек данных к соответствующим значениям отцентрированных средних. Поскольку точкам в начале и конце последовательности данных нет соответствующих отцентрированных средних (см. первые и последние значения в столбце D), такое действие на эти точки не распространяется. Эти отношения показывают степень отклонения значений данных относительно типового уровня, определяемого отцентрированными средними. Заметим, что значения отношений для третьих кварталов меньше 1, а для четвертых - больше 1.

Эти отношения являются основой для создания сезонных индексов. Для их вычисления группируются вычисленные отношения по кварталам, как показано на рис. 15 в столбцах G-О.

Затем находятся средние значения отношений по каждому кварталу (столбец Е на рис. 15). Например, среднее всех отношений для первого квартала равно 1,108. Это значение является сезонным индексом первого квартала, на основе которого можно сделать вывод, что объем сбыта угля за первый квартал составляет в среднем около 110,8% относительного среднего годового объема сбыта.

Сезонный индекс - это среднее отношение данных, относящихся к одному сезону (в данном случае сезоном является квартал), ко всем данным. Если сезонный индекс больше 1, значит, показатели этого сезона выше средних показателей за год, аналогично, если сезонный индекс ниже 1, то показатели сезона ниже средних показателей за год.

Наконец, чтобы исключить из исходных данных сезонную составляющую, следует поделить значения исходных данных на соответствующий сезонный индекс. Результаты этой операции приведены в столбцах F и G (рис. 16). График данных, которые уже не содержат сезонной составляющей, представлен на рис. 17.

Прогнозирование

На основе данных, из которых исключена сезонная составляющая, строится прогноз. Для этого используется соответствующий метод, который учитывает характер поведения данных (например, данные имеют тренд или относительно постоянны). В этом примере прогноз строится с помощью простого экспоненциального сглаживания. Оптимальное значение параметра α находится с помощью средства Поиск решения. График прогноза и реальных данных с исключенной сезонной составляющей приведены на рис. 18.

Учет сезонной структуры

Теперь нужно учесть в полученном прогнозе (1726,5) сезонную составляющую. Для этого следует умножить 1726 на сезонный индекс первого квартала 1,108, в результате чего получим значение 1912 Аналогичная операция (умножение 1726 на сезонный индекс 0,784) даст прогноз на второй квартал, равный 1353. Результат добавления сезонной структуры к полученному прогнозу показан на рис. 19.

Варианты заданий:

Задача 1

Дан временной ряд

t
x

1. Постройте график зависимости x = x(t).

  1. Используя простое скользящее среднее по 4 узлам, спрогнозируйте спрос в 11-й момент времени.
  2. Подходит ли такой метод прогнозирования для этих данных или нет? Почему?
  3. Подберите линейную функцию приближения данных методом наименьших квадратов.

Задача 2

Пользуясь моделью прогнозов доходов компании Startup Airlines (Startup.xls) выполните:

Задача 3

Для временного ряда

t
x

выполните:

  1. Используя взвешенное скользящее среднее по 4 узлам, и назначив веса 4/10, 3/10, 2/10, 1/10, спрогнозируйте спрос в 11-й момент времени. Больший вес следует назначать более поздним наблюдениям.
  2. Является ли данное приближение более предпочтительным по отношению к простому скользящему среднему по 4 узлам? Почему?
  3. Найдите среднее абсолютных отклонений.
  4. С помощью средства Поиск решения найдите оптимальные веса узлов. Насколько уменьшилась ошибка приближения?
  5. Воспользуйтесь для прогноза методом экспоненциального сглаживания. Какой их использованных методов дает лучший рещультат?

Задача 4

Проанализируйте временной ряд

Время
Спрос
  1. Воспользуйтесь методом взвешенного скользящего среднего по 4 узлам, назначив веса 4/10, 3/10, 2/10, 1/10, чтобы получить прогноз в моменты времени 5-13. Больший вес следует назначать более поздним наблюдениям.
  2. Найдите среднее абсолютных отклонений.
  3. Считаете ли вы, что данное приближение более предпочтительно по сравнению с моделью простого скользящего среднего по 4 узлам? Почему?
  4. С помощью средства Поиск решения найдите оптимальные веса узлов. На сколько удалось уменьшить значение ошибки?
  5. Воспользуйтесь для прогноза методом экспоненциального сглаживания. Какой их использованных методов дает лучший результат?

Задача 5

Дан временной ряд

Задача 7

Менеджер по маркетингу небольшой развивающейся компании, содержащей сеть продовольственных магазинов, обладает информацией об объемах продаж за все время существования самого прибыльного магазина (см. табл.).

Используя простое скользящее среднее по 3 узлам, спрогнозируйте значения в узлах с 4 до 11.

Используя взвешенное скользящее среднее по 3 узлам, спрогнозируйте значения в узлах с 4 до 11. Для определения оптимальных весов воспользуйтесь средством Поиск решения.

Методом экспоненциального сглаживания спрогнозируйте значения в узлах 2-11. Определите оптимальное значение параметра α с помощью средства Поиск решения.

Какой из полученных прогнозов наиболее точный и почему?

Задача 8

Дан временной ряд

  1. Постройте график этого временного ряда. Соедините точки отрезками прямых.
  2. Используя простое скользящее среднее по 4 узлам, спрогнозируйте спрос для узлов 5–13.
  3. Найдите среднее абсолютных отклонений.
  4. Целесообразно ли использовать данный метод прогнозирования для представленных данных?
  5. Является ли данное приближение более предпочтительным по отношению к простому скользящему среднему по 3 узлам? Почему?
  6. Постройте по данным линейный и квадратичный тренд.
  7. Воспользуйтесь для прогноза методом экспоненциального сглаживания. Какой их использованных методов дает лучший рещультат?

Задача 10

В рабочей книге Business_Week.xls приведены данные из журнала Business Week по ежемесячным объемам продаж автомобилей за 43 месяца.

  1. Исключите из этих данных сезонную составляющую.
  2. Определите наилучший метод прогнозирования для имеющихся данных.
  3. Чему равен прогноз для 44-го периода?

Задача 11

  1. Простая схема прогнозирования, когда значение за прошлую неделю принимается за прогноз на следующую неделю.
  2. Метод скользящего среднего (с числом узлов на ваше усмотрение). Попробуйте использовать несколько различных значений узлов.

Задача 12

В рабочей книге Банк.xls приведены показатели работы банка. Рассмотрите следующие методы прогнозирования значений этого временного ряда.

В качестве прогноза используется среднее значение показателя за все предыдущие недели.

Метод взвешенного скользящего среднего (с числом узлов на ваше усмотрение). Попробуйте использовать несколько различных значений узлов. Для определения оптимальных весов воспользуйтесь средством Поиск решения.

Метод экспоненциального сглаживания. Подберите оптимальное значение параметра α с помощью средства Поиск решения.

Какой из предложенных выше методов прогнозирования вы бы порекомендовали для прогноза значений данного временного ряда?

Литература


Похожая информация.


1. Основные методические положения.

В методе простого экспоненциального сглаживания применяется взвешенное (экспоненциально) скользящее усреднение всех данных предыдущих наблюдений. Эта модель чаще всего применяется к данным, в которых необходимо оценить наличие зависимости между анализируемыми показателями (тренда) или зависимость анализируемых данных. Целью экспоненциального сглаживания является оценка текущего состояния, результаты которого определят все последующие прогнозы.

Экспоненциальное сглаживание предусматривает постоянное обновление модели за счет наиболее свежих данных. Этот метод основывается на усреднении (сглаживании) временных рядов прошлых наблюдений в нисходящем (экспоненциально) направлении. То есть более поздним событиям присваивается больший вес. Вес присваивается следующим образом: для последнего наблюдения весом будет величина α, для предпоследнего – (1-α), для того, которое было перед ним, - (1-α) 2 и т.д.

В сглаженном виде новый прогноз (для периода времени t+1) можно представлять как взвешенное среднее последнего наблюдения величины в момент времени t и ее прежнего прогноза на этот же период t. Причем вес α присваивается наблюдаемому значению, а вес (1- α) – прогнозу; при этом полагается, что 0< α<1. Это правило в общем виде можно записать следующим образом.

Новый прогноз = [α*(последнее наблюдение)]+[(1- α)*последний прогноз]

где - прогнозируемое значение на следующий период;

α – постоянная сглаживания;

Y t – наблюдение величины за текущий период t;

Прежний сглаженный прогноз этой величины на период t.

Экспоненциальное сглаживание – это процедура для постоянного пересмотра результатов прогнозирования в свете самых последних событий.

Постоянная сглаживания α является взвешенным фактором. Ее реальное значение определяется тем, в какой мере текущее наблюдение должно влиять на прогнозируемую величину. Если α близко к 1, значит в прогнозе существенно учитывается величина ошибки последнего прогнозирования. И наоборот, при малых значениях α прогнозируемая величина наиболее близка к предыдущему прогнозу. Можно представить как взвешенное среднее значение всех прошлых наблюдений с весовыми коэффициентами, экспоненциально убывающими с «возрастом» данных.



Таблица 2.1

Сравнение влияния разных значений постоянных сглаживания

Постоянная α является ключом к анализу данных. Если требуется, чтобы спрогнозированные величины были стабильны и случайные отклонения сглаживались, необходимо выбирать малое значение α. Большое значение постоянной α имеет смысл в том случае, если нужна быстрая реакция на изменения в спектре наблюдений.

2. Практический пример проведения экспоненциального сглаживания.

Представлены данные компании по объему продаж (тыс. шт.) за семь лет, постоянная сглаживания взята равной 0,1 и 0,6. Данные за 7 лет составляют тестовую часть; по ним необходимо оценить эффективность каждой из моделей. Для экспоненциального сглаживания рядов начальное значение берется равным 500 (первое значение фактических данных или среднее значение за 3 -5 периодов записывается в сглаженное значения за 2 квартал).

Таблица 2.2

Исходные данные

Время Действительное значение (фактическое) Сглаженное значение Ошибка прогноза
год квартал 0,1 0,1
Excel по формуле
#Н/Д 0,00
500,00 -150,00
485,00 485,00 -235,00
461,50 461,50 -61,50
455,35 455,35 -5,35
454,82 454,82 -104,82
444,33 444,33 -244,33
419,90 419,90 -119,90
407,91 407,91 -57,91
402,12 402,12 -202,12
381,91 381,91 -231,91
358,72 358,72 41,28
362,84 362,84 187,16
381,56 381,56 -31,56
378,40 378,40 -128,40
365,56 365,56 184,44
384,01 384,01 165,99
400,61 400,61 -0,61
400,55 400,55 -50,55
395,49 395,49 204,51
415,94 415,94 334,06
449,35 449,35 50,65
454,41 454,41 -54,41
448,97 448,97 201,03
469,07 469,07 380,93

На рис. 2.1 представлен прогноз на основе экспоненциального сглаживания с постоянной сглаживания, равной 0,1.



Рис. 2.1. Экспоненциальное сглаживание

Решение в Excel.

1. Выберите меню «Сервис» – «Анализ данных». В списке «Инструменты анализа» выберите значение «Экспоненциальное сглаживание». Если в меню «Сервис» нет анализа данных, то необходимо установить «Пакет анализа». Для этого найти в «Параметрах» пункт «Настройки» и в появившемся диалоговом окне установить флажок на «Пакет анализа», нажать ОК.

2. На экране раскроется диалоговое окно, представленное на рис. 2.2.

3. В поле «входной интервал» введите значения исходных данных (плюс одна свободная ячейка).

4. Установите флажок «метки» (если в диапазоне ввода указаны названия столбцов).

5. Введите в поле «фактор затухания» значение (1-α).

6. В поле «входной интервал» введите значение ячейки, в которой хотели бы увидеть полученные значения.

7. Установите флажок «Опции» - «Вывод графика» для автоматического его построения.

Рис. 2.2. Диалоговое окно для экспоненциального сглаживания

3. Задание лабораторной работы.

Имеются исходные данные об объемах добычи нефтедобывающего предприятия за 2 года, представленные в таблице 2.3:

Таблица 2.3

Исходные данные

Проведите экспоненциальное сглаживание рядов. Коэффициент экспоненциального сглаживания примите равным 0,1; 0,2; 0,3. Полученные результаты прокомментируйте. Можно использовать статистические данные, представленные в приложении 1.

Простая и логически ясная модель временного ряда имеет следующий вид:

где b - константа, а ε - случайная ошибка. Константа b относительно стабильна на каждом временном интервале, но может также медленно изменяться со временем. Один из интуитивно ясных способов выделения значения b из данных состоит в том, чтобы использовать сглаживание скользящим средним, в котором последним наблюдениям приписываются большие веса, чем предпоследним, предпоследним большие веса, чем пред- предпоследним, и т.д. Простое экспоненциальное сглаживание именно так и построено. Здесь более старым наблюдениям приписываются экспоненциально убывающие веса, при этом, в отличие от скользящего среднего, учитываются все предшествующие наблюдения ряда, а не только те, которые попали в определенное окно. Точная формула простого экспоненциального сглаживания имеет вид:

Когда эта формула применяется рекурсивно, каждое новое сглаженное значение (которое является также прогнозом) вычисляется как взвешенное среднее текущего наблюдения и сглаженного ряда. Очевидно, результат сглаживания зависит от параметра α . Если α равен 1, то предыдущие наблюдения полностью игнорируются. Если а равен 0, то игнорируются текущие наблюдения. Значения α между 0 и 1 дают промежуточные результаты. Эмпирические исследования показали, что простое экспоненциальное сглаживание весьма часто дает достаточно точный прогноз.

На практике обычно рекомендуется брать α меньше 0,30. Однако выбор а больше 0,30 иногда дает более точный прогноз. Это значит, что лучше все же оценивать оптимальное значение α по реальным данным, чем использовать общие рекомендации.

На практике оптимальный параметр сглаживания часто ищется с использованием процедуры поиска на сетке. Возможный диапазон значений параметра разбивается сеткой с определенным шагом. Например, рассматривается сетка значений от α =0,1 до α = 0,9 с шагом 0,1. Затем выбирается такое значение α , для которого сумма квадратов (или средних квадратов) остатков (наблюдаемые значения минус прогнозы на шаг вперед) является минимальной.

Microsoft Excel располагает функцией Экспоненциальное сглаживание (Exponential Smoothing), которая обычно используется для сглаживания уровней эмпирического временного ряда на основе метода простого экспоненциального сглаживания. Для вызова этой функции необходимо на панели меню выбрать команду Tools - Data Analysis. На экране раскроется окно Data Analysis, в котором следует выбрать значение Экспоненциальное сглаживание. В результате появится диалоговое окно Экспоненциальное сглаживание , представленное на рис. 11.5.


В диалоговом окне Exponential Smoothing задаются практически те же параметры, го и в рассмотренном выше диалоговом окне Moving Average.

1. Input Range (Входные данные) - в это поле вводится диапазон ячеек, содержащих значения исследуемого параметра.

2. Labels (Метки) - данный флажок опции устанавливается в том случае, если первая строка (столбец) во входном диапазоне содержит заголовок. Если заголовок отсутствует, флажок следует сбросить. В этом случае для данных выходного диапазона будут автоматически созданы стандартные названия.

3. Damping factor (Фактор затухания) - в это поле вводится значение выбранного коэффициента экспоненциального сглаживания α . По умолчанию принимается значение α = 0,3.

4. Output options (Параметры вывода) - в этой группе, помимо указания диапазона ячеек для выходных данных в поле Output Range (Выходной диапазон), можно также потребовать автоматически построить график, для чего необходимо установить флажок опции Chart Output (Вывод графика), и рассчитать стандартные погрешности, для чего нужно установить флажок опции Standart Errors (Стандартные погрешности).

Воспользуемся функцией Экспоненциальное сглаживание для повторного решения рассмотренной выше задачи, но уже с помощью метода простого экспоненциального сглаживания. Выбранные значения параметров сглаживания представлены на рис. 11.5. На рис. 11.6 показаны рассчитанные показатели, а на рис. 11.7 - построенные графики.

Простая и логически ясная модель временного ряда имеет следующий вид:

Y t = b + e t

у, = Ь + г„ (11.5)

где b - константа, e - случайная ошибка. Константа b относительно стабильна на каждом временном интервале, но может также медленно изменяться со временем. Один из интуитивно ясных способов выделения значения b из данных состоит в том, чтобы использовать сглаживание скользящим средним, в котором последним наблю­дениям приписываются большие веса, чем предпоследним, предпоследним большие веса, чем пред- предпоследним, и т.д. Простое экспоненциальное сглаживание имен­но так и построено. Здесь более старым наблюдениям приписываются экспоненци­ально убывающие веса, при этом, в отличие от скользящего среднего, учитываются все предшествующие наблюдения ряда, а не только те, которые попали в определен­ное окно. Точная формула простого экспоненциального сглаживания имеет вид:

S t = a y t + (1 - a) S t -1

Когда эта формула применяется рекурсивно, каждое новое сглаженное значение (которое является также прогнозом) вычисляется как взвешенное среднее текущего наблюдения и сглаженного ряда. Очевидно, результат сглаживания зависит от параметра a. Если a равен 1, то предыдущие наблюдения полностью игнорируются. Если aравен 0, то игнорируются текущие наблюдения. Значения a между 0 и 1 дают промежуточные результаты. Эмпирические исследования показали, что простое экспоненциальное сглаживание весьма часто дает достаточно точный прогноз.

На практике обычно рекомендуется брать a меньше 0,30. Однако выбор a больше 0,30 иногда дает более точный прогноз. Это значит, что лучше все же оценивать оптимальное значение a по реальным данным, чем использовать общие рекомендации.

На практике оптимальный параметр сглаживания часто ищется с использованием процедуры поиска на сетке. Возможный диапазон значений параметра разбивается сеткой с определенным шагом. Например, рассматривается сетка значений от a = 0,1 до a = 0,9 с шагом 0,1. Затем выбирается такое значение a, для которого сумма квадратов (или средних квадратов) остатков (наблюдаемые значения минус прогнозы на шаг вперед) является минимальной.

Microsoft Excel располагает функцией Exponential Smoothing (Экспоненциальное сглаживание), которая обычно используется для сглаживания уровней эмпирической временного ряда на основе метода простого экспоненциального сглаживания. Для вызова этой функции необходимо на панели меню выбрать команду Tools Þ Data Analysis. На экране раскроется окно Data Analysis, в котором следует выбрать значение Exponential Smoothing (Экспоненциальное сглаживание). В результате появится диалоговое окно Exponential Smoothing.

В диалоговом окне Exponential Smoothing задаются практически те же параметры, что и в рассмотренном выше диалоговом окне Moving Average.

1. Input Range (Входные данные) - в это поле вводится диапазон ячеек, содержащих значения исследуемого параметра.

2. Labels (Метки) - данный флажок опции устанавливается в том случае, если
первая строка (столбец) во входном диапазоне содержит заголовок. Если заголовок отсутствует, флажок следует сбросить. В этом случае для данных выходного диапазона будут автоматически созданы стандартные названия.

3. Damping factor (Фактор затухания) - в это поле вводится значение выбранного коэффициента экспоненциального сглаживания а. По умолчанию принимаете значение а = 0,3.

4. Output options (Параметры вывода) - в этой группе, помимо указания диапазона ячеек для выходных данных в поле Output Range (Выходной диапазон), можно также потребовать автоматически построить график, для чего необходимо установить флажок опции Chart Output (Вывод графика), и рассчитать стандартные погрешности, для чего нужно установить флажок опции Standart Erroг (Стандартные погрешности).

Задание 2. С помощью программы Microsoft Excel, используя функцию Экспоненциального сглаживания (Exponential Smoothing), на основании данных об объеме выпуска Задания 1 рассчитать сглаженные уровни выпуска и стандартные погрешности. Затем представить фактические и прогнозируемые данные с помощью диаграммы. Подсказка: должна получиться таблица и график, аналогичный выполненному в задание 1, но с другими сглаженными уровнями и стандартными погрешностями.

Метод аналитического выравнивания

где - теоретические значения временного ряда, вычисленные по соответствующе­му аналитическому уравнению на момент времени t.

Определение теоретических (расчетных) значений , производится на основе так называемой адекватной математической модели, которая наилучшим образом отобра­жает основную тенденцию развития временного ряда.

Простейшими моделями (формулами), выражающими тенденцию развития, явля­ются следующие:

Линейная функция, график которой является прямой линией:

Показательная функция:

Y t = a 0 * a 1 t

Степенная функция второго порядка, график которой является параболой:

Y t = a 0 + a 1 * t + a 2 * t 2

Логарифмическая функция:

Y t = a 0 + a 1 * ln t

Расчет параметров функции обычно производится методом наименьших квадратов, в котором в качестве решения принимается точка минимума суммы квадра­тов отклонений между теоретическим и эмпирическим уровнями:

где - выровненные (расчетные) уровни, а Yt - фактические уровни.

Параметры уравнения a i удовлетворяющие этому условию, могут быть найдены решением системы нормальных уравнений. На основе найденного уравнения тренда вычисляются выровненные уровни.

Выравнивание по прямой используется в тех случаях, когда абсолютные приросты практически постоянны, т.е. когда уровни изменяются в арифметической прогрессии (или близко к ней).

Выравнивание по показательной функции применяется, когда ряд отражает развитие в геометрической профессии, т.е. цепные коэффициенты роста практически постоянны.

Выравнивание по степенной функции (параболе второго порядка) используется, ко­гда ряды динамики изменяются с постоянными цепными темпами прироста.

Выравнивание по логарифмической функции применяется, когда ряд отражает разви­тие с замедлением роста в конце периода, т.е. когда прирост в конечных уровнях вре­менного ряда стремится к нулю.

По вычисленным параметрам выполняется синтез трендовой модели функции, т.е. получение значений a 0 , a 1 , a ,2 и их подстановка в искомое уравнение.

Правильность расчетов аналитических уровней можно проверить по следующему условию: сумма значений эмпирического ряда должна совпадать с суммой вычислен­ных уровней выровненного ряда. При этом может возникнуть небольшая погрешность в расчетах из-за округления вычисляемых величин:

Для оценки точности трендовой модели используется коэффициент детерминации:

где - дисперсия теоретических данных, полученных по трендовой модели, а - дисперсия эмпирических данных.

Трендовая модель адекватна изучаемому процессу и отражает тенденцию его раз­вития при значениях R 2 , близких к 1.

После выбора наиболее адекватной модели можно сделать прогноз на любой из периодов. При составлении прогнозов оперируют не точечной, а интервальной оцен­кой, определяя так называемые доверительные интервалы прогноза. Величина довери­тельного интервала определяется в общем виде следующим образом:

где среднее квадратическое отклонение от тренда; t a - табличное значение t- критерия Стьюдента при уровне значимости a , которое зависит от уровня значимо­стиa (%) и числа степеней свободы к = п - т. Величина - определяется по формуле:

где и – фактические и расчетные значения уровней динамического ряда; п - число уровней ряда; т - количество параметров в уравнении тренда (для уравнения прямой т - 2, для уравнения параболы 2-го порядка т = 3).

После необходимых расчетов определяется интервал, в котором с определенной вероятностью будет находиться прогнозируемая величина.

С помощью Microsoft Excel строить трендовые модели достаточно просто. Сначала эмпирический временной ряд следует представить в виде диаграммы одного из сле­дующих типов: гистограмма, линейчатая диаграмма, график, точечная диаграмма, диаграмма с областями, а затем щелкнуть на диаграмме правой кнопкой мыши на од­ном из маркеров данных. В результате на диаграмме будет выделен сам временной ряд, а на экране раскроется контекстное меню. В этом ме­ню следует выбрать команду Add Trendline (Добавить линию тренда). На экран будет выведено диалоговое окно Add Trendline.

На вкладке Туре (Тип) этого диалогового окна выбирается требуемый тип тренда:

1. линейный (Linear);

2. логарифмический (Logarithmic);

3. полиномиальный, от 2-й до 6-й степени включительно (Polinomial);

4. степенной (Power);

5. экспоненциальный (Exponential);

6. скользящее среднее, с указанием периода сглаживания от 2 до 15 (Moving Average).

На вкладке Options (Параметры) этого диалогового окна задаются дополнительные параметры тренда.

1. Trendline Name (Название сглаженной кривой) - в этой группе выбирается на­звание, которое будет выведено на диаграмму для обозначения функции, исполь­зованной для сглаживания временного ряда. Возможны следующие варианты:

♦ Automatic (Автоматическое) - при установке переключателя в это положе­ние Microsoft Excel автоматически формирует название функции сглажива­ния тренда, основываясь на выбранном типе тренда, например Linear (Линейная функция).

♦ Custom (Другое) - при установке переключателя в данное положение в по­ле справа можно ввести собственное название для функции тренда, длиной до 256 символов.

2. Forecast (Прогноз) - в этой группе можно указать, на сколько периодов вперед (поле Forward) требуется спроектировать линию тренда в будущее и на сколько периодов назад (поле Backward) следует спроектировать линию тренда в про­шлое (эти поля недоступны в режиме скользящего среднего).

3. Set intercept (Пересечение кривой с осью Y в точке) - этот флажок опции и расположенное справа поле ввода позволяют непосредственно указать точку, в которой линия тренда должна пересекать ось Y (эти поля доступны не для всех режимов).

4. Display equation on chart (Показывать уравнение на диаграмме) - при установке этого флажка опции на диаграмму будет выведено уравнение, описывающее сглаживающую линию тренда.

5. Display R-squared value on chart (Поместить на диаграмму величину достоверно­сти аппроксимации R 2) - при установке данного флажка опции на диаграмме будет показано значение коэффициента детерминации.

Вместе с линией тренда на графике временного ряда могут быть также изображены планки погрешностей. Для вставки планок погрешностей необходимо выделить ряд данных, щелкнуть на нем правой кнопкой мыши и выбрать в раскрывшемся контек­стном меню команду Format Data Series. На экране раскроется диалоговое окно Format Data Series (Формат ряда данных), в котором следует перейти на вкладку Y Error Bars (Y-погрешности).

На этой вкладке с помощью переключателя Error amount (Величина погрешности) выбирается тип планок и вариант их расчета в зависимости от вида погрешности.

1. Fixed value (Фиксированное значение) - при установке переключателя в это положение за допустимую величину ошибки принимается заданное в поле счетчика справа постоянное значение;

2. Percentage (Относительное значение) - при установке переключателя в данное положение для каждой точки данных вычисляется допустимое отклонение, исходя из заданного в поле счетчика справа значения процента;

3. Standard deviation(s) (Стандартное отклонение) - при установке переключателя в данное положение для каждой точки данных вычисляется стандартное отклонение, которое затем умножается на заданное в поле счетчика справа число (коэффициент кратности);

4. Standard error (Стандартная погрешность) - при установке переключателя в данное положение принимается стандартная величина ошибки, постоянная для всех элементов данных;

5. Custom (Пользовательская) - при установке переключателя в это положение вводится произвольный массив значений отклонений в положительную и/или отрицательную сторону (можно ввести ссылки на диапазон ячеек).

Планки погрешностей тоже можно форматировать. Для этого их следует выделить щелчком правой кнопки мыши и выбрать в раскрывшемся контекстном меню коман­ду Format Error Bars (Формат планок погрешностей).

Задание 3. С помощью программы Microsoft Excel на основании данных об объеме выпуска Задания 1 необходимо:

Представить временной ряд в виде графика, построенного с помощью мастера диаграмм. Затем добавить линию тренда, подбирая наиболее подходящий вариант уравнения.

Представить полученные результаты в виде таблицы «Подбор уравнения тренда»:

Таблица «Подбор уравнения тренда»

Представить выбранное уравнение графически, вынеся в график данные о наименовании полученной функции и величину достоверности аппроксимации (R 2).

Задание 4. Ответьте на следующие вопросы:

1. При анализе тренда для некоторого набора данных коэффициент детерминации для линейной модели оказался равен 0,95, для логарифмической - 0,8, а для полинома третьей степени - 0,9636. Какая трендовая модель наиболее адекват­на изучаемому процессу:

а) линейная;

б) логарифмическая;

в) полином 3-й степени.

2. По данным, представленным в задании 1, спрогнозируйте объем выпуска про­дукции в 2003 году. Какая общая тенденция поведения исследуемой величины следует из результатов вашего прогноза:

а) наблюдается спад производства;

б) производство остается на прежнем уровне;

в) наблюдается рост производства.

В данном материале были рассмотрены основные характеристики временного ряда, мо­дели декомпозиции временного ряда, а также основные методы сглаживания ряда - метод скользящего среднего, экспоненциального сглаживания и аналитического вы­равнивания. Для решения этих задач Microsoft Excel предлагаются такие инструменты, как Moving Average (Скользящее среднее) и Exponential Smoothing (Экспоненциальное сглаживание), которые позволяют сглаживать уровни эмпирического временного ряда, а также команда Add Trendiine (Добавить линию тренда), которая позволяет строить модели тренда и делать прогноз на основе имеющихся значений временного ряда.

P.S. Чтобы включить «Пакет анализ данных», выберите команду Tools →Data Analysis (Сервис → Анализ данных).

Если Data Analysis отсутствует, то необходимо выполнить следующие действия:

1. Выбрать команду Tools → Add-ins (Надстройки).

2. Выбрать в предложенном списке настроек значение Analysis ToolPak (Пакет анализа), а затем щелкнуть ОК. После этого будет выполнена загрузка и подключение к Excel пакета настройки «Анализ данных». Соответствующая команда появится в меню Tools.


©2015-2019 сайт
Все права принадлежать их авторам. Данный сайт не претендует на авторства, а предоставляет бесплатное использование.
Дата создания страницы: 2016-04-27