Анализ временных рядов включает методы анализа данных временных рядов для извлечения значимой статистики и других характеристик данных. Прогнозирование временных рядов использует модель для прогнозирования будущих значений на основе ранее наблюдаемых значений. В этом посте временные ряды широко используются для нестационарных данных, таких как экономика, погода, цена акций и розничные продажи.

Шаги, связанные с проектом анализа временных рядов

  • Шаг 1: Определение проблемы
  • Шаг 2: Сбор информации
  • Шаг 3: Предварительный (исследовательский) анализ
  • Шаг 4: Выбор и примерка моделей
  • Шаг 5: Использование и оценка модели прогнозирования

Шаблоны временных рядов

1. Тренд

Тенденция существует, когда есть долгосрочное увеличение или уменьшение данных. Он не должен быть линейным. Иногда мы будем называть тренд изменением направления, когда он может перейти от повышательного тренда к убывающему.

3. Сезонность

Сезонный характер возникает, когда на временной ряд влияют сезонные факторы, такие как время года или день недели. Сезонность всегда имеет фиксированную и известную частоту.

3. Цикличность

Цикл возникает, когда данные демонстрируют подъемы и спады, которые не имеют фиксированной частоты. Эти колебания обычно связаны с экономическими условиями и часто связаны с деловым циклом. Продолжительность этих колебаний обычно составляет не менее 2 лет.

4. Стационарность

Стационарные данные имеют постоянное среднее значение и дисперсию. Мы можем легко интерпретировать, что данные нестационарны, поскольку числа уменьшаются экспоненциально.

Общие модели прогнозирования временных рядов

1. Простое экспоненциальное сглаживание

Эта модель подходит для прогнозирования данных без тренда или сезонности. График прогноза представляет собой просто горизонтальную линию, идущую от самого последнего значения.

2. Двойное экспоненциальное сглаживание

Эта модель учитывает тенденции. Здесь график прогноза по-прежнему представляет собой прямую линию, идущую от самого последнего значения, но с наклоном.

3. Тройное экспоненциальное сглаживание

У этой модели (пока) самый красивый график прогноза, поскольку он учитывает сезонность. Когда мы ожидаем регулярных колебаний, эта модель пытается отобразить сезонное поведение.

4. Модель АРИМА

ARIMA или авторегрессионное интегрированное скользящее среднее на самом деле представляет собой комбинацию трех моделей: AR(p) Авторегрессия — модель регрессии, которая использует зависимую связь между текущим наблюдением и наблюдениями за предыдущий период I(d) Интеграция — использует разность наблюдений (вычитание наблюдение из наблюдения на последнем временном шаге), чтобы сделать временной ряд стационарным pmdarima Auto-ARIMA — это сторонний инструмент, который показывает рекомендуемый (p, d, q) Порядок ARIMA (0,2,2) с компонентом несезонного порядка.

Оценка точности прогноза

1. Среднеквадратическая ошибка

Среднеквадратичное отклонение (RMSD) или среднеквадратическая ошибка (RMSE) — это часто используемая мера различий между значениями (выборочными или совокупными), предсказанными моделью или оценщиком, и наблюдаемыми значениями. RMSD — это квадратный корень из среднего квадрата ошибок.

2. Среднеквадратическая ошибка

В статистике среднеквадратическая ошибка (MSE) или среднеквадратичное отклонение (MSD) оценщика (процедуры оценки ненаблюдаемой величины) измеряет среднее квадратов ошибок, то есть среднеквадратичную разницу между оценкой значения и действительное значение.

3. Средняя абсолютная ошибка

В статистике средняя абсолютная ошибка (MAE) измеряет ошибки между парными наблюдениями, выражающими одно и то же явление. MAE рассчитывается как: Таким образом, это среднее арифметическое абсолютных ошибок, где прогноз и фактическое значение.

4. Стандартное отклонение тестовых данных

В статистике стандартное отклонение измеряет количество вариаций или дисперсию набора значений. Низкое стандартное отклонение указывает на то, что значения, как правило, близки к среднему по группе, в то время как высокое стандартное отклонение указывает на то, что значения разбросаны по более широкому диапазону.