1. Прогнозирование времени и расстояния поездок с использованием объяснимых LSTM на основе внимания (arXiv)

Автор: Эбрахим Балуджи, Йонас Сьёблом, Никольче Мурговски, Мортеза Хагир Черегани.

Аннотация: В этой статье мы предлагаем решения на основе машинного обучения для прогнозирования времени будущих поездок и возможного расстояния, которое проедет транспортное средство. Для этой задачи прогнозирования мы разрабатываем и исследуем четыре метода. В первом методе мы используем структуры на основе долговременной кратковременной памяти (LSTM), специально разработанные для одновременной обработки многомерных исторических данных о времени поездки и расстояниях. Используя его, мы прогнозируем будущее время поездки и прогнозируем расстояние, которое проедет транспортное средство, объединяя выходные данные сетей LSTM через полностью связанные слои. Второй метод использует сети LSTM на основе внимания (At-LSTM) для выполнения тех же задач. Третий метод использует две сети LSTM параллельно, одну для прогнозирования времени поездки, а другую для прогнозирования расстояния. Затем выходные данные каждого LSTM объединяются через полностью связанные слои. Наконец, последняя модель основана на двух параллельных At-LSTM, где аналогичным образом каждый At-LSTM предсказывает время и расстояние отдельно через полностью связанные слои. Среди предложенных методов наиболее продвинутый, то есть параллельный At-LSTM, предсказывает расстояние и время следующей поездки с погрешностью 3,99%, что на 23,89% лучше, чем у LSTM, первого метода. Мы также предлагаем TimeSHAP в качестве метода объяснимости для понимания того, как сети выполняют обучение и моделируют последовательность информации.

2. LSTM, управляемый моделью с учетом прогнозов (arXiv)

Автор : София Хамер, Дженнифер Слиман, Иванка Стайнер.

Аннотация: Плохое качество воздуха может оказать существенное влияние на здоровье человека. Рекомендации Национального управления океанических и атмосферных исследований (NOAA) по прогнозированию качества воздуха оспариваются из-за растущего числа событий с экстремальным качеством воздуха из-за экстремальных погодных явлений, таких как лесные пожары и волны тепла. Эти экстремальные явления, связанные с качеством воздуха, еще больше влияют на здоровье человека. Традиционные методы, используемые для исправления смещения модели, делают предположения о линейности и лежащем в основе распределении. События с экстремальным качеством воздуха, как правило, происходят без сильного сигнала, предшествующего событию, и это поведение приводит к тому, что существующие методы либо занижают, либо переоценивают погрешность. Глубокое обучение перспективно для прогнозирования качества воздуха в условиях экстремальных явлений качества воздуха благодаря его способности обобщать и изучать нелинейные проблемы. Однако при наличии таких явлений аномального качества воздуха стандартные подходы к глубокой сети, использующие единую сеть для обобщения будущих прогнозов, не всегда могут обеспечить наилучшую производительность даже при полном наборе функций, включая географию и метеорологию. В этой работе мы описываем метод, который сочетает в себе неконтролируемое обучение и двунаправленную сеть LSTM с учетом прогнозов для выполнения коррекции смещения для оперативного прогнозирования качества воздуха с использованием данных станции AirNow для озона и PM2,5 в континентальной части США. Используя неконтролируемый метод кластеризации, обученный географическим характеристикам станции, таким как широта и долгота, урбанизация и высота над уровнем моря, обученные кластеры направляют обучение, разделяя обучающие данные для сетей LSTM. LSTM учитывают прогнозы и реализуются с использованием уникального способа обучения вперед и назад во времени в течение дней прогнозирования. При сравнении RMSE модели прогноза со RMSE модели с поправкой на погрешность модель с поправкой на погрешность показывает значительное улучшение (среднеквадратическое отклонение для озона на 27% ниже) по сравнению с базовым прогнозом.