Обновления концепции Distribution Shift, часть 9 (машинное обучение)

(Почти) доказуемые границы ошибок при сдвиге распределения из-за несоответствия (arXiv)

Аннотация: Мы получили (почти) гарантированную верхнюю границу ошибки глубоких нейронных сетей при сдвиге распределения, используя неразмеченные тестовые данные. Предыдущие методы либо дают границы, которые на практике бессмысленны, либо дают оценки, которые в среднем точны, но сильно недооценивают ошибку для значительной части сдвигов. В частности, последние дают гарантии, основанные только на сложных непрерывных измерениях, таких как испытательная калибровка, которые невозможно идентифицировать без этикеток, и поэтому ненадежны. Вместо этого наша граница требует простого, интуитивного условия, которое хорошо обосновано предыдущими эмпирическими работами и эффективно выполняется на практике в 100% случаев. Граница основана на дивергенции HΔH, но ее легче оценить, она существенно более точная, что постоянно обеспечивает непустые гарантии. Оценка границы требует оптимизации одного мультиклассового классификатора, чтобы он не согласовывался с другим, для чего в некоторых предыдущих работах использовались неоптимальные прокси-потери; мы разрабатываем потерю из-за разногласий, которая теоретически оправдана и лучше работает на практике. Мы ожидаем, что эта потеря может послужить заменой будущим методам, которые требуют максимизации разногласий между несколькими классами. В широком диапазоне тестов наш метод дает действительные границы ошибок, обеспечивая при этом среднюю точность, сравнимую с базовыми показателями конкурентных оценок. Код общедоступен по адресу https://github.com/erosenfeld/disagree_discrep.

2. Раскрытие скрытой динамики самостоятельного обучения с помощью видео в условиях смены распределения (arXiv)

Автор: Притам Саркар, Ахмад Бейрами, Али Этемад.

Аннотация: t: Видеообучение с самоконтролем (VSSL) за последние годы добилось значительного прогресса. Однако точное поведение и динамика этих моделей при различных формах сдвига распределения пока неизвестны. В этой статье мы всесторонне изучаем поведение шести популярных методов самоконтроля (v-SimCLR, v-MOCO, v-BYOL, v-SimSiam, v-DINO, v-MAE) в ответ на различные формы естественного сдвига распределения. , то есть (i) сдвиг контекста, (ii) сдвиг точки зрения, (iii) сдвиг актера, (iv) сдвиг источника, (v) возможность обобщения на неизвестные классы (нулевой выстрел) и (vi) распознавание открытого множества. Для проведения этого обширного исследования мы тщательно создали испытательный стенд, состоящий из 17 пар тестов, находящихся в распределении и вне его, используя доступные общедоступные наборы данных и ряд протоколов оценки для стресс-тестирования различных методов в соответствии с намеченными изменениями. Наше исследование выявило ряд интригующих результатов и интересного поведения методов VSSL. Например, мы наблюдаем, что, хотя видеомодели обычно не справляются со сдвигами контекста, v-MAE и контролируемое обучение демонстрируют большую надежность. Более того, наше исследование показывает, что v-MAE является сильным временным обучающимся, тогда как контрастные методы, v-SimCLR и v-MOCO, демонстрируют высокие показатели против изменений точки зрения. Изучая концепцию распознавания с открытым набором, мы замечаем компромисс между производительностью распознавания с закрытым и открытым набором, особенно если предварительно обученные кодеры VSSL используются без точной настройки. Мы надеемся, что наша работа будет способствовать разработке надежных сред обучения представлению видео для различных сценариев реального мира.

материалы по теме:

Новые материалы

Развертывание прогрессивного веб-приложения ReactJs на Heroku

В этой статье я расскажу вам, как мы можем преобразовать наше приложение responseJs в прогрессивное веб-приложение, и мы развертываем его на Heroku с помощью простых и легких шагов. Итак,..

зависит от. Если это функция компоновщика, то нет ничего плохого в том, что они собираются выше…

зависит. Если это функция компоновщика, нет ничего плохого в том, что они собирают функции более высокого уровня. если это не так, вы правы.

RunJS ускоряет разработку в 10 раз

Я не шучу, этот инструмент значительно повышает производительность! Я пишу JavaScript уже как минимум 10 лет, и то, что большинство JS-разработчиков не говорят вслух, — это МНОГО копирования и..

Выбросы, как найти выбросы и сводка по 5 числам

Вы когда-нибудь сталкивались с выбросами при обучении модели машинного обучения? или когда-либо думал Что такое выбросы? Выбросы — это точки данных, которые значительно отличаются от остальных..

Котлин с открытым исходным кодом, 2023 г.

Котлин с открытым исходным кодом, 2023 г. Хотите изучить Kotlin, тогда попробуйте проект с открытым исходным кодом Участие в Open Source было одним из лучших шагов, которые я сделал за свою..

Адаптивная минимальная целевая страница, которую вы, как разработчик, любите — Средняя

[Изучение WebGL] Разработчики много не говорят. Их код говорит сам за себя. Итак, вот минимальная целевая страница для разработчиков. Разветвите минимальную целевую страницу, размещенную..

Использование ASP.NET Core для указания, какой элемент на панели навигации является активным

Как установить активный класс меню Bootstrap с помощью ASP.NET Core? Вступление Последние пару лет я использую Bootstrap для определения макета своих веб-сайтов. Это значительно упрощает..

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Python Web Development Coding Deep Learning AI React Software Engineering Nodejs Java Front End Development Computer Science Javascript Development Javascript Tips Typescript Cybersecurity Tech Development Learning Angular Data Productivity ChatGPT Neural Networks Developer Golang Algorithms Reinforcement Learning Reactjs NLP CSS Computer Vision Startup Vuejs