В наши дни термин «машинное обучение» используется как волшебное слово. Все говорят о машинном обучении так, как будто оно решает практически любые наши проблемы. Но если вы посмотрите на него, вы поймете, что это всего лишь кусок причудливого кода математического программирования.

Почему назвали это машинным обучением:

То, что мы обычно думаем об ИИ, — это AGI, искусственный общий интеллект, который мы можем видеть во многих фантастических фильмах. Но сделать ОИИ очень сложно, потому что мы не понимаем, что такое сознание.

Всякий раз, когда мы говорим об ИИ, обычно это означает машинное обучение или модель глубокого обучения. Модели — это просто кусок супер-причудливых кодов математического программирования.

Просто подумайте о машинном обучении как о выполнении какой-то функции. Все, что вам нужно сделать, это просто ввести некоторые данные и получить результат. Если на входе изображена собака или кошка, результат должен сказать, что такое собака, а что кошка.

Таким образом, машинное обучение — это очень простая концепция, за исключением того, что функция генерируется с помощью множества математических вычислений. Вот почему мы называем это «обучением».

Машинное обучение против глубокого обучения:

Машинное обучение — это часть искусственного интеллекта (ИИ). Возможно, вы также слышали о глубоком обучении. Глубокое обучение — это часть машинного обучения.

В чем разница между машинным обучением и глубоким обучением? Это легко сказать. Модель глубокого обучения включает извлечение признаков, а модель машинного обучения НЕ включает его. Машинное обучение — более широкое понятие, чем глубокое обучение.

Извлечение признаков? Когда вы описываете автомобиль, каковы его черты? У машины есть двери, ветрозащита, колеса и так далее. Это особенности автомобиля, и вы просто «извлекли» из него понятие характеристик. Это извлечение признаков.

Предварительная обработка данных:

Имейте в виду, однако, что вы не можете просто вводить любые данные, которые хотите, в машинном обучении. Необработанные данные должны быть предварительно обработаны, чтобы создать модель с хорошей производительностью. Предварительная обработка данных включает в себя следующее:

  1. Очистка данных . Это процесс, который вам необходимо очистить от набора данных, так как в нем есть недостающая информация или неактуальные данные. Заполните недостающие или удалите ненужные или лишние. Вам нужны высококачественные наборы данных.
  2. Преобразование данных. Существует два типа данных. Структурированные данные и неструктурированные данные. структурированные - это текстовый файл, файл csv или файл json. Неструктурированные данные включают в себя изображения, звуки и т. д. Вам необходимо сделать набор неструктурированных данных структурированным с помощью кодирования.
  3. Проверка данных. На этом этапе вы разделяете данные на несколько наборов, особенно тестовых наборов и обучающих наборов. Данные обучения предназначены для обучения моделей машинного обучения. Тестовые данные предназначены для проверки того, хорошо ли обучена модель.

Млопс:

Теперь вы готовы создать модель машинного обучения с набором уточненных наборов данных. но просто обучиться и сделать модель недостаточно. Модель нуждается в постоянном уходе. Это шаг MLOps.

MLOps означает операции машинного обучения. Это ряд шагов для успешного запуска модели ИИ в реальном бизнесе. Весь его процесс похож на процесс DevOps. Что отличает MLOps от DevOps, так это то, что он включает в себя навыки работы с данными.