То есть пока. Если вы активируете пробную мощность Microsoft Fabric, вам не будет выставлен счет за это. Это стимул протестировать Fabric, пока он находится в стадии предварительной версии. Когда он будет выпущен в общедоступную версию, по-прежнему будут доступны пробные варианты, аналогичные тому, как это существует сегодня с Power BI. Эта пробная версия позволяет вам опробовать все функции Fabric и получить хорошее представление о производительности, которую вы получите, и о том, как это будет потреблять выделенные ресурсы. Я настоятельно рекомендую включить пробную версию и опробовать некоторые рабочие нагрузки, чтобы определить необходимую вам емкость.

Если вы решите развернуть собственную емкость Fabric (F-SKU) в качестве ресурса Azure, с ваших кредитов Azure будет взиматься плата за использование емкости.

Емкость?

Я знал, что не смогу написать несколько абзацев без ключевого слова мощность. Ткань — это все о возможностях. Давайте сравним это с другими облачными сервисами:

Модель обслуживания Факторы выставления счетов Хранилище Azure IaaS Хранилище, пропускная способность, транзакции Виртуальная машина Azure IaaS ЦП, память, диск Azure SQL PaaS виртуальное ядро, хранилище Служба приложений Azure PaaS виртуальное ядро, хранилище, функции Databricks PaaS-SaaS ЦП и память + DBU Snowflake SaaS Кредит Microsoft 365 Именованная подписка пользователя SaaS Power BI Premium На пользователя Именованная подписка SaaS Power BI Premium на емкость Емкость SaaS / виртуальные ядра Емкость SaaS Microsoft Fabric / CU (единица емкости)

Облако основано на модели общей ответственности, и вы можете видеть, что чем больше ответственности ложится на облачного провайдера (поэтому, чем больше вы движетесь в сторону SaaS), тем больше вы не думаете об оборудовании и инфраструктуре. И это также переводится на модель выставления счетов.

Как распределяется емкость

Microsoft Fabric использует ту же платформу, что и Power BI, и выставление счетов, похоже, также идет в этом направлении. В Power BI вы можете активировать Power BI Premium для пользователя, чтобы предоставить ему доступ к дополнительным функциям. Вы также можете приобрести емкость Power BI Premium, которая соответствует определенному количеству виртуальных ядер и максимальному объему памяти для каждого артефакта. Затем эта емкость может использоваться несколькими пользователями и рабочими пространствами. Вместимость ткани работает таким же образом. Они предназначены для совместного использования проектами, пользователями и рабочими нагрузками. Не имеет значения, использует ли один пользователь Lakehouse, другой пользователь запускает ноутбуки, а третий выполняет SQL в Warehouse. Все они могут иметь одну и ту же емкость.

Емкости назначаются одной или нескольким рабочим областям. Все внутри этой рабочей области, будь то Warehouse, Lakehouse, задание Spark или блокнот, будет использовать ту же емкость и общие ресурсы, которые ему выделены.

*Внимательные читатели заметят, что вы можете создавать эластичные пулы для Azure SQL, чтобы использовать их в нескольких базах данных. Я знаю, это было только для демонстрационных целей. 😉

Артикул

Поскольку Fabric строится на платформе Power BI, вы можете просто повторно использовать SKU Power BI Premium. Microsoft также анонсировала F-SKU, за которые можно платить с помощью Microsoft Azure. Каждый SKU дает вам определенное количество единиц емкости (CU). Цены ниже указаны для региона Azure Западная часть США 2.

Источник 1 | Источник 2 | Источник 3

Название SKU Fabric CUs Power BI Premium vCores Память Power BI Premium (GB) Цена (USD/месяц) F2 2 Н/Д Н/Д 262,80 F4 4 Н/Д Н/Д 525,60 F8 8 Н/Д Н/Д 1051,20 F16 16 Н/Д Н /A 2102.40 F32 32 Н/Д Н/Д 4204.80 P1 64 8 25 ± 5000 F64 64 Н/Д Н/Д 8409.60 F128 128 Н/Д Н/Д 16819.20 P2 128 16 50 ± 10000 F256 256 Н/Д Н/Д 33638.40 Р3 256 32 100 ± 20000 F512 512 Н/Д Н/Д 67276,80 P4 512 64 200 ± 40000 F1024 1024 Н/Д Н/Д 134553,60 P5 1024 128 400 ± 80000 F2048 2048 Н/Д Н/Д 269 107.20

Почему F-SKU намного дороже? Простой! Для P-SKU необходимо ежегодно выставлять счета. Для F-SKU вы можете платить за час. Уже подтверждено, что через несколько месяцев вы также сможете ежегодно выставлять счета за F-SKU и получать большую скидку. Это тот же принцип, что и при годовом или трехлетнем бронировании, которое вы можете купить прямо сейчас для таких служб, как Azure Synapse.

F-SKU оплачиваются по мере использования, поэтому вы платите только за то, что потребляете. Продолжайте читать, чтобы узнать, как вы можете платить даже меньше, чем цены, указанные выше.

Единицы емкости и мониторинг использования

Итак, что же это за единицы мощности? Это единица выставления счетов, используемая в Microsoft Fabric. Вы можете сравнить это с кредитами Snowflake или DBU Databricks. Это единица, которая сочетает в себе ЦП, память, дисковый ввод-вывод, пропускную способность сети и многое другое. Все, что вы делаете в Fabric, потребляет CU. Чем больше CU у вас есть, тем больше вы можете делать без дросселирования.

Поскольку Fabric занимается аналитикой данных и созданием отчетов, вы также можете создавать отчеты о собственном потреблении CU. Microsoft выпустила приложение Fabric Capacity Metrics, которое вы можете установить в своем арендаторе. Это приложение предоставит вам обзор использования емкости ваших емкостей Fabric.

Сглаживание и регулирование: магия Power BI Premium приходит в Fabric

Значит ли это, что если у вас есть SKU F2 с 2 CU, ваши рабочие нагрузки могут использовать мощность 2 CU при постоянной нагрузке в течение всего месяца? Да. Но и больше. Поскольку Microsoft Fabric построен на основе Power BI, пользователи могут воспользоваться принципом, который называется сглаживание. Это не ново и документация уже существует. На этой странице в документации Microsoft Fabric также упоминается функция сглаживания, поэтому можно предположить, что она также доступна в Fabric.

Давайте сравним 2 графика, взятые из документации ниже:

Когда сглаживание не применяется, вы можете видеть, что загрузка ЦП очень скачкообразна. Он также имеет тенденцию превышать максимальную мощность. Это означает, что рабочие нагрузки начинают регулироваться или даже могут выйти из строя. Когда применяется сглаживание, использование ЦП намного более постоянно, и максимальная мощность никогда не превышается. Это означает, что вы можете запускать больше рабочих нагрузок в той же емкости.

Так что же это за колдовство? Общее количество CU, которое потребляет каждая рабочая нагрузка, остается прежним. Отличие в том, что оно растянуто во времени. Мы также можем видеть разницу между интерактивными рабочими нагрузками и фоновыми рабочими нагрузками (например, запланированное задание). Посмотрим, что об этом говорится в документации:

Интерактивные операции усредняют использование емкости за короткий промежуток времени, например, за пятиминутные интервалы. С другой стороны, фоновые операции усредняют использование емкости в течение гораздо большего 24-часового периода. Преимущество этого метода заключается в том, что операции, требующие большого количества ресурсов, например обновления, сглаживаются, поскольку они усредняются за длительный период времени.

В каждый момент времени Power BI суммирует среднее использование ЦП как интерактивными, так и фоновыми операциями. Если загрузка ЦП в определенный момент времени превышает лимит SKU, срабатывает автомасштабирование, если оно включено. Если автомасштабирование не включено или если загрузка ЦП превышает возможности автомасштабирования, применяется регулирование.

Выглядит отлично, правда? Многие дата-инженеры выполняли свои интенсивные рабочие нагрузки в нерабочее время, чтобы не мешать интерактивным рабочим нагрузкам в течение дня. При применении сглаживания эти фоновые операции будут распределены в течение следующих 24 часов. Другими словами, будет распространяться только их потребление CU. Операции по-прежнему будут выполняться в те же сроки, что и без сглаживания.

Таким образом, даже с меньшим номером SKU, таким как F2, вы можете получить потрясающую производительность, поскольку кратковременные рабочие нагрузки могут использовать гораздо больше CU, чем 2 CU, которые предоставляет номер SKU. Вам выставляется счет на основе средней производительности, которая вам нужна, а не максимальной/пиковой производительности, которая вам нужна.

Когда я прочитал документацию по сглаживанию, мне все стало понятно. Во время основных докладов на Microsoft Build и выступлений на конференциях сотрудники Microsoft часто упоминали, что механизмы обработки в Fabric могут выделять больше ресурсов, когда им это нужно, за доли секунды. Это возможно только с такими функциями, как сглаживание на стороне выставления счетов.

Автомасштабирование и ручное масштабирование

Сегодня P-SKU уже предлагают автоматическое масштабирование. Также было объявлено о появлении F-SKU. Так что, если вы заметите, что даже при сглаживании вас все равно троттлингуют, вы можете включить автомасштабирование.

Как только потребление CU достигнет максимума, дополнительная емкость может быть автоматически предоставлена ​​с помощью подписки Microsoft Azure. Дополнительные подготовленные CU снова автоматически исчезают, как только ваши рабочие нагрузки потребляют меньше ресурсов, чем предоставляет ваш SKU. Это отличный способ избежать дросселирования и не платить за большую емкость, чем вам нужно.

Если вы используете F-SKU сегодня, вы можете применить ручное масштабирование. Счета за F-SKU оплачиваются по мере использования и управляются как ресурс Azure. Таким образом, если вы предоставите F2 всего на 1 час, вы получите всего 36 центов. В любой момент вы можете приостановить, возобновить или увеличить/уменьшить свой F-SKU. Вы планируете интенсивную рабочую нагрузку, которая может ограничить ваши возможности? Просто временно увеличьте емкость и снова уменьшите ее, когда закончите.

Как платить еще меньше

F-SKU, приобретенные через Microsoft Azure, можно приостановить, когда они вам не нужны. Если ваша компания ничего не делает с данными или аналитикой в ​​выходные дни, вы можете просто приостановить использование ресурсов и не сэкономить ± 25%. Я пока не могу подтвердить, как это будет работать со сглаживанием, но вполне разумно, что пауза также означает, что сглаживание приостанавливается (например, если ваша рабочая нагрузка распределена на 24 часа, а вы делаете паузу через 12 часов, оставшиеся 12 часов будут израсходованы, когда вы возобновляете снова).

Каспер Киркегор уже опубликовал на своем GitHub несколько фрагментов кода для автоматизации приостановки и возобновления использования ресурсов Fabric.

Почему регион важен

Когда вы прочитаете о ценах на Fabric, вы заметите много разных цифр. Цены на Microsoft Fabric зависят от выбранного вами региона. Это точно такой же принцип, как и в Microsoft Azure. Опытные пользователи, как правило, довольно часто обращают внимание на регион Восток США 2, поскольку он часто имеет более низкие цены по сравнению с другими. Не могли бы вы выбрать любой регион, который вы хотите?

Выбранный вами регион определяет, где будут храниться ваши данные. Мы еще не говорили об OneLake, все приведенные выше цены связаны с вычислительной мощностью.

Цены на хранилище и пропускную способность

Объявления Microsoft о Fabric ссылаются на страницу с ценами на обычную пропускную способность. Это уже было дешевое предложение, поэтому приятно видеть, что оно распространяется и на Microsoft Fabric.

Цены на хранилище OneLake соответствуют тем же ценам, что и Azure Data Lake Storage 2-го поколения. Используемая цена, по-видимому, является ценой для хранилища Hot ZRS. Например. 0,023 доллара США за ГБ в регионе Запад США 2.

Какой SKU выбрать?

Сегодня: начните с суда. Зачем платить, если можно получить бесплатно, амирите? 🤣 Шутки в сторону, когда пробный период закончится, я бы порекомендовал начать с SKU F2 и расширять его по мере необходимости. Достигнув SKU F32, вы можете переключиться на SKU P1 и включить автомасштабирование. Номера SKU, вероятно, изменятся в будущем, так как некоторые изменения уже объявлены (например, зарезервированные инстансы и автоматическое масштабирование для F-SKU).

Заключение

Следующие функции делают Microsoft Fabric действительно привлекательным предложением:

  • Сглаживание: вы платите только за среднюю производительность, а не за пиковую.
  • Автомасштабирование: если вы несколько раз в месяц ограничиваете ресурсы, вы можете автоматически выделять дополнительные ресурсы, чтобы не платить за более дорогие SKU.
  • Масштабирование вручную: если вы заранее знаете, что вам временно потребуется больше производительности, выделите больше ресурсов вручную.
  • Pay-As-You-Go: вы можете динамически приостанавливать и возобновлять работу, чтобы сократить расходы.
  • Общая емкость: вы можете разделить свою емкость между несколькими пользователями, проектами и рабочими нагрузками.
  • Бесплатная пробная версия: вы можете попробовать все функции Fabric бесплатно.
  • Невероятная производительность по низкой цене: первые пользователи сообщили о впечатляющей производительности F2 SKU, которая стоит всего 0,36 доллара США в час.

Этот уникальный набор функций выставления счетов может привести к изменению того, как группы данных используют платформу данных. Зачем ждать перерыва в ночное время, если благодаря сглаживанию и автомасштабированию можно непрерывно выполнять интенсивные задачи по обработке данных в течение дня?

Лично я никогда не видел таких обширных и впечатляющих биллинговых функций на платформе данных. Очень приятно видеть, что Microsoft серьезно относится к этому и пытается максимально упростить для клиентов получение максимальной отдачи от своих инвестиций. Наконец-то у нас есть настоящая платформа данных, созданная (и оплачиваемая) для эпохи облачных вычислений.

Вам также может понравиться

Добро пожаловать в 3-е поколение: SQL в Microsoft Fabric — Сэм Дебрюйн

Набирая этот пост в блоге, я возвращаюсь с конференции Data Platform Next Step, где я говорил об использовании dbt с Microsoft Fabric. DP Next Step была первой конференцией, посвященной службам данных Microsoft, сразу после анонса Microsoft Fabric, поэтому многие спикеры были Mic…

корни данных