Плановое обновление данных в Power BI

В Power BI есть возможность запланировать обновление данных на определенное время, что, по моему мнению, является самым важным условием для развертывания решения для бизнес-аналитики в облаке.

До настоящего момента существовала возможность обновления листов Excel со встроенными моделями данных по требованию. Фактически, если источник данных у вас уже находится в облаке (и при этом поддерживает соответствующие технологии), то вам не обязательно обновлять данные с помощью Power BI, поскольку эта функция изначально доступна в Office 365. Если же ваш источник данных установлен локально (будь то Oracle или SQL Server), вам поможет шлюз управления данными. Чего до сей поры не хватало, так это возможности обновлять модели данных автоматически, без участия пользователя. Теперь эта проблема решена.

Данная функция также доступна в PowerPivot для локального SharePoint. Обновление происходит по каждой книге отдельно в галерее PowerPivot Gallery, особой панели PowerPivot, в которой представлен вид на библиотеку документов – книг Excel. В Power BI процесс проходит практически так же, как и в Power Pivot.

Настройка планового обновления

Чтобы настроить плановое обновление для какой-либо книги, необходимо открыть ее контекстное меню. Для этого сначала нужно открыть приложение Power BI, а затем найти книгу, которую вы хотите обновить. Чтобы открыть меню, нажмите на иконку “…”

image001

В меню добавлено несколько новых пунктов, а также обновлен вид предварительного просмотра. Слева от иконки указано, кем и когда было произведено последнее обновление, а в контекстном меню появилась возможность открыть модель в Excel для редактирования и провести контроль качества. Нам, однако, необходимо выбрать пункт меню “Плановое обновление данных”. Выбрав его, мы попадаем в соответствующее диалоговое окно.

image003

Если обновление еще не настроено, диалог открывается на вкладке “Настройки”. В противном случае, будет открыта вкладка “История”.

Чтобы включить обновление, просто передвиньте ползунок в состояние “Вкл.” Если модель обеспечивается несколькими источниками данных, можно выбрать их или исключить. Судя по всему, на одну книгу может приходиться только одна настройка планового обновления; таким образом, исключенный источник данных просто не будет обновляться.

Затем необходимо выбрать график обновления – ежедневный или еженедельный. По умолчанию период сохранения графика равен 90 дней; по истечении этого срока обновление будет отключено. Период можно изменить с помощью поля “Завершение”. Далее, выберите время (либо день неделю и время, если график еженедельный) обновления. В поле уведомлений введите электронный адрес, на который будут отправляться сообщения об ошибках.

Вот, собственно, и все. Осталось только нажать кнопку “Сохранить настройки”, если вам нужно сохранить график, или “Сохранить и обновить”, чтобы не только сохранить график, но и сразу запустить обновление.

Если источник данных развернут в облаке, Power BI будет отсылать запросы напрямую; если он находится локально, обновление будет происходить с помощью шлюза управления данными. Было бы здорово, если бы на административном портале было больше информации о состоянии обновления, но пока что сообщается только результат: либо обновление выполнено успешно, либо происходит ошибка. Однако если источник данных у вас локальный, вы можете открыть панель монитора ресурсов на машине, использующейся в качестве шлюза, и отследить процесс “diawp.exe”.

image005

Как только произойдет ошибка обновления, вы сразу увидите это по ширине полосы пропускания.

На вкладке “История” можно просмотреть историю обновлений и действующий на данный момент график. Здесь также можно увидеть, было ли выполнено обновление успешно, сколько времени оно длилось и т.д.

image007

Для планового обновления шлюз управления данными не является обязательным требованием, однако я все равно рекомендую вам его установить.

Ограничения

При использовании планового обновления Power BI необходимо учитывать ряд ограничений. Ниже представлены некоторые из них. Разумеется, это не исчерпывающий список – это лишь то, с чем мне приходилось сталкиваться или о чем я слышал, пока изучал вопрос.

Слишком большой размер данных

Как уже упоминалось ранее, максимальный размер встроенной модели Power BI составляет 250 MB. Попытавшись встроить модель с бóльшим размером, вы получите сообщение об ошибке. Однако теперь, когда появилось плановое обновление, модель может быть невелика изначально, но в процессе обновления вырасти и превысить лимит. Что произойдет в этом случае?

При открытии модели для обновления проверяется ее размер. Если размер не превышает допустимое ограничение, обновление продолжается. Если лимит превышен, в следующий раз обновление выдаст ошибку, как и любая попытка открыть файл в браузере, пока размер не уменьшится до допустимого.

Конфликты

Обновление может длиться продолжительное время. Во время обновления доступ к файлу по-прежнему открыт, поэтому если пользователь попытается его изменить, произойдет конфликт. Если возникнет такая ситуация, произойдет откат планового обновления, после чего процесс выдаст ошибку.

Частота

Как уже было сказано, существует только два варианта того, как часто можно запускать обновления: ежедневно или еженедельно. К сожалению, ежечасных, ежемесячных и ежегодных обновлений пока не предусмотрено. Таким образом, если обновляться вам нужно чаще, чем раз в сутки, то Power BI вам не подойдет. Разумеется, в большинстве случаев ежесуточного обновления вполне хватит, и этот факт уравнивает Power BI с аналогичным приложением PowerPivot для SharePoint.

Если этот пост читает кто-нибудь из Microsoft, моя просьба №2 к ним – добавить опцию почасового обновления для Power BI и Power Pivot для SharePoint (просьбу №1 я изложу ниже).

Ограниченная поддержка источников данных

В настоящий момент, обновлять можно модели на тех источниках данных, которые поддерживает Office 365 в облаке (Azure SQL, SQL на виртуальных машинах Azure и ленты OData с простой аутентификацией или без нее), а также те, что поддерживает шлюза управления данными (SQL Server 205 + и Oracle 10g +). Полный перечень можно найти в официальной документации.

Для начала это отличный список, но он весьма ограничен. Здесь хотелось бы видеть еще множество других видов источников данных, в том числе многомерных. Однако прежде всего, на мой взгляд, в этом списке не хватает Power Query.

Указанные выше источники данных поддерживаются в том случае, если данные были импортированы в модель через утилиту импорта Power Pivot (или стандартными средствами Excel 2013). Если же вы захотите воспользоваться мощным арсеналом Power Query, ваша модель автоматически обновляться не будет. Судя по постам на многих форумах, этот факт несколько сбивает пользователей с толку. Но раз Power Query это практически неотъемлемый компонент Power BI, его поддержка просто необходима. Вот это и есть моя просьба №1, причем опять и для Power BI, и для Power Pivot для SharePoint.

Тем не менее, на данный момент все, что вам нужно знать, – это что если ваша модель основана на Power Query, ее автоматическое обновление невозможно.

В целом, если закрыть глаза на ограничения, то Power BI кажется отличным конкурентоспособным инструментом, а ввод функции планового обновления только добавляет оптимизма в общую картину.

Ссылки

Scheduled Data Refresh in Power BI

3 thoughts on “Плановое обновление данных в Power BI

  1. А сталкивались Вы с такой проблемой: в Excel создано подключение к кубу данных. Из этого подключения создается несколько сводных таблиц(на разных листах). Файл excel выложен на sharepoint BI. Для файла устанавливается автоматическое обновление( управление обновлением данных PowerPivot). При запуске автоматического обновления оно идет примерно всегда в районе 7 минут 30 секунд(+/- 10 секунд) и не обновляется ( ошибка: Call to Excel Services returned an error). При этом если удалить несколько листов из книги( не важно каких), то обновление происходит.

    • скорее всего в настройках нужно покапаться, и сбить время обновления.
      там должен быть параметр 450 секунд, как раз под ваши условия подходят

Leave a comment