Apache Superset: полный курс [Stepik] [Трофим Воробьев]

Складчина: Apache Superset: полный курс [Stepik] [Трофим Воробьев]

68838562da0c5302956ee539aaecb664.png

Вам надоело платить за PowerBI и Tableau? Apache Superset — бесплатная BI-система уровня enterprise, которая не уступает платным аналогам. Хотите молниеносные дашборды, гибкую аналитику и нулевую стоимость лицензий? Этот курс — быстрый старт для тех, кто хочет развернуть Superset с нуля, настроить его под бизнес-задачи и забыть о дорогих подписках. Вы получите готовую BI-платформу без скрытых платежей и ограничений. Сэкономьте бюджет компании — переходите на Superset уже сегодня!

Чему вы научитесь:

  • Docker-развертывание – быстрый старт без головной боли
  • Кастомизация деплоя – тонкая настройка через .env и docker-init.sh
  • Бэкапы и восстановление – защита данных от потерь
  • Кэширование с Redis – ускорение работы дашбордов и защита СУБД
  • Jinja и Handlebars – динамические запросы и гибкие шаблоны
  • Annotation Layers – расширенная аналитика на графиках
  • CSS Templates – изменение интерфейса под корпоративный стиль
  • Локализация – перевод Superset на любой язык
  • RBAC (Role-Based Access Control) – гибкие права для пользователей
  • RLS (Row-Level Security) – защита строк данных на уровне БД
  • CLS (Column-Level Security) – контроль доступа к отдельным столбцам
  • Keycloak-интеграция – корпоративная аутентификация
  • Superset API – программируемое управление системой
  • Swagger – единая точка Superset API
  • Celery – фоновые задачи
  • Взаимодействие Superset с СУБД – подключение, как происходит общение

Для кого этот курс:
Данный курс предназначен для всех, кто так или иначе работает / планирует работать с данными.

Начальные требования:

  • Знание Docker, либо быть готовым повторить всё за преподавателем
  • Знания SQL обязательно (select, where, group by, having, order by, join и т.д.). Вы умеете писать SQL-запросы. Вы понимаете, что такое база данных, и что различных систем управления базой данных (СУБД) очень много (Postgres, ClickHouse, MySQL и т.д.). Вы готовы работать с SQL, так как в курсе очень много будет связано именно с БД.
  • Знания Python обязательно — вы знакомы с типами данных, функциями. Знаете про библиотеки — панды ваши друзья. Желательно знать какую-либо IDE (PyCharm, VSCode), но не обязательно.

Рекомендуемые системные требования Docker:

  • Процессор: Intel Core i5 8400 Coffee Lake или лучше (в реальности достаточно и i3)
  • Память: 8 ГБ оперативной памяти (в реальности достаточно и 4-5ГБ)
  • Хранение: 20 ГБ SSD/HDD (в реальности не менее 10ГБ)

Для того, что вы могли понять, достаточно ли ресурсов вашего компьютера для прохождения курса, уроки с установкой Docker, DataLens, Superset, ClickHouse и Airflow будут доступны бесплатно.

Программа:

  • Введение
  • Установка необходимых инструментов
  • Быстрый старт
  • Продвинутая кастомизация
  • Superset_db
  • Делаем MVP
  • superset_cache
  • Superset_worker, Superset_worker_beat
  • API, Swagger
  • Ролевая модель (RBAC)
  • Маленькие полезные фишки
  • Локализация (перевод на русский язык)
  • Поднимаем ClickHouse
  • Интеграция с KeyCloak
  • Заключение

Спойлер: Подробная программа Введение

  1. Об Apache Superset, авторе, курсе

Установка необходимых инструментов

  1. Готовые инструкции

Быстрый старт

  1. Сразу дашборд
  2. Датасет
  3. Чарт
  4. Дашборд

Продвинутая кастомизация

  1. CSS элементов дашборда
  2. CSS Templates
  3. JSON metadata дашборда
  4. Jinja Templates. Активация
  5. Jinja Templates. Переменные
  6. Jinja Templates. Циклы
  7. Jinja Templates. Фильтры
  8. Jinja Templates. Ветвления
  9. Jinja Templates. Макросы
  10. Jinja Templates. Проброс фильтра в виртуальный датасет
  11. Jinja Templates. Фильтр по дате. Пользовательский ввод
  12. Jinja Templates. Собственный макрос. Логирование в stdout
  13. Handlebars
  14. Jinja + Handlebars. Column Level Security (CLS)
  15. Annotation Layers
  16. Итоговый тест

Superset_db

  1. Структура контейнера. Тома. БЭКАП!
  2. Ломаем. Сила Бэкапа!
  3. Открываем доступ. Изучаем внутренности. Пулы соединений

Делаем MVP

  1. Environment (переменные окружения)
  2. Command (команды, выполняемые во время установки)
  3. Контейнер superset_init, superset cli
  4. Правим ошибки, особенности SECRET_KEY, смены пароля admin

superset_cache

  1. Открываем доступ, изучаем назначение

Superset_worker, Superset_worker_beat

  1. Кратко о celery, Superset_worker_beat, Superset_worker
  2. AlertS & Reports
  3. Прогрев кэша, танцы с Celery

API, Swagger

  1. Swagger, удаляем Celery
  2. Скрипт API, CSRF, JWT (аутентификация)
  3. Скрипт API, прогрев кэша
  4. Пагинация
  5. Пишем чистильщик мусора

Ролевая модель (RBAC)

  1. Структура модели RBAC
  2. Создаем бизнесмена
  3. Permissions
  4. Статус дашборда в RBAC. Области видимости
  5. DASHBOARD_RBAC
  6. RLS

Маленькие полезные фишки

  1. Фильтры по горизонтали
  2. Система тэгов
  3. Кастомная страница аутентификации
  4. Перенаправление после аутентификации

Локализация (перевод на русский язык)

  1. Введение, Flask-babel, translator
  2. Messages.json, po2json, fuzzy
  3. Виртуальное окружение, polib, свой скрипт
  4. Fuzzy — будь осторожен(на)
  5. Танго с бабелью

Поднимаем ClickHouse

  1. Кратко о ClickHouse + установка
  2. Делаем коннект + чарт на данных из ClickHouse
  3. Общение Superset с БД + потребление ресурсов
  4. Данные готовятся на стороне БД!

Интеграция с KeyCloak

  1. Кратко о KeyCloak + установка
  2. Настройка KeyCloak
  3. Настройка Superset
  4. Аутентифицируемся
  5. Немного под капот (сложно, не обязательно)

Заключение

  1. Заключение

Цена 4990 руб