SQL [Аналитика плюс] Основы теории создания хранилищ данных (2022)

Малыш Джон
Малыш Джон

Малыш Джон

Редактор
badge 6 лет с нами! badge Награда за 5000 очков репутации badge За 500 сообщений! badge За шикарный аватар!
Регистрация
26/03/2018
Сообщения
29.118
Репутация
1.273
Автор: Аналитика плюс
Название: Основы теории создания хранилищ данных (2022)

[Аналитика плюс] Основы теории создания хранилищ данных (2022)


Описание:

В навыки, требующиеся от эксперта по управлению данными, входит умение смоделировать и организовать хранилище данных. С точки зрения теории существуют правила построения, упрощающие дальнейшую работу (развитие и эксплуатацию) хранилища, — это так называемые нормальные формы.

Начало практикума будет посвящено разбору всех известных в настоящее время нормальных форм, в виде пошаговой нормализации исходной таблицы от первой к шестой форме.

Далее, будут рассмотрены существующие в настоящее время методологии построения хранилищ, от классических (Кимбалл и Инмон) до «современных (Data Vault и Anchor Modeling). В качестве практики будут построены модели хранилища для небольшого интернет-магазина, по каждой из методологий.

Для кого подойдет видео-курс «Основы теории создания хранилищ данных (DWH)»
Уровень сложности – средний.

Наш видео-курс подойдет для специалистов, желающих научиться проектировать хранилища данных (DWH). В начале курса будет разобрана концепция нормальных форм, с примерами, а затем будут рассмотрены существующие в настоящее время методологии построения хранилищ, от классических (Кимбалл и Инмон) до «современных (Data Vault и Anchor Modeling). В качестве практики будут построены модели хранилища для небольшого интернет-магазина, по каждой из методологий.


Программа видео-курса


Урок 1. Введение: базовые понятия и требования к ХД (доступно БСЕПЛАТНО в режиме ДЕМО на платформе онлайн-обучения Академия Аналитики)

— Введение о курсе, содержание курса: теория и практика
— Традиционная архитектура хранилищ данных (ХД)
— Требования к ХД
— Базовая структура ХД: понятия «сырых» данных, метаданных и агрегатов
— ХД с промежуточной областью
— ХД с промежуточной областью и витринами данных

Урок 2. Методологии построения ХД, нормальные формы (доступно БСЕПЛАТНО в режиме ДЕМО на платформе онлайн-обучения Академия Аналитики)

— «Классические» подходы к созданию хранилищ: Ральфа Кимбалла и Билла Инмона
— Современные подходы: Data Vault и Anchor Modelling
— Загрузка данных в ХД: ETL и ELT
— Нормализация СУБД: нормальные формы
— Основные термины нормализации: атрибут и домен атрибута, кортеж, отношение, проекция, аномалии и их виды, суперключ и потенциальный ключ, функциональная зависимость
— Сводная таблица существующих нормальных форм

Урок 3. Нормальные формы, подробности (доступно БСЕПЛАТНО в режиме ДЕМО на платформе онлайн-обучения Академия Аналитики)

— Пример пошаговой нормализации таблицы
— Первая нормальная форма (1НФ), пример и действия по приведению исходной таблицы к 1НФ
— Вторая нормальная форма (2НФ), пример приведения таблицы из 1НФ во 2НФ
— Третья нормальная форма (3НФ), пример приведения таблицы из 2НФ в 3НФ
— Нормальная форма Бойса-Кодда (НФБК), как частный случай 3НФ
— Четвертая нормальная форма (4НФ), примеры
— Пятая нормальная форма (5НФ), примеры
— Шестая нормальная форма (6НФ), примеры

Урок 4. «Классические» методологии построения ХД – Кимбалла и Инмона

— Две «классические» методологии построения ХД – Ральфа Кимбалла и Билла Инмона, и отличия между ними
— Звезды Ральфа Кимбалла: 4 основных шага в разработке хранилища
— Подход Кимбалла: преимущества и недостатки
— Хранилище 3НФ Билла Инмона, реализация концепции CIF (корпоративной информационной фабрики)
— Основные термины, специфичные для хранилищ 3НФ Билла Инмона
— Подход Инмона: преимущества и недостатки

Урок 5. Практика по методологии Кимбалла

— Практика на примере ХД интернет-магазина
— Исходные данные для ХД
— Практика по Кимбаллу: 2 витрины данных – Платежи и Заказы
— Создание промежуточной области, обзор модели данных
— Обзор исходных данных в mySQL
— Запуск скрипта по созданию объектов промежуточной области, в схеме stage
— Обсуждение ETL-скрипта по переносу данных из mySQL в Vertica

Урок 6. Практика по методологии Инмона

— Запуск ETL-скрипта для варианта ХД по Кимбаллу
— Анализ результатов, проверка, что в stage данные появились
— Обсуждение, что конкретно в данном случае объектами ХД могут быть не таблицы, а представления (view)
— Запуск скрипта создания представлений в схеме stardwh, анализ результатов
— Обсуждение ETL
— Начало практики по Инмону, обзор ETL для варианта по Инмону, обсуждение инкрементальной загрузки и дополнительных сложностей
— Запуск скрипта для создания целевых объектов-«приёмников данных» (до запуска ETL)
— Создание представлений (view) из таблиц, с целью выдачи конечным потребителям доступа к данным, в том виде, в котором им удобно будет воспользоваться
— Сравнение подходов Кимбалла и Инмона

Урок 7. Теория «современности»: детали по методологиям Data Vault и Anchor Modeling

— Краткое напоминание о принципах подходов Data Vault и Anchor Modeling
— Data Vault 2.0: основные понятия, — хаб, спутник (сателлит), ссылка
— Алгоритм создания модели хранилища по методологии Data Vault
— Разбор правил, которых следует придерживаться при моделировании
— Преимущества и недостатки подхода Data Vault
— Anchor Modeling (якорное моделирование): основные понятия, — якорь, атрибут, связь и узел
— Преимущества и недостатки якорного моделирования

Урок 8. Практика по Data Vault

— Обзор исходных данных для практики (напоминание)
— Практика – Data Vault
— Обзор SQL-скриптов, решающих практическую задачу
— Анализ скрипта по созданию представлений (view) промежуточной модели данных, состоящей из хабов, связей и спутников
— Анализ скрипта по созданию «звезды», опирающейся на ранее созданные объекты: от таблиц данных к бизнес-объектам

Урок 9. Практика по Anchor Modeling

— О редакторе якорного моделирования
— Алгоритм действий
— Установка якорей, создание связей между якорями, добавление атрибутов
— Генерация кода для создания объектов БД, реализующего модель
— Просмотр ER-диаграммы модели
— Редактирование якорной модели
— Загрузка данных в созданную модель
— О нюансах ETL-инструментов для якорной модели
— Подведение итогов практикума

Подробнее:
Авторизуйтесь, чтобы посмотреть скрытый контент.

Скачать:
Авторизуйтесь, чтобы посмотреть скрытый контент.
 
Польза курса сомнительна. Отсмотрел я четыре урока лекции и кроме чтения слайдов там на самом-то ничего нет. Никаких пояснений, никаких практических примеров — сухая теория. Имеет смысл заскриншотить всё и самостоятельно прочитать.

Например, лектор изначально говорит, что сейчас «поверхностно» расскажет о теме и в следующем ролике пойдёт «углублённое» изучение и пояснение. Смотришь следующий ролик, а там всё та же непонятная ерунда со слайдов о структурности-взаимодействии-принципе-работы.

Понимаю, что далёк от сетевого инженеринга, но в далёких 10-х годах поднимал собственный хостинг, а сейчас на фоне блокировок имея несколько десятков неиспользованных терабайт загорелся идеей поднять собственное облачное хранилище. Я так понимаю, что лучше и проще варианта чем NextCloud в принципе нет.
 
Понимаю, что далёк от сетевого инженеринга, но в далёких 10-х годах поднимал собственный хостинг, а сейчас на фоне блокировок имея несколько десятков неиспользованных терабайт загорелся идеей поднять собственное облачное хранилище. Я так понимаю, что лучше и проще варианта чем NextCloud в принципе нет.
Если цель поднять собственное облако, то этот курс точно ничем не поможет. Данный курс про АРХИТЕКТУРУ хранилища данных. Для разработчиков моделей данных, таблиц SQL и т.д. Качество подачи материала не очень, больше как набор тем для последующего самостоятельного изучения. Но лучше еще ничего не попадалось
 

Создайте учетную запись или войдите, чтобы комментировать или скачивать материалы!

У вас должна быть учетная запись, чтобы оставлять комментарии

Зарегистрироваться

Создайте учетную запись. Это просто!

Авторизоваться

У вас уже есть аккаунт? Войдите здесь.

Последние темы автора

Малыш Джон
Ответы
3
Просмотры
3K
Тотуся
Тотуся
Малыш Джон
Ответы
1
Просмотры
2K
Тотуся
Тотуся
Малыш Джон
Ответы
0
Просмотры
3K
Малыш Джон
Малыш Джон
Малыш Джон
Ответы
0
Просмотры
2K
Малыш Джон
Малыш Джон
Малыш Джон
Ответы
4
Просмотры
2K
Суперюля
Суперюля

Похожие темы

Малыш Джон
Ответы
0
Просмотры
3K
Малыш Джон
Малыш Джон
Брат Тук
Ответы
2
Просмотры
2K
karischaster
karischaster
Брат Тук
Ответы
1
Просмотры
2K
Jonik
Брат Тук
Ответы
0
Просмотры
855
Брат Тук
Брат Тук
Малыш Джон
Ответы
6
Просмотры
5K
отецСергий
Роджерc
Ответы
0
Просмотры
1K
Роджерc
Роджерc
Cooper_grisha
Ответы
0
Просмотры
2K
Cooper_grisha
Cooper_grisha
Малыш Джон
Ответы
0
Просмотры
3K
Малыш Джон
Малыш Джон
Малыш Джон
Ответы
1
Просмотры
1K
Евген7
Евген7
Малыш Джон
Ответы
3
Просмотры
5K
rtahir1995
rtahir1995
Сверху Снизу