📘 О чем эта работа
Лабораторная посвящена продвинутой работе с данными в ClickHouse: объектом являются наборы из нескольких предметных областей — таблицы food.dish (меню), amazon.amazon_reviews (отзывы), youtube.youtube (видео), stock.stock (биржевые котировки) и metrica.hits (веб‑метрика). В работе показаны конкретные SQL‑запросы для группировки, фильтрации, агрегирования и временных вычислений.
📚 Что внутри
В материале последовательно рассмотрены реальные примеры запросов и типовые аналитические задачи:
- Работа с таблицей 'food.dish': сортировки по цене, выбор блюд дороже заданной суммы, топ‑10 по заказам, средняя цена по категориям, количество добавлений по годам и месяцам, поиск длинных названий.
- Отзывы Amazon ('amazon.amazon_reviews'): подсчёт общего количества отзывов, выбор отзывов с рейтингом ниже 3, средний рейтинг по категориям, топ‑5 категорий по среднему рейтингу, пользователи с >10 отзывами.
- YouTube ('youtube.youtube'): поиск видео с макс просмотрами и мин лайков, топ‑10 каналов по просмотрам, активные годы и месяцы публикаций, соотношение лайков к просмотрам, длинные названия.
- Биржевые данные ('stock.stock'): средняя цена закрытия по акциям, макс/мин цены, расчёт волатильности (max-min), топ‑5 по объёму торгов, количество торговых дней, дни с объёмом выше 90-го процентиля.
- Веб‑метрика ('metrica.hits'): источники трафика и их доли, популярные страницы, средняя длительность визитов по устройствам, распределение по регионам, пики активности по дням недели, пользователи с >5 посещениями.
- Операции соединения: примеры JOIN для объединения таблиц пользователей и заказов, вывод пользователей без заказов и подсчёт заказов на пользователя.
В работе приведены конкретные SQL‑запросы: например, вычисление средней цены блюда SELECT AVG(price) AS avg_dish_price FROM food.dish, сезонность по месяцам toMonth(publish_date), а также запросы для топ‑5 сущностей (блюд, продуктов, видео, акций, регионов).
📊 Для кого подходит
Материал полезен студентам и специалистам по бизнес‑аналитике, Big Data инженерам и аналитикам BI, изучающим ClickHouse и продвинутые SQL‑приёмы. Подходит для курсов по инструментам бизнес‑аналитики, практических занятий и подготовки отчётов на основе реальных наборов таблиц.
✨ Особенности
Работа содержит готовые примеры запросов для типовых задач: агрегации по годам и месяцам (toYear/toMonth), вычисление процентилей и волатильности, выборки топ‑N, фильтрация по порогам, поиск по строковым условиям (LIKE и длина строк), а также демонстрацию объединений пользователей и заказов. Все примеры привязаны к конкретным таблицам и полям, что облегчает адаптацию к вашей базе.
❓ Частые вопросы
Подойдет ли для моего ВУЗа?
Структура лабораторной соответствует академическим требованиям: цель, ход выполнения по частям с практическими запросами, контрольные вопросы и примеры выполнения.
Можно адаптировать?
Да. Запросы и шаблоны легко изменяются под другие схемы и периодизацию, достаточно заменить имена таблиц и поля (например, адаптировать выборки по датам или метрикам под конкретную БД).