Лабораторная работаБизнес-аналитикаГод: 2025
👁 19💼 0

Готовая лабораторная работа: Аналитика в ClickHouse

Загружена: 14.02.2026 07:16

Продвинутая лабораторная по использованию ClickHouse и расширенных возможностей SQL. Показаны типовые запросы для меню блюд, отзывов Amazon, YouTube, биржевых котировок и веб‑метрик; рассмотрены агрегаты, временные функции и соединения для практической аналитики.

Содержание

НЕГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ ЧАСТНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ «МОСКОВСКИЙ УНИВЕРСИТЕТ «СИНЕРГИЯ»
Факультет/Институт		
		(наименование факультета/ Института)
Направление/специальность 		
подготовки:		(код и наименование направления /специальности подготовки)
Форма обучения:		очная
		(очная, очно-заочная, заочная)
		
.


Отчет по лабораторной работе № 2
на тему		Большие данные в бизнесе
		(наименование темы)
		

по дисциплине	
Инструменты бизнес-аналитики и анализ больших данных
		(наименование дисциплины)

Подробное описание

📘 О чем эта работа

Лабораторная посвящена продвинутой работе с данными в ClickHouse: объектом являются наборы из нескольких предметных областей — таблицы food.dish (меню), amazon.amazon_reviews (отзывы), youtube.youtube (видео), stock.stock (биржевые котировки) и metrica.hits (веб‑метрика). В работе показаны конкретные SQL‑запросы для группировки, фильтрации, агрегирования и временных вычислений.

📚 Что внутри

В материале последовательно рассмотрены реальные примеры запросов и типовые аналитические задачи:

  • Работа с таблицей 'food.dish': сортировки по цене, выбор блюд дороже заданной суммы, топ‑10 по заказам, средняя цена по категориям, количество добавлений по годам и месяцам, поиск длинных названий.
  • Отзывы Amazon ('amazon.amazon_reviews'): подсчёт общего количества отзывов, выбор отзывов с рейтингом ниже 3, средний рейтинг по категориям, топ‑5 категорий по среднему рейтингу, пользователи с >10 отзывами.
  • YouTube ('youtube.youtube'): поиск видео с макс просмотрами и мин лайков, топ‑10 каналов по просмотрам, активные годы и месяцы публикаций, соотношение лайков к просмотрам, длинные названия.
  • Биржевые данные ('stock.stock'): средняя цена закрытия по акциям, макс/мин цены, расчёт волатильности (max-min), топ‑5 по объёму торгов, количество торговых дней, дни с объёмом выше 90-го процентиля.
  • Веб‑метрика ('metrica.hits'): источники трафика и их доли, популярные страницы, средняя длительность визитов по устройствам, распределение по регионам, пики активности по дням недели, пользователи с >5 посещениями.
  • Операции соединения: примеры JOIN для объединения таблиц пользователей и заказов, вывод пользователей без заказов и подсчёт заказов на пользователя.

В работе приведены конкретные SQL‑запросы: например, вычисление средней цены блюда SELECT AVG(price) AS avg_dish_price FROM food.dish, сезонность по месяцам toMonth(publish_date), а также запросы для топ‑5 сущностей (блюд, продуктов, видео, акций, регионов).

📊 Для кого подходит

Материал полезен студентам и специалистам по бизнес‑аналитике, Big Data инженерам и аналитикам BI, изучающим ClickHouse и продвинутые SQL‑приёмы. Подходит для курсов по инструментам бизнес‑аналитики, практических занятий и подготовки отчётов на основе реальных наборов таблиц.

✨ Особенности

Работа содержит готовые примеры запросов для типовых задач: агрегации по годам и месяцам (toYear/toMonth), вычисление процентилей и волатильности, выборки топ‑N, фильтрация по порогам, поиск по строковым условиям (LIKE и длина строк), а также демонстрацию объединений пользователей и заказов. Все примеры привязаны к конкретным таблицам и полям, что облегчает адаптацию к вашей базе.

❓ Частые вопросы

Подойдет ли для моего ВУЗа?
Структура лабораторной соответствует академическим требованиям: цель, ход выполнения по частям с практическими запросами, контрольные вопросы и примеры выполнения.

Можно адаптировать?
Да. Запросы и шаблоны легко изменяются под другие схемы и периодизацию, достаточно заменить имена таблиц и поля (например, адаптировать выборки по датам или метрикам под конкретную БД).