Лабораторная работаБольшие данныеГод: 2025Синергия: Московский финансово-промышленный университет «Синергия»
👁 24💼 0

Готовая лабораторная работа: ClickHouse и веб-аналитика

Загружена: 14.02.2026 07:10

Практические лабораторные по ClickHouse и визуализации в Grafana. Раскрыты установка в WSL, создание баз и таблиц, типовые SQL-запросы (GROUP BY, JOIN, агрегаты) и построение воронки конверсии. Полезно для отработки навыков SQL и подготовки отчетов.

Содержание

НЕГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ ЧАСТНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ «МОСКОВСКИЙ УНИВЕРСИТЕТ «СИНЕРГИЯ»
Факультет/Институт		
		(наименование факультета/ Института)
Направление/специальность 		
подготовки:		(код и наименование направления /специальности подготовки)
Форма обучения:		очная
		(очная, очно-заочная, заочная)
		
.


Отчет по лабораторной работе № 1
на тему		Большие данные в бизнесе
		(наименование темы)
		

по дисциплине	
Инструменты бизнес-аналитики и анализ больших данных
		(наименование дисциплины)

Подробное описание

📘 О чем эта работа

Сборник лабораторных заданий посвящён освоению аналитической СУБД ClickHouse и интеграции с Grafana в среде WSL. Объектом являются учебные наборы: веб-метрики, меню блюд (food.dish), отзывы Amazon, YouTube и биржевые котировки; предмет — построение SQL-запросов, агрегаций, JOIN и графических отчётов.

📚 Что внутри

Работа содержит пошаговые инструкции и конкретные примеры SQL-запросов. Приведены команды установки ClickHouse на Windows через WSL и запуск сервисов clickhouse-local / clickhouse-server / clickhouse-client, создание базы web_analytics и таблицы user_activity с колонками event_date, event_time, user_id, session_id, page_url, event_type, duration. Есть пример наполнения таблицы ('2025-12-15', '2025-12-15 10:15:00', 1, 'sess_001', '/index', 'view', 30).

  • Таблицы с веб-метриками: посещения, источники трафика, устройства, регионы, продолжительность сеансов.
  • Задания по food.dish: сортировка по цене, топ-10 по заказам, средняя цена по категориям, годы и месяцы добавления блюд.
  • Amazon reviews: подсчёт отзывов, фильтр по рейтингу, топ‑категорий и пользователей с >10 отзывами.
  • YouTube: топ-видео по просмотрам, каналы по суммарным просмотрам, сезонность публикаций, метрики лайков/дизлайков.
  • Биржевые данные: средняя цена закрытия, волатильность, топ-5 по объёму торгов, дни выше месячной средней и 90-й перцентиль по объёму.
  • Практические SQL-примеры: SELECT ... WHERE, ORDER BY duration DESC, GROUP BY user_id, COUNT(DISTINCT user_id), агрегаты AVG/SUM/MIN/MAX и примеры JOIN (INNER, LEFT).

📊 Для кого подходит

Материалы подходят студентам профильных направлений ИT, прикладной математики и маркетинга, а также начинающим аналитикам, которым нужно быстро получить практику в ClickHouse, научиться строить агрегированные отчёты, сводные таблицы и воронки конверсии в Grafana.

✨ Особенности

В комплекте — реальные учебные примеры SQL-запросов и шаблоны таблиц (user_activity, food.dish, amazon.amazon_reviews, youtube.youtube, stock.stock, metrica.hits), готовые запросы для поиска топов, сезонности, percentiles и комбинированных pivot-таблиц. Отдельно описана постановка воронки с шагами visit → product_view → add_to_cart → checkout → purchase и выводы по тестовому датасету (отмечено отсутствие части событий и нулевые значения выручки в тестовых данных).

В лабораторной №3 приведён опыт настройки Grafana и подключение источника ClickHouse, а также указана проблема при установке плагина через grafana-cli (ошибка 451 geofence:blocked) и как это повлияло на визуализации.

❓ Частые вопросы

Подойдет ли для моего ВУЗа?
Структура включает цель, ход выполнения и выводы, примеры запросов и скриншоты выполнения — соответствует типовым требованиям к лабораторным работам.

Можно адаптировать?
Да. SQL-запросы и схемы таблиц легко модифицируются под реальные датасеты: поменяйте имена таблиц, поля или фильтры, чтобы подключить свои метрики.