📘 О чем эта работа
Отчет посвящен практической обработке и визуализации синтетического набора чисел: объект — серия из 1000 случайных целых чисел в диапазоне от -10000 до 10000, сгенерированных с помощью NumPy (np.random.randint) и сохранённых для анализа средствами Pandas. В работе показаны все этапы — от генерации и сохранения в CSV до очистки и построения графиков с Matplotlib.
📚 Что внутри
В документе подробно описаны последовательные шаги выполнения практики и конкретные технические решения:
- Генерация: использование numpy.random.randint(-10000, 10001, 1000) с фиксированным np.random.seed(42) для воспроизводимости.
- Хранение: экспорт серии в 'data_series.csv' через s.to_csv('data_series.csv', index=False, encoding='utf-8').
- Очистка: удаление дубликатов, проверка на выбросы по границам (lower_bound/upper_bound), подсчёт количества аномалий и формирование очищенной Series.
- Статистика: вычисление min, max, sum, стандартного отклонения и количества повторяющихся значений (s.min(), s.max(), s.sum(), s.duplicated()).
- Визуализация: линейный график последовательности, гистограмма с округлением значений до сотен (range(-10000,10001,100)), сравнение отсортированных столбцов 'По возрастанию' и 'По убыванию'.
- Формирование DataFrame: преобразование Series в DataFrame, добавление столбцов с отсортированными значениями и экспорт в 'dataframe_sorted.csv'.
- Окружение: рекомендация по использованию PyCharm и библиотек Pandas, NumPy, Matplotlib для выполнения практики.
📊 Для кого подходит
Материал ориентирован на студентов прикладной информатики и начального уровня специалистов по анализу данных. Подойдет для выполнения отчёта по учебной практике, лабораторных работ по программированию и дисциплин по обработке числовых рядов и визуализации.
✨ Особенности
В работе представлены готовые примеры кода и файлы вывода: скрипт генерации с seed=42, CSV-файлы с исходной серией и отсортированным DataFrame, готовые построения графиков (линейный график, гистограммы для округлённых значений). Отдельно показаны техники обнаружения и удаления дубликатов и базовая проверка на выбросы, что ускоряет адаптацию под лабораторные задания.
❓ Частые вопросы
Подойдет ли для моего ВУЗа?
Структура содержит введение, описание методов, код, результаты визуализации и заключение — универсальна и соответствует типовым требованиям отчётов по практике.
Можно ли адаптировать?
Да. Скрипты легко модифицировать: изменить диапазон генерации, объём выборки, критерии фильтрации выбросов или экспорт форматов (CSV/Excel).