Вопрос задан 13.10.2025 в 14:05. Предмет Информатика. Спрашивает Непочатых Илья.

Построить таблицы и графики.

Перейти к ответам

Ответы на вопрос

Отвечает Фаер Руслан.

Окей, отвечу как «завсегдатай» сайта вопросов-ответов. Ниже — мой развернутый ответ по теме «как построить таблицы и графики», от подготовки данных до конкретных действий в популярных инструментах (Excel/Google Sheets и Python).

Коротко: с чего начать

  1. Сформулируйте вопрос к данным. Что вы хотите показать: динамику во времени, сравнение категорий, распределение, связь между величинами?

  2. Приведите данные к «длинному» виду (tidy). Одна строка — одно наблюдение, один столбец — одна переменная, отдельный столбец для даты/категории/значения.

  3. Выберите тип визуализации по задаче:

    • Время → линейный график/областьной/столбчатый со смещением по дате.

    • Сравнение категорий → столбчатая/полосовая диаграмма.

    • Распределение → гистограмма/ящик с усами/виолин.

    • Зависимость → точечная (scatter), при необходимости — трендовая линия.

  4. Минимальная чистка дизайна: понятные подписи осей, единицы измерения, читабельные деления, лаконичная легенда, без «визуального шума».


Подготовка данных (универсально)

  • Проверка типов: даты должны быть датами, числа — числами (а не строками с пробелами).

  • Пропуски: либо удаляем, либо заполняем (средним/медианой/переносом последнего значения — зависит от смысла).

  • Категории: используйте человекочитаемые названия и разумный порядок (например, по убыванию).

  • Агрегация: если нужны месяцы — сверните ежедневные данные до месяца (сумма/среднее и т. п.).

  • Нормализация масштабов: в сравнении разных величин приведите их к сопоставимому виду или используйте 2 оси (осторожно, легко ввести в заблуждение).


Таблицы: как сделать их полезными

  • Структура: заголовок таблицы, шапка с единицами измерения, итоговые строки внизу.

  • Выравнивание: числа по правому краю, текст по левому, даты — по центру/правому.

  • Форматирование: фиксированное число знаков после запятой, формат процентов и валюты.

  • Подсветка важного: условное форматирование (но без «радуги»).

  • Сводные таблицы (pivot): быстрое «свертывание» по категориям, датам, регионам и т. д.


Как это сделать в Excel (пошагово)

Исходные данные (пример):

css
Дата Категория Значение 2025-01-01 A 120 2025-01-01 B 90 2025-02-01 A 150 2025-02-01 B 110 ...
  1. Таблица данных. Выделите диапазон → Вставка → «Таблица». Это включит авто-фильтры и «умные» ссылки.

  2. Сводная таблица (по желанию). Вставка → «Сводная таблица» → «Дата» в Строки, «Категория» в Столбцы, «Значение» в Значения (Сумма/Среднее).

  3. График тренда:

    • Выделите столбцы «Дата» и «Значение» (или сводную).

    • Вставка → Линейная (или Столбчатая для сравнений).

    • На вкладке «Конструктор»/«Макет» добавьте: название, подписи осей, формат чисел.

  4. Форматирование:

    • Уберите лишнюю заливку/обводки, сетку сделайте светлой или отключите.

    • Подпишите единицы (например: «кг», «₽», «%»).

    • Если категорий много, поверните подписи по оси X на 45° или используйте полосовую диаграмму.

  5. Гистограмма/распределение: Вставка → Статистические → «Гистограмма». Проверьте «Интервал» (формат оси).

Фишки:

  • «Срезы» и «Временная шкала» для сводных: Вставка → Срез → фильтры «по клику».

  • Быстрые итоги: Данные → «Итого…» (для группировок по столбцу).


Google Sheets (очень похоже на Excel)

  1. Вставьте данные, выделите диапазон → Вставка → «Диаграмма».

  2. В «Редакторе диаграмм»:

    • «Тип диаграммы» под задачу (Линейная/Столбчатая/Круговая/Точечная/Комбинированная).

    • Во вкладке «Настройка» укажите оси, ряды, диапазоны.

    • Во вкладке «Параметры» включите подписи, легенду, формат чисел.

  3. Сводные: Данные → «Сводная таблица». Потом по аналогии — диаграмма на основе сводной.

Совет: для временных рядов убедитесь, что столбец с датой распознан как дата (формат «Дата»).


Python (pandas + matplotlib): минимум кода — максимум контроля

Установка: pip install pandas matplotlib

Пример: линейный график по месяцам и столбчатая по категориям

python
import pandas as pd import matplotlib.pyplot as plt

# 1) Загружаем и чистим df = pd.read_csv("data.csv") # с колонками: date, category, value df["date"] = pd.to_datetime(df["date"])

# 2) Динамика по времени (сумма по месяцам) monthly = ( df.set_index("date") .groupby(pd.Grouper(freq="MS"))["value"] .sum() .reset_index() ) plt.figure() plt.plot(monthly["date"], monthly["value"]) plt.title("Динамика значения по месяцам") plt.xlabel("Месяц") plt.ylabel("Значение") plt.tight_layout() plt.show()

# 3) Сравнение категорий (среднее за весь период) by_cat = df.groupby("category", as_index=False)["value"].mean() plt.figure() plt.bar(by_cat["category"], by_cat["value"]) plt.title("Среднее значение по категории") plt.xlabel("Категория") plt.ylabel("Значение (среднее)") plt.tight_layout() plt.show()

# 4) Распределение (гистограмма) plt.figure() plt.hist(df["value"].dropna(), bins=20) plt.title("Распределение значения") plt.xlabel("Значение") plt.ylabel("Частота") plt.tight_layout() plt.show()

Точечная диаграмма с трендом:

python
import numpy as np

# Допустим, у вас есть x и y x = df["feature_x"].values y = df["value"].values

plt.figure() plt.scatter(x, y) # Линия тренда (линейная регрессия по МНК) m, b = np.polyfit(x, y, 1) plt.plot(x, m*x + b) plt.title("Связь value и feature_x") plt.xlabel("feature_x") plt.ylabel("value") plt.tight_layout() plt.show()

Сводная таблица в pandas:

python
pivot = pd.pivot_table( df, index="date", columns="category", values="value", aggfunc="sum" ) print(pivot.head())

Подбор типа диаграммы под задачу (шпаргалка)

  • ≤7 категорий: столбчатая/полосовая.

  • ≫7 категорий: полосовая с сортировкой по значению, возможно «горизонтальная».

  • Временной ряд: линейная или «область», точки по ключевым датам.

  • Доля в целом: не злоупотребляйте круговой; лучше — «доля от 100%» (stacked 100%) или полосовая.

  • Распределение: гистограмма или ящик с усами; при больших данных — KDE (если инструмент позволяет).

  • Корреляции: scatter-plot; для многих переменных — матрица корреляций + тепловая карта.


Частые ошибки и как их избежать

  • Две оси Y ради «красоты». Используйте только если переменные действительно в разных единицах и это критично; чётко подписывайте шкалы.

  • Обрезка нуля на столбчатых графиках. Для столбцов шкала должна обычно начинаться с нуля (иначе масштабы искажаются).

  • Слишком много цветов и легенд. До 6–8 серий — нормально; дальше группируйте или делайте малые кратные (small multiples).

  • Мелкий шрифт и «лес» делений. Реже деления, крупнее шрифт, поворот подписей.

  • Непрозрачные методики агрегирования. Всегда пишите, какое именно агрегирование использовано (сумма, среднее, медиана).


Мини-чек-лист перед публикацией

  • Заголовок отвечает на «что тут изображено?»

  • Подписи осей с единицами измерения

  • Источник данных/период (если релевантно)

  • Нет визуального мусора (градиенты, 3D, ненужные линии)

  • Цвета имеют смысл (например, одна категория — один цвет по всем графикам)

  • Таблица читаема: формат чисел, выравнивание, итоги, сортировка


Если нужна «живая» аналитика

  • Сводные + срезы (Excel/Sheets) — быстрый интерактив.

  • Дашборд: несколько графиков, единый фильтр по дате/региону; следите за одинаковыми шкалами и цветами.

  • Автообновление: храните данные в отдельной «чистой» таблице, графики — на другом листе; обновление не должно ломать макеты.


Если подскажете, в каком инструменте вы работаете и что именно хотите показать (тип данных/цель), могу накидать готовые шаги прямо под ваш кейс или пример кода на ваших столбцах.

Похожие вопросы

Топ вопросов за вчера в категории Информатика

Последние заданные вопросы в категории Информатика

Информатика 13.10.2025 18:25 6 Bekenov Daulet
Информатика 13.10.2025 18:16 22 Александровна Вероника
Задать вопрос