Программирование на языке Python. Уровень 4. Data Science. Обработка, анализ и визуализация данных на языке Python. Библиотеки pandas, numpy, matplotlib и seaborn

Python – один из самых популярных и востребованных языков программирования на сегодняшний день. Будучи высокоуровневым языком, он идеально подходит для разработки самостоятельных программ и сценариев и ориентирован на повышение производительности разработчика и читаемости кода. Синтаксис Python очень лаконичен, но в то же время его библиотеки включают большой объем полезных функций. Именно поэтому он отлично подходит для тех, кто только начинает свой профессиональный путь в программировании.
Что необходимо для того, чтобы освоить Python новичку? Компьютер и базовые знания английского.
Сегодня Python применяется в актуальной сфере анализа больших данных. Освоение этого языка программирования может стать первой ступенью на пути к освоению одной из самых востребованных профессий 21 века

Код: PH007
Включено в курс

Книги и материалы

Электронные документы

Обед

Кофе брейк

Документы об обучении

Удостоверение о повышении квалификации

Форма обучения: Очно/Дистанционно
Ближайшие даты
03 Июля - 07 Июня 2024 г.
14 - 18 Октября 2024 г.
Продолжительность: 5 дней 40 ак.часов
Стоимость 45 000 руб.
Целевая аудитория

Все желающие
• Программисты
• Специалисты IT-отрасли
• Системные администраторы
• Аналитики
• Студенты и научные сотрудники

Программа
  • 1. Установка и настройка программного обеспечения.

    • Базовый инструментарий работы в Jupyter notebook (4 ак.ч.)

    • Принципы организации и управления вычислениями

    • Используемые языки программирования и взаимосвязь между ними

    • Обзор библиотек и инструментов

    • Необходимые пакеты Python: numpy, pandas, matplotlib, seaborn, Jupyter и другие

    • Дистрибутив Anaconda, его преимущества и недостатки

    • Установка пакетов в Linux

    • Установка пакетов в Windows. Возможные проблемы и методы их решения

    • Методы и функции

    • Основные команды и методы работы в Jupyter notebook

  • 2. Библиотека numpy. Вычислительные задачи.

    • Структура библиотеки

    • Типы данных библиотеки numpy

    • Векторы и массивы, специальные типы данных

    • Понятие массива и его основные характеристики

    • Принципы вычислений

    • Универсальные функции

    • Важнейшие стандартные функции

    • Работа с массивами и матрицами (6 ак.ч.)

  • 3. Библиотека pandas и анализ данных (6 ак.ч.)

    • Объект Series

    • Объект DataFrame

    • Загрузка данных

    • Выгрузка данных

    • Чтение и запись данных в формате Excel

    • Чтение и запись JSON-файлов

    • Загрузка данных из интернета и из базы данных SQL

    • Загрузка CSV-файлов из Интернета

    • Основы работы с датафреймами

    • Организация колонок и строчек

    • Создание срезов объекта Series

    • Выравнивание данных по меткам индекса

    • Выполнение логического отбора

    • Переиндексация объекта Series

  • 4. Первичная обработка данных.

    • Сбор данных

    • Очистка данных

    • Подготовка данных

    • Объединение данных

    • Сцепление и наложение

    • Слияние данных

    • Замена значений

    • Работа с пропущенными значениями и их заполнение

    • Повторы в данных

    • Объединение и переформирование данных (8 ак.ч.)

  • 5. Статистика и анализ

    • Фильтрация

    • Группировка

    • Агрегация

    • Описательные статистики

    • Получение итоговых описательных статистик (8 ак.ч.)

    • Измерение центральной тенденции: среднее, медиана и мода

    • Вычисление дисперсии и стандартного отклонения

    • Вычисление ковариации и корреляции

    • Распределения

    • Разведывательный анализ

    • Постановка гипотезы

  • 6. Библиотека matplotlib. Визуализация данных. (4 ак.ч.)

    • Основные элементы диаграммы

    • Создание диаграммы

    • Виды графиков и диаграмм

    • Оформление и кастомизация графиков

    • Форматы изображений

  • 7. Библиотека seaborn. Наглядная визуализация сложных данных. (4 ак.ч.)

    • Виды графиков, их корректное использование и интерпретация

    • Принципы хорошей визуализации, основные ошибки при визуализации данных

    • График функции

    • Гистограмма

    • Визуализации отфильтрованных и сгруппированных данных

Преподаватели