Программирование на языке Python. Уровень 4. Data Science. Обработка, анализ и визуализация данных на языке Python. Библиотеки pandas, numpy, matplotlib и seaborn

Python – один из самых популярных и востребованных языков программирования на сегодняшний день. Будучи высокоуровневым языком, он идеально подходит для разработки самостоятельных программ и сценариев и ориентирован на повышение производительности разработчика и читаемости кода. Синтаксис Python очень лаконичен, но в то же время его библиотеки включают большой объем полезных функций. Именно поэтому он отлично подходит для тех, кто только начинает свой профессиональный путь в программировании.
Что необходимо для того, чтобы освоить Python новичку? Компьютер и базовые знания английского.
Сегодня Python применяется в актуальной сфере анализа больших данных. Освоение этого языка программирования может стать первой ступенью на пути к освоению одной из самых востребованных профессий 21 века

Код: PH007
Включено в курс

Книги и материалы

Электронные документы

Обед

Кофе брейк

Документы об обучении

Удостоверение о повышении квалификации

Форма обучения: Очно/Дистанционно
Ближайшие даты
14 - 18 Октября 2024 г.
Продолжительность: 5 дней 40 ак.часов
Стоимость 45 000 руб.
Целевая аудитория

Все желающие
• Программисты
• Специалисты IT-отрасли
• Системные администраторы
• Аналитики
• Студенты и научные сотрудники

Программа
  • 1. Установка и настройка программного обеспечения.

    • Базовый инструментарий работы в Jupyter notebook (4 ак.ч.)

    • Принципы организации и управления вычислениями

    • Используемые языки программирования и взаимосвязь между ними

    • Обзор библиотек и инструментов

    • Необходимые пакеты Python: numpy, pandas, matplotlib, seaborn, Jupyter и другие

    • Дистрибутив Anaconda, его преимущества и недостатки

    • Установка пакетов в Linux

    • Установка пакетов в Windows. Возможные проблемы и методы их решения

    • Методы и функции

    • Основные команды и методы работы в Jupyter notebook

    • 2. Библиотека numpy. Вычислительные задачи.

      • Структура библиотеки

      • Типы данных библиотеки numpy

      • Векторы и массивы, специальные типы данных

      • Понятие массива и его основные характеристики

      • Принципы вычислений

      • Универсальные функции

      • Важнейшие стандартные функции

      • Работа с массивами и матрицами (6 ак.ч.)

      • 3. Библиотека pandas и анализ данных (6 ак.ч.)

        • Объект Series

        • Объект DataFrame

        • Загрузка данных

        • Выгрузка данных

        • Чтение и запись данных в формате Excel

        • Чтение и запись JSON-файлов

        • Загрузка данных из интернета и из базы данных SQL

        • Загрузка CSV-файлов из Интернета

        • Основы работы с датафреймами

        • Организация колонок и строчек

        • Создание срезов объекта Series

        • Выравнивание данных по меткам индекса

        • Выполнение логического отбора

        • Переиндексация объекта Series

        • 4. Первичная обработка данных.

          • Сбор данных

          • Очистка данных

          • Подготовка данных

          • Объединение данных

          • Сцепление и наложение

          • Слияние данных

          • Замена значений

          • Работа с пропущенными значениями и их заполнение

          • Повторы в данных

          • Объединение и переформирование данных (8 ак.ч.)

          • 5. Статистика и анализ

            • Фильтрация

            • Группировка

            • Агрегация

            • Описательные статистики

            • Получение итоговых описательных статистик (8 ак.ч.)

            • Измерение центральной тенденции: среднее, медиана и мода

            • Вычисление дисперсии и стандартного отклонения

            • Вычисление ковариации и корреляции

            • Распределения

            • Разведывательный анализ

            • Постановка гипотезы

            • 6. Библиотека matplotlib. Визуализация данных. (4 ак.ч.)

              • Основные элементы диаграммы

              • Создание диаграммы

              • Виды графиков и диаграмм

              • Оформление и кастомизация графиков

              • Форматы изображений

              • 7. Библиотека seaborn. Наглядная визуализация сложных данных. (4 ак.ч.)

                • Виды графиков, их корректное использование и интерпретация

                • Принципы хорошей визуализации, основные ошибки при визуализации данных

                • График функции

                • Гистограмма

                • Визуализации отфильтрованных и сгруппированных данных

                Преподаватели