PySpark + SQL + Python Engineer с нуля до junior

- Уроков: 1
- Сложность: easy
- Аудитория: Курс будет полезен всем людям, будь то школьники, студенты, взрослые, пенсионеры, люди, желающие освоить новое направление, желающие поменять род деятельности.
Основная цель набора курсов – приобретение знаний для начинающих специалистов в области обработки больших данных с нуля, без каких-либо начальных знаний. Вы изучите основы распределённых вычислений с Apache Spark, научитесь работать с RDD и DataFrame, познакомитесь с Spark SQL, оптимизацией запросов, потоковой обработкой и библиотекой машинного обучения MLlib. В курсе SQL рассматривается и прорабатывается весь инструментарий, необходимый для работы с базами данных (PostgreSQL, написание сложных SQL запросов, оптимизация запросов, администрирование). В свою очередь на курсе по Python глубоко рассматривается и прорабатывается весь инструментарий стека (нейросети, pandas, чат-боты, алгоритмы и сортировки, PyQt5). Данные курсы помогут вам получить необходимые знания для углубления в сфере больших данных, либо трудоустройства на такие позиции как Junior SQL Developer или Junior Python Engineer.
Общее содержание курса Python Engineer:
- Общая информация
- Введение
- Начало Python
- Условные операторы, циклы и try/except
- Строки
- Списки и кортежи
- Словари и множества
- Функции
- Модули и пакеты
- Random и time
- Decimal / Fractions / Complex
- IterTools
- Введение в PyQt5
- Асинхронность и многопоточность
- Алгоритмы и сортировки
- MatPlotLib
- Что такое матрицы и NumPy?
- Файлы
- ООП
- Машинное обучение
- NLP
- OpenCV
- Чат-боты
- Что такое SQLAlchemy и Django
- Итоговый проект
Общее содержание курса PySpark:
- Введение в Spark и основы распределённых вычислений
- Работа с данными в PySpark: RDD
- Работа с данными в PySpark: DataFrame и Spark SQL
- Оптимизация производительности PySpark-приложений
- Потоковая обработка с PySpark Structured Streaming
- Машинное обучение с PySpark MLlib
- Интеграция PySpark с внешними системами
- Отладка и профилирование PySpark-приложений
- Чеклисты и шпаргалки по PySpark
- Продвинутые темы PySpark
- Финальные проекты
Общее содержание курса SQL:
- Знакомство с платформой и сдача практических работ
- Что такое базы данных?
- Проектирование базы данных
- Введение в PostgreSQL
- Структура SQL запросов
- Команды DML
- Запросы на выборку данных
- Агрегация и группировка данных
- Работа с несколькими таблицами
- Работа с NULL значениями
- Индексы и их использование
- Работа с представлениями (Views)
- Управление доступом и безопасностью
- Хранимые процедуры и функции
- Триггеры и их использование
- Работа с JSON и XML данными
- SQL для аналитики данных
- NoSQL и SQL
- Безопасность данных и шифрование
- Введение в Clickhouse
- Разбор основных вопросов на собеседованиях
- Итоговое задание
Желаю удачи в освоении нового, но очень интересного материала!
О новостях курса, важных обновлениях и прочих интересных вещах можно узнавать из группы в телеграмме - https://t.me/data_stepic
Необходим компьютер.
Необходимо уметь включать компьютер :)