Vector DB & RAG Developer

- Уроков: 25
- Сложность: easy
- Аудитория: Для кого этот курс ML / Data-инженеры, которым нужен быстрый поиск по embeddings. Backend-разработчики, добавляющие умный поиск или чат-бота в продукт. DS/Analytics-junior — хотите прокачать портфолио проектом на LLM. Техлиды / CTO, выбирающие стек для корпоративного knowledge-base. Стартапы, где «Google-поиск по документам» и RAG-бот экономят поддержку.
Vector DB & RAG Developer — практический маршрут от «что такое эмбеддинги?» до production-чат-бота, отвечающего на вопросы из вашей корпоративной базы знаний.
За несколько недель вы:
-
развернёте Qdrant, Weaviate и FAISS локально и в Docker/Cloud;
-
создадите коллекции на миллионы векторов, подберёте правильный индекс (HNSW, IVF-PQ, ScaNN);
-
настроите гибридный поиск (BM25 + ANN) и мультимодальный поиск с CLIP;
-
подключите базу к LLM (OpenAI/GPT-4o, Mistral, Llama) и реализуете RAG-архитектуру;
-
измерите качество выдачи (Recall@K, nDCG) и построите автоматические тесты;
-
оформите CI/CD пайплайн: тесты → Docker → GitHub Actions → prod;
-
защитите проект от «векторного взрыва» (sharding, фильтры, дедупликация).
Итог — готовый репозиторий с API для семантического поиска и RAG-бот, которого можно деплоить на Render, Railway или собственный сервер.
Вы можете задать любой вопрос по курсу в телеграмм @alexey_stepik
Запускать скрипт python main.py
, ставить пакеты pip install …
Переходить между папками (cd
), копировать-вставлять команды
Склонировать репозиторий git clone …
— всё остальное покажем