|
e-mail: dvkazakov @ gmail.com (убрать пробелы с обеих сторон '@')
|
Тел./WhatsApp: +7-916-909-7864
|
Telegram: @denis_v_kazakov
|
GitHub
|
Skype: denis.v.kazakov
|
|
English
|
Программа профессиональной переподготовки "Специалист по работе с данными. Data scientist" Томского государственного университета
Обучение проходило на базе Школы 21 и состояло из 16 проектов, приближенных к реальной работе.
Достижения:
- Закончил курс первым из ~160 участников
- Студенты, обучающиеся быстрее других, делали разборы проектов для тех, кто учился медленнее. Из 16 проектов курса я делал разбор четырех (5, 7, 10 и 13)
- Как один из лучших учащися принимал курсовые проекты других студентов (обычно принимает персонал)
Стек технологий: Pandas, Sklearn, GIT, REST API, SQL, Matplotlib, Seaborn и Plotly.
Список проектов:
- 0. Сбор данных. Объединение данных из разных источников в один датафрейм.
- 1. Очистка данных. Очистка набора данных по клиентам банка для последующей обработки.
- 2. Предиктивный анализ I. Предобработка (нормализация данных и one-hot encoding) и логистическая регрессия. Прогнозирование оттока клиентов банка.
- 3. Предиктивный анализ II. Прогнозирование оттока клиентов банка. Логистическая регрессия, дерево классификации, случайный лес и градиентный бустинг. Кросс-валидация, ROC AUC.
- 4. Основы работы с GIT.
- 5. Методы оптимизации. Самостоятельная реализация метода градиентного спуска.
- 6. Алгоритмическая сложность.
- 7. Комбинаторика.
- 8. REST API. Самостоятельный выбор проекта. Сделал лингвистический сервис для сравнения частот употребления фраз в книгах Google Books на разных языках с оценкой статистической значимости различия. Подробнее
- 9. Математическая статистика, теория вероятностей, линейная алгебра. Параметры распределений, доверительные интервалы, формулы теории вероятностей, операции с матрицами. Свертка изображений. Singular value decomposition.
- 10. Библиотека Pandas: обработка датафреймов.
- 11. Введение в анализ данных. SQL + Pandas.
- 12. Визуализация данных. Matplotlib, Seaborn и Plotly.
- 13. Введение в машинное обучение. Классификация: бинарная и мультиклассовая. Регрессия. Переобучение. Кластеризация.
- 14. Продвинутое машинное обучение. Регуляризация, GridSearch, метрики, ансамбли, пайплайны и ООП.
- 15. Прототип рекомендательного сервиса рецептов с целью помочь пользователям питаться правильно. Прогноз вкусовых качеств блюда по списку ингредиентов с помощью моделей машинного обучения. Информация по пищевой ценности ингредиентов. Подбор рецептов и меню на день по пищевой ценности.
- *** Прогнозирование цен на Airbnb. Дополнительный проект, не входящий в обязательную часть обучения
В начало страницы