Разбор реальной data science задачи

🔥 Индивидуальная программа по обучению data science под вашу цель с моей менторской поддержкой до результата:
https://ershov.io/dsprogram?utm_source=youtube&utm_medium=video&utm_content=yt16

Тут я рассказываю почему я создал эту программу, для кого она подходит и в чем ее преимущества:
https://youtu.be/BcWsGLX8fjQ

🔥 Мой telegram канал о data science: https://t.me/ershovds

В этом видео я разберу пример реальной data science задачи:
* Определение продуктовой задачи – удаление негативных комментариев
* Постановка задачи машинного обучения – бинарный классификатор и precision / recall метрики
* Поиска датасета (берем с Kaggle)
* EDA (с помощью pandas)
* Предобработка текста (с помощью nltk и scikit-learn)
* Тренировка моделей (с помощью scikit-learn)
* Что делать дальше (про деплой в production)

Ссылка на jupyter notebook с примером из видео:
https://gist.github.com/ershovio/df72ccda4637a1b7ea4af7b3009eeb91

Таймкоды:
0:00 Введение
1:00 Постановка задачи
3:07 Составление датасета
5:55 Анализ данных (EDA)
12:48 Предобработка текста (text preprocessing)
20:40 Тренировка моделей (Model training)

Контакты:
Instagram: https://www.instagram.com/ershovio
Twitter: https://twitter.com/ershovio
Facebook: https://www.facebook.com/ershovio
#ershovds

Data Scienceカテゴリの最新記事