e-mail: dvkazakov @ gmail.com |
Тел./WhatsApp: +7-916-909-7864 |
Telegram: @denis_v_kazakov |
|
Skype: denis.v.kazakov |
Анализ частот употребления фраз в Google Books
Учебный проект, выполненный на курсе профессиональной переподготовки "Специалист по работе с данными. Data scientist" Школы 21 Сбер / Томского государственного университета.
Один из инструментов переводчика – анализ частот употребления слов и фраз, например с помощью Google Ngrams. Сервис строит графики частот по годам, однако сравнение качественное, и не всегда можно сказать (как в примере на стартовой странице), какая фраза встречается чаще и является ли различие статистически значимым.
Навыки:
Файлы проекта: ноутбук Jupyter и скрипт на Python (интерфейс на английском).
Цель проекта – дополнить график количественной оценкой.
Примеры результатов: