home

e-mail: dvkazakov @ gmail.com
(убрать пробелы с обеих сторон '@')

Тел./WhatsApp: +7-916-909-7864

Telegram: @denis_v_kazakov

GitHub

Skype: denis.v.kazakov

photo

English


Анализ частот употребления фраз в Google Books

Учебный проект, выполненный на курсе профессиональной переподготовки "Специалист по работе с данными. Data scientist" Школы 21 Сбер / Томского государственного университета.

Навыки:


Файлы проекта: ноутбук Jupyter и скрипт на Python (интерфейс на английском).

Один из инструментов переводчика – анализ частот употребления слов и фраз, например с помощью Google Ngrams. Сервис строит графики частот по годам, однако сравнение качественное, и не всегда можно сказать (как в примере на стартовой странице), какая фраза встречается чаще и является ли различие статистически значимым.

Цель проекта – дополнить график количественной оценкой.

Примеры результатов:



<