Полина Казакова

Data Scientist, Интегрированные Системы

Закончила НИУ ВШЭ по специальности “Фундаментальная и компьютерная лингвистика”, работала в Международной лаборатории языковой конвергенции при Вышке, где занималась моделированием языковых данных для социолингвистических исследований. Участник российских и международных конференций, соавтор ряда научных публикаций. Сейчас работает Data Scientist в компании Naumen, где занимается как научной деятельностью, так и решением прикладных задач анализа данных.

 

Тематическая сегментация в информационном поиске

13 октября, 12:30
Room III|III зал

Обсудить доклад

Наша работа посвящена применению текстовой сегментации в сфере информационного поиска. Мы исходим из предположения, что тематическая сегментация позволяет лучше моделировать структуру текста и, как следствие, язык сам по себе, что влияет на качество представления текста в векторном виде. Мы протестировали нашу гипотезу на датасете статей из arXiv и показали, что сегментация действительно в большинстве случаев улучшает качество поиска.

Спонсоры и партнёры

Спонсоры

Gold

JetBrainsFirst Line Software

Sponsors

BellSoftPVS-Studio

Embedded

Аурига

Партнёры

Золотой

Digital October

Генеральные партнёры

РУССОФТАП КИТ

При содействии

ACM Special Interest Group on Software EngineeringAssociation for Computing Machinery

Технические партнёры

CUSTIS0x1.tvMajordomo

Организаторы

Software Russiai-Help