Polina Kazakova|Полина Казакова

Data Scientist|, Integrated Systems|Интегрированные Системы

[lang_ru]

Закончила НИУ ВШЭ по специальности “Фундаментальная и компьютерная лингвистика”, работала в Международной лаборатории языковой конвергенции при Вышке, где занималась моделированием языковых данных для социолингвистических исследований. Участник российских и международных конференций, соавтор ряда научных публикаций. Сейчас работает Data Scientist в компании Naumen, где занимается как научной деятельностью, так и решением прикладных задач анализа данных.

[/lang_ru]

 

Applying Topic Segmentation to Document-Level Information Retrieval|Тематическая сегментация в информационном поиске

October 13, 12:30|13 октября, 12:30
Room III|III зал

Discuss the presentation|Обсудить доклад

[lang_en]

In the present paper we discuss how text segmentation could be applied in the information retrieval domain. We assume that topic text segmentation allows one to better model text structure and therefore language itself, which influences the quality of text representation. We test the initial hypothesis by conducting experiments with several baseline models on the arXiv dataset comparing their quality on whole texts and on segmented texts. The experiments demonstrated that, indeed, the quality of retrieval is generally slightly improved.

[/lang_en][lang_ru]

Наша работа посвящена применению текстовой сегментации в сфере информационного поиска. Мы исходим из предположения, что тематическая сегментация позволяет лучше моделировать структуру текста и, как следствие, язык сам по себе, что влияет на качество представления текста в векторном виде. Мы протестировали нашу гипотезу на датасете статей из arXiv и показали, что сегментация действительно в большинстве случаев улучшает качество поиска.

[/lang_ru]

Sponsors & Partners|Спонсоры и партнёры

Sponsors|Спонсоры

Gold

JetBrainsFirst Line Software

Sponsors

BellSoftPVS-Studio

Embedded|Embedded

Auriga|Аурига

Partners|Партнёры

Gold|Золотой

Digital October

Main partners|Генеральные партнёры

RUSSOFT|РУССОФТAP KIT|АП КИТ

In cooperation|При содействии

ACM Special Interest Group on Software EngineeringAssociation for Computing Machinery

Technical partners|Технические партнёры

CUSTIS0x1.tvMajordomo

Organizers|Организаторы

Software Russiai-Help