Sergey Politsyn|Сергей Полицын

Associated professor|Доцент, Moscow Aviation Institute (National Research University)|Московский авиационный институт (национальной исследовательский университет)

[lang_en]

Graduated from the MATI-RSTU named after K.E. Tsiolkovsky, the department «Computer systems design», PhD in technical sciences. More than 10 years of experience in software development, test automation, and project management. Co-researcher in computer linguistics. Participant of Russian and international conferences and competitions.

[/lang_en][lang_ru]

Закончил МАТИ-РГТУ им. К.Э. Циолковского, кафедру “Проектирование вычислительных комплексов”, кандидат технических наук. Более 10 лет опыта разработки программного обеспечения, автоматизации тестирования и управления проектами. Занимается исследованиями в области автоматизированного анализа текста. Участник российских и международных конференций и конкурсов.

[/lang_ru]

 

Development of the Cross-platform Library of Morphological Analysis of the Russian Language Text for Industrial Software|Разработка кроссплатформенной библиотеки морфологического анализа текстов на русском языке для использования в промышленных системах

October 13, 11:50|13 октября, 11:50
Room III|III зал

Discuss the presentation|Обсудить доклад

[lang_en]

The need to automate text data processing leads to the need of using computer linguistics tools in industrial systems of different kinds (document management systems, e-commerce, etc.), which imposes additional requirements on the means of automatic text processing.

Comparing to the more lenient requirements for research tools, libraries that meet the requirements of performance, reliability, compatibility with modern modern programming languages, project assembly, etc. are needed in the industrial systems.

The report suggests a new cross-platform library of morphological analysis for the Russian language with open source code which can be useful for developers of information systems and researchers in the field of computer linguistics to obtain the initial forms of a word or generate the desired word form from the specified set of morphological characteristics.

[/lang_en][lang_ru]

Потребность в автоматизации обработки больших объемов текстовых данных приводит к необходимости использования инструментов компьютерной лингвистики в прикладных промышленных системах разной направленности (системах документооборота, электронной коммерции и др.), что накладывает дополнительные требования к средствам автоматического анализа текста.

В отличие более мягких требований к исследовательским инструментам, для использования в промышленных системах необходимы библиотеки, отвечающие требованиям производительности, надежности, совместимости с современными современными языками программирования, сборки проектов и т.д.

В докладе предлагается новая кроссплатформенная библиотека морфологического анализа текстов на русском языке с открытым исходным кодом, которая может быть полезна разработчикам информационных систем и исследователям в области компьютерной лингвистики для получения начальных форм слова или генерации нужной формы по заданным морфологическим характеристикам.

[/lang_ru]

Sponsors & Partners|Спонсоры и партнёры

Sponsors|Спонсоры

Gold

JetBrainsFirst Line Software

Sponsors

BellSoftPVS-Studio

Embedded|Embedded

Auriga|Аурига

Partners|Партнёры

Gold|Золотой

Digital October

Main partners|Генеральные партнёры

RUSSOFT|РУССОФТAP KIT|АП КИТ

In cooperation|При содействии

ACM Special Interest Group on Software EngineeringAssociation for Computing Machinery

Technical partners|Технические партнёры

CUSTIS0x1.tvMajordomo

Organizers|Организаторы

Software Russiai-Help