Talks & master-classes|Доклады и мастер-классы

Analytics for 100 million data. Short lesson for system integrators|Аналитика на 100млн. данных. Краткий ликбез для системных интеграторов

October 13, 13:10|13 октября, 13:10
Room II|II зал

Discuss the presentation|Обсудить доклад

[lang_en]

In enterprise systems, data has been accumulating for years. And it seems a simple task-to configure the integration of the database sources in the database of your system. It would seem, what problems can be? Check the model of the system, do mapping. The catch is that everyone lies! There is no perfect data! And our task is to cut off all unnecessary and not to lose valuable. And for this you need to carry out analysis.

Cherry on the cake are the volumes. Overloading 100mn of data is not equal to overloading 10mn. For 100 million, it is necessary to take into account the features of the model, the future purpose of the system and its use scenarios,

At what stages of system integration is it necessary to analyze the data? How to check why? And most importantly-what to do with the results?
I will share my experience, interesting cases and examples. I’ll give you tips on data analysis when designing system integration.

The report will be of interest to everyone who is interested in the quality of data in the integration of systems, wants to put in order the database of its system, as well as those who make project plans and do not understand why spend time on such research.

[/lang_en][lang_ru]

В энтерпрайз-системах данные накапливаются годами. И вроде простая задача — настроить интеграцию из баз-источников в базу данных вашей системы. Казалось бы, какие могут быть проблемы? Согласуй модель системы, сделай мэппинг. Подвох в том, что все врут! Идеальных данных не бывает! И наша задача отсечь все ненужное и не потерять ценное. А для этого нужно проводить аналитику.

Вишенкой на торте становятся объемы. Перегрузить 100млн данных не равно перегрузке 10млн. Для 100 млн нужно особенно тщательно учитывать специфику модели, дальнейшее предназначение системы и сценарии ее использования,

На каких этапах интеграции систем нужно анализировать данные? Как проверять, зачем? И самое главное — что делать с результатами?

Поделюсь опытом, интересными кейсами и примерами. Дам советы по анализу данных при проектировании интеграции систем.

Доклад будет интересен всем, кто интересуется качеством данных при интеграции систем, хочет привести в порядок БД своей системы, а также тем, кто составляет планы проектов и не понимает, зачем тратить время на такие исследования.

[/lang_ru]

Tatiana Bunto|Татьяна Бунто

Татьяна Бунто. Аналитика на 100млн. данных

Analyst|Аналитик, HFLabs

[lang_ru]

Внедряю продукт «Единый Клиент», помогаю приводить в порядок клиентские данные и трепетно отношусь к их качеству. Работаю с миллионными базами данных. Интегрирую «Единый клиент» с суровыми энтерпрайз-системами телекомов, банков и страховых.

[/lang_ru]

Sponsors & Partners|Спонсоры и партнёры

Sponsors|Спонсоры

Gold

JetBrainsFirst Line Software

Sponsors

BellSoftPVS-Studio

Embedded|Embedded

Auriga|Аурига

Partners|Партнёры

Gold|Золотой

Digital October

Main partners|Генеральные партнёры

RUSSOFT|РУССОФТAP KIT|АП КИТ

In cooperation|При содействии

ACM Special Interest Group on Software EngineeringAssociation for Computing Machinery

Technical partners|Технические партнёры

CUSTIS0x1.tvMajordomo

Organizers|Организаторы

Software Russiai-Help