Татьяна Бунто
Аналитик, HFLabs
Внедряю продукт «Единый Клиент», помогаю приводить в порядок клиентские данные и трепетно отношусь к их качеству. Работаю с миллионными базами данных. Интегрирую «Единый клиент» с суровыми энтерпрайз-системами телекомов, банков и страховых.
Аналитика на 100млн. данных. Краткий ликбез для системных интеграторов
13 октября, 13:10
Room II|II зал
Обсудить доклад
В энтерпрайз-системах данные накапливаются годами. И вроде простая задача — настроить интеграцию из баз-источников в базу данных вашей системы. Казалось бы, какие могут быть проблемы? Согласуй модель системы, сделай мэппинг. Подвох в том, что все врут! Идеальных данных не бывает! И наша задача отсечь все ненужное и не потерять ценное. А для этого нужно проводить аналитику.
Вишенкой на торте становятся объемы. Перегрузить 100млн данных не равно перегрузке 10млн. Для 100 млн нужно особенно тщательно учитывать специфику модели, дальнейшее предназначение системы и сценарии ее использования,
На каких этапах интеграции систем нужно анализировать данные? Как проверять, зачем? И самое главное — что делать с результатами?
Поделюсь опытом, интересными кейсами и примерами. Дам советы по анализу данных при проектировании интеграции систем.
Доклад будет интересен всем, кто интересуется качеством данных при интеграции систем, хочет привести в порядок БД своей системы, а также тем, кто составляет планы проектов и не понимает, зачем тратить время на такие исследования.