VK Data Meetup — это серия событий для дата-инженеров, аналитиков, разработчиков, администраторов о практиках работы с данными на разных уровнях. Митап 12 октября посвящен работе с большими данными и ML.
Обсудим тренды и процессы взаимодействия со смежными подразделениями и внутри дата-команд, поговорим про платформенные решения, такие как Spark on Kubernetes и No Code AutoML-платформы, а также рассмотрим кейсы решения практических бизнес-задач.
Приглашаем дата- и ML-инженеров, тимлидов и разработчиков решений для аналитики и платформ данных, архитекторов и специалистов по Data Science.
14:00 — 14:30 – Сбор участников
Тренды и процессы
14:30 — 15:20 – Дискуссия: «По ту сторону данных: как выстраивать взаимодействие в дата-командах и коммьюнити»
Вместе со спикерами из Ozon.Fintech, VK, Альфа-Банка поговорим о том, что сегодня происходит в индустрии работы с данными. С какими проблемами сталкиваются дата-команды и дата-офисы. Станут ли дата-сообщества драйверами для развития индустрии.
Модератор:
Спикеры:
15:20 — 16:05 – Дискуссия: «Искусство Data Ownership: как построить прозрачный процесс ответственности за данные без дорогостоящих технических решений»
Обсудим:
· Какие методологии распределения ответственности работают на практике и не разбиваются о суровую действительность?
· На какие компромиссы приходится идти, чтобы сделать процессы прозрачными и как сделать владельцев данными своими друзьями?
· Фатальные и не очень ошибки владельцев данных — чего опасаться и как дата-инженеру выстроить «защиту от дурака»?
· Какой инструментарий помогает реализовать роль владельца данных в компании.
Модератор:
Спикеры:
Состав участников дополняется
Инструменты
16:05 — 16:35 – Можно ли сделать Spark в Kubernetes простым?
В своем докладе Алексей расскажет о том, как реализовать управляемый Spark в Kubernetes, скрыв все сложности конфигурации и предоставив пользователям удобный инструмент для работы из любых сред.
16:35 — 17:05 – Перерыв
17:05 — 17:35 – Как мы автоматизировали большую часть задач ML-специалистов
Команда VK Predict разработала No Code AutoML-платформу, чтобы упростить повседневные задачи своих ML-специалистов. Из доклада Арсения вы узнаете, какие возможности и ограничения есть у современных AutoML-платформ, почему готовые продукты подходят не всем и как реализовать подобное решение в своей команде.
Практика
17:35 — 18:05 – Big Data в действии: как мы персонализируем ранжирование каталога с пользой для клиентов и бизнеса
Александр поделится успешным опытом внедрения персонализации ранжирования каталога в Lamoda: расскажет про двухуровневую архитектуру ML-системы с применением таких технологий, как Spark и Elasticsearch, про полученный бизнес-эффект и дальнейшие планы развития персонализации ранжирования.
18:05 — 18:35 – Тут будет классный доклад
18:35 – After party
Источник: https://mcs.mail.ru/events/vk-data-meetup