Платформа для полного цикла ML‑разработки и совместной работы Data‑команд
Быстрый запуск ML-моделей в облаке
ML-разработка полного цикла без необходимости настраивать среду и администрировать инфраструктуру. Быстрый запуск экспериментов с данными и обучение ML-моделей, возможность легко масштабировать инфраструктуру.
- design. Эксперименты с данными и моделями машинного обучения
- model development. Трекинг и версионирование экспериментов, ML-моделей, данных и других артефактов
- operations. Деплой ML-моделей, мониторинг и обновления моделей в production
Совместная работа команд
Инструменты платформы заточены под работу в команде
- Понятный процесс решения Data-задач
- Разделение ролей и зон ответственности
- Видны эксперименты и результаты других участников
Полный цикл разработки
ML-разработка полного цикла: от настройки среды до запуска в production
Data-команды
- Готовое решение и простая установка
- Преднастроенные среды уже готовы для работы с данными и ML-моделями
- Выбирайте нужную конфигурацию и регулируйте мощность инфраструктуры — самостоятельно
Администраторы
- Прозрачность системы, логирование и аудит пользователей
- Поддержка 24/7
- Проработанная документация, FAQ по решению типовых задач
Бизнес
- Безопасность: интеграция с корпоративными системами аутентификации, логирование, аудит пользователей
- Оплата сервиса по модели pay-as-you-go: только за использованные ресурсы
Компоненты платформы
- JupyterHub. Быстрое создание Jupyter Notebooks по клику для проведения экспериментов
- MLflow+JupyterHub. Готовое к работе окружение с JupyterHub, предназначенное для управления жизненным циклом ML-моделей
- MLflow Deploy. Удобная среда для упаковки ML-моделей и их автоматического развертывания в облаке. Компонент интегрирован с MLflow и JupyterHub
- Spark в Kubernetes. Готовое рабочее пространство для обработки данных, возможность вызова и управления из JupyterHub. В разработке
Планы развития платформы на 2022-2025
- Мониторинг
- Версионирование данных и датасетов
- Feature Store
- Каталоги данных и метаданных
Почему ML Platform
- Единая среда. Open-Source-инструменты готовы к работе и интегрированы между собой.
- Простое развертывание. Установка, настройка и интеграция компонентов максимально упрощены.
- Масштабируемость. Регулировать объем необходимых ресурсов можно самостоятельно. Это быстро и легко.
- Необходимые библиотеки. Популярные библиотеки уже есть в ML Platform. Вы также можете установить другие пакеты.
- Полный контроль. Функции логирования, аудита пользователей, интеграция с корпоративными системами.
- Безопасность. У платформы есть аттестат 152-ФЗ для работы с персональными данными. ЦОДы уровня Tier III расположены в России.
Источник: https://cloud.vk.com/machine-learning/