Упрощение работы

с данными и проектами

Упрощение навигации между датасетами и пайплайнами, запуск проектов без данных и удобная работа с множественными наборами данных.

7 минут

Пользователи работали с двумя сущностями: Datasets (наборы данных) и Pipelines (проекты). Исторически они были смешаны в одном разделе, а запуск пайплайна требовал заранее загруженного датасета.

Когда мы тестировали другой функционал, мы заметили, что люди путались в интерфейсе, а также их фрустрировало то, что нельзя создать проект без датасета и ознакомиться с функционалом и отчетом. Мои коллеги тоже часто приносили фидбек об использовании платформы. Проблемы начинались буквально на старте работы, поэтому не заметить их было сложно.

Также мы обсуждали необходимость внедрить множественные датасеты, что тоже требовало пересмотра навигации и структуры страниц. В итоге я объединила это все в большую задачу, после которой навигация и старт работы должны были стать проще.

Введение

  1. Разделение датасетов и пайплайнов снизит когнитивную нагрузку и повысит скорость работы.
  2. Создание пайплайна без данных сократит Time-to-First-Value и увеличит активацию.
  3. Множественные датасеты и расширенный импорт дадут прирост к использованию пайплайнов.

Гипотезы

Я провела 16 контекстных интервью с пользователями (биологи, биоинформатики). Целью было выявить проблемные зоны и проверить гипотезы, перечисленные выше. На интервью задала вопросы, а также попросила пользователей решить эти задачи на платформе:
  • Создать пайплайн
  • Импортировать датасет и оценить корректность данных
  1. Путаница, хаос, потеря времени, нет структурности. Пользователи часто терялись между данными и пайплайнами и даже придумали свои «хаки»: например, давали датасетам очень длинные названия с метками, чтобы потом не спутать. Уходила куча времени на поиск данных и навигацию по платформе — пользователи тратили 3-5 минут.
  2. Фрустрация, сложный старт. Некоторые пользователи действительно хотят начать работу с анализа проекта. А Time-to-First-Value оказался дольше, чем хотелось бы. Возможность «набросать черновик» и изучить проект воспринималась как способ быстрее почувствовать прогресс.
  3. Множественные датасеты нужны. Большинство респондентов отмечали, что редко ограничиваются одним датасетом, обычно нужно объединять хотя бы 2–3. Текущий процесс импорта воспринимался «ломким»: часто приходилось вручную чистить или преобразовывать файлы перед загрузкой, что увеличивало время подготовки.
  4. Гибкость в работе с данными важнее скорости запуска. Биологи и биоинформатики готовы тратить больше времени на подготовку данных, если будут уверены, что у них есть контроль над качеством и структурой. Это значит, что дизайн должен предусматривать не только быстрый импорт, но и подробные инструменты для валидации и редактирования данных
  5. Метрики важны. Биологи хотят видеть, насколько эффективно работает их пайплайн: время выполнения шагов, процент ошибок, «здоровье» данных. Значит, аналитические дашборды (пусть даже простые) могут быть частью ценности продукта
  6. Некоторые интерфейсные проблемы для примера: не получалось найти страницу с информацией о датасете, долго не могли подобрать нужный пайплайн и затем найти нужный в списке, текст был слишком техническим и непонятным, не было понимания, сохранены ли данные во время загрузки датасета.

Ключевые инсайты и подтверждение гипотез

Контекстные интервью

После интервью составила и приоритезировала список функционала, обсудила его и технические ограничения вместе с продуктовой командой. Затем зафиксировали это все на общем созвоне. Получился вот такой список для первой итерации:
  • Несколько способов загрузки (локально, из библиотек, внешние источники).
  • Просмотр и редактирование после загрузки.

Улучшение работы с датасетами

При создании проекта пользователь сразу видит дашборд, в котором есть:
  • описание пайплайна и шагов;
  • статус проекта;
  • список датасетов (с подсказкой о необходимости загрузки);
  • отчёты
  • заметки
Теперь даже без данных пользователь мог познакомиться с функциональностью.

Новый дашборд пайплайна,

запуск без датасетов

  • Отдельные разделы Datasets и Pipelines
  • Четкая структура по типам
  • Легкое переключение между сущностями – неважно, где находится пользователь
  • Поиск, фильтрация, сортировка
  • Редактирование и описание датасета
  • Запуск пайплайна сразу с несколькими датасетами

Разделение пространств

Решения

Собрали кучу отзывов после релиза. Это было основной (и очень приятной) метрикой в нашем продукте

Качественные метрики

Made on
Tilda