Research — martsen.me

Исследования, приоритеты и метрики в Atlassian

В 2016 году исследователи компании проанализировали интервью и комментарии текущих и ушедших клиентов. Из статьи вы узнаете, что сделала продуктовая команда Jira, чтобы сократить churn.

Один из способов становиться лучше как профессионал — это учиться на опыте других. Особенно интересны примеры из больших компаний с налаженными процессами и топовыми специалистами. Из разных источников я попытался восстановить процесс большого редизайна Jira. Ссылки вы найдете в конце.

Проблема на уровне бизнеса

В 2016 году исследователи компании проанализировали интервью и комментарии текущих и ушедших клиентов. Удобство пользования продуктом было камнем преткновения для пользователей Jira.

Продуктовый департамент транслировал эту проблему бизнесу. Повышение удобства использования стало одной из главных целей компании. Улучшения решили оценивать по NPS.

Спрашивать NPS внутри продукта — нормальная практика. А вот запросить доп.информацию о юзере и назначить интервью в том же окошке— это интересно :) — Спрашивать NPS внутри продукта — нормальная практика. А вот запросить доп.информацию о юзере и назначить интервью в том же окошке— это интересно 🙂

Метрики

NPS (индекс лояльности) — это главная метрика Atlassian. Важнее продаж, выручки, LTV и размера месячной аудитории. Но она не подходит для оценки релизов:

NPS — это интегральная метрика, на которую влияют многие аспекты бизнеса, а не только удобство продукта.
В зрелой компании сложно двигать верхнеуровневые метрики. Практически невозможно заметить улучшение после короткой итерации.

Продуктовым команда была нужна метрика, которая позволит напрямую оценить изменения на юзабилити. Индустриальным стандартом для этой цели является System Usability Scale (SUS).

Придуманный в 1986 году опросник оценки удобства пользования.

Главная проблема SUS при использовании в качестве in-product опроса— количество вопросов сильно прерывает работу пользователей, что снижает количество заполненных анкет.

Исследователи компании предложили использовать более компактные юзабилити-метрики: UMUX и UMUX-Lite. В них всего 4 и 2 вопроса соответственно, что позволяет разместить эти опрос внутри продукта и получать хорошую конверсию в ответ. Притом, ранние исследования доказали сильную корреляцию между этими метриками, SUS и NPS.

Была проведена серия экспериментов, где последовательно спрашивали UMUX-Lite и NPS. Была найдена относительно сильная линейная зависимость между этими метриками (R² = 0.62), что позволило UMUX-Lite стать “мостиком” для NPS. Продуктовым командам выдали формулу “перегонки” из одного значения в другое: NPS = 3.18 ∗ (UMUX-Lite) − 200.6. Это позволило выставлять реалистичные цели на релизы.

NB! Не переиспользуйте эту формулу у себя. Установите свой процесс замера этих метрик и на своей аудитории найдите формулу зависимости.

Приоритизация инициатив

У членов команды было много предложений как сделать Jira удобнее. Нужно было выстроить систему приоритетов. Для этого снова обратились к комментариям из NPS. Вдохновившись классификацией требований к программным системам FURPS, фидбек разбили по следующим темам:

Reliability — требования к надежности.
Usability — требования к удобству использования.
Functionality — функциональные требования.

Каждая тема содержит иерархию из категорий и отдельных фичей.

Продуктовая команда Atlassian получает около 2000 комментариев в месяц. Для тэгирования (кодинга) такого объема информации ребята взяли к себе несколько стажеров. Разметка идет в общем Google Spreadsheet. Каждый комментарий может быть включен в 3 категории и обязательно назначается на ответственную команду.

Каждую потенциальную фичу / проблему они рассматривают в трех измерениях: размер аудитории, частота использования и доля негативного фидбека.

Feature 1 — хороший кандидат для исправления. Большое количество аудитории часто ей пользуется и доля негативных комментов (Pain Index) тоже высока.

Юзабилити-проблемы также разбивали на три популярных категории, которые встречались в комментариях. Это позволило прицельно решать проблемы.

Числа в ячейках — это количество детракторов, которые упомянули о проблеме

Инструмент мониторинга: UX ScoreCard

Для продукта составляют набор метрик за которыми хочется следить. В идеале, этот набор метрик постоянен на всех стадиях разработки продукта, но на практике это не так.

Например, NPS мы можем получить только после выпуска продукта. Или метрики в стиле “время на выполнения задачи” хорошо замеряются в юзабилити-тестах, но не всегда четко отслеживаются “в бою”, т.к. мы не знаем контекст пользователя. Исключением, конечно, являются страницы с четкими Call to Action.

Поэтому в Atlassian используют два дашборда:

Early Signal Testing Scorecard (ESTS) — для дизайн-команды выносят метрики, которые помогают принимать решения на этапе разработки. Для этого они создали собственный мини-фреймворк — Early Signal Testing (никаких откровений особо по ссылке нет, но можно пощелкать презентацию).
Instrumented Scorecard — для продуктовой команды, когда фича уже в проде. Сюда выносят метрики, которые составлены по Google HEART и UMUX-Lite (это, видимо, замеряет Happiness).

Early Signal Testing Scorecard отображает метрики по новым и текущим юзерам

Находим эффект от продуктовых изменений в UMUX-Lite

Продуктологам хочется понимать “стрельнул” ли апдейт. Для этого аналитик строит линейную модель, которая пытается предсказать значение UMUX-Lite.

Линейные модели — не самые точные ML-алгоритмы, зато очень легко интерпретируются, что и нужно в работе над продуктом. Можно посмотреть, дал ли апдейт ожидаемый вклад. Ну или можно воспользоваться A/B-тестами.

Вывод

Анализ комментариев из NPS позволил подсветить проблемные места продукта. Через процесс кодинга удалось “оцифровать” жалобы клиентов и использовать количество жалоб как один из факторов в расстановке приоритетов.

Проблема медленной реакции NPS на изменения была решена созданием отдельной метрики для продуктовых команд.

UMUX-Lite стал мостиком между дизайнерами, продуктологами и бизнесом, который позволил быстрее получать обратную связь на релизы и понимание вклада в цель компании.

Более подробнее про метрику и методологию можно прочитать здесь: Measuring Usability: From the SUS to the UMUX-Lite.

Источники

Актуальные материалы по продуктовой аналитике и исследованиям лежат в моем телеграм-канале Product Science.

Открыть Product Science в Telegram

Продуктовое исследование, ч.1 основные термины

Про фундаментальные определения в исследованиях, о которых забывают практики.

Я не нашел специальной литературы по продуктовым исследованиям “от А до Я”. Есть практические книжки и статьи с “лайфхаками” и “самым важным”, но этого мне уже недостаточно.

Я посмотрел на опыт и работу топовых продуктовых исследователей. Почти все имеют PhD в социологии, психологии или экономике. Довольно интересные науки для продуктолога.

Это навело на мысль — что же такое хорошее исследование в этих областях? Я взял пару академических книжек по исследованиям, которые рекомендуют в интернетах для ученых. Буду читать и выписывать интересные вещи. А пока, давайте познакомимся с основными понятиями.

Исследовательская проблема и вопрос

Собственно, зачем вообще нужно проводить исследование. Понимая природу вопроса, специалист выберет лучший способ ответить на него. Примеры:

В чем ценность продукта для нашего клиента? *Что из себя представляет этот феномен?*

Почему пользователи возвращаются в наш продукт? *Что влияет на наблюдаемый феномен?* 1. Какая фича “цепляет” пользователи? *Какой фактор влияет сильнее?*

Как повлияет новая фича? *Что будет, если добавить других факторов?*

Теория

В любом исследовании пытаются подтвердить или расширить существующую теорию, или создать новую.

Теория имеет свою терминологию, систему и законы. Также она объясняет и предсказывает события.

По моему опыту, в продуктовой разработке напрямую не говорят о “теориях”, но часто подразумевают их. Но если абстрагироваться, то созданные в компании персоны или джобы будут примером локальной продуктовой теории.

В работе мы иногда ссылаемся на известные теории. Мы про них слышали или интуитивно понимаем. Например, ребята играющие с публикой “выгодными предложениями” явно вдохновляются теорией перспектив.

Подходы и методологии

Поняв вопрос, выбираем подход к исследованию:

Качественный (qualitative)
Количественный (quantitative)
Смешанный (mixed-methods)

Несмотря на названия, исследования не бывают абсолютно качественные или количественные. Они склонны быть скорее качественные, чем количественные и наоборот. Смешанные подходы балансируют посередине. — Несмотря на названия, исследования не бывают абсолютно качественные или количественные. Они *склонны* быть скорее качественные, чем количественные и наоборот. Смешанные подходы балансируют посередине.

Исследователь выбирает подход в зависимости от задачи и ресурсов. Он включает в себя:

ограничения и аксиомы
поэтапный процесс сбора и анализа данных
набор методов

Методы

Это конкретные инструменты, которые исследователь использует в работе: глубинное интервью, опрос, анализ логов и т.д. Не буду сейчас подробно на этом останавливаться. Про них часто пишут и говорят. Обычно для решения практических задач, мы сразу спешим выбрать метод, чтобы ответить на вопрос. В одной из следующих статей разберем место методов в конкретных подходах.

Кратко

Все вышеперечисленное используется учеными, чтобы провести исследование и попытаться сделать прорыв в науке.

В продуктовой разработке я чаще всего сталкиваюсь с проблемой и выбором метода. Это работает для операционных и мелких тактических вопросов. Когда мы задумываемся о стратегических инициативах, то требования к исследованию повышаются. Мы должны осветить все нюансы выводов и сто раз все перепроверить. Заказчикам и исследователям нужна методология, которая будет прозрачна и понятна.

Результатами верхнеуровнего исследования будет пользоваться несколько стейкхолдеров. Выводы должны логично ложиться на знания, которые есть у отделов и команд. Это мне напоминает свойство хорошей теории, которая должна все объяснять.

Исследования, приоритеты и метрики в Atlassian

Проблема на уровне бизнеса

Метрики

NPS — это интегральная метрика, на которую влияют многие аспекты бизнеса, а не только удобство продукта.
В зрелой компании сложно двигать верхнеуровневые метрики. Практически невозможно заметить улучшение после короткой итерации.

NB! Не переиспользуйте эту формулу у себя. Установите свой процесс замера этих метрик и на своей аудитории найдите формулу зависимости.

Приоритизация инициатив

Reliability — требования к надежности.
Usability — требования к удобству использования.
Functionality — функциональные требования.

Каждая тема содержит иерархию из категорий и отдельных фичей.

Продуктовая команда Atlassian получает около 2000 комментариев в месяц. Для тэгирования (кодинга) такого объема информации ребята взяли к себе несколько стажеров. Разметка идет в общем Google Spreadsheet. Каждый комментарий может быть включен в 3 категории и обязательно назначается на ответственную команду.

Инструмент мониторинга: UX ScoreCard

Поэтому в Atlassian используют два дашборда:

Early Signal Testing Scorecard (ESTS) — для дизайн-команды выносят метрики, которые помогают принимать решения на этапе разработки. Для этого они создали собственный мини-фреймворк — Early Signal Testing (никаких откровений особо по ссылке нет, но можно пощелкать презентацию).
Instrumented Scorecard — для продуктовой команды, когда фича уже в проде. Сюда выносят метрики, которые составлены по Google HEART и UMUX-Lite (это, видимо, замеряет Happiness).

Находим эффект от продуктовых изменений в UMUX-Lite

Вывод

Проблема медленной реакции NPS на изменения была решена созданием отдельной метрики для продуктовых команд.

Более подробнее про метрику и методологию можно прочитать здесь: Measuring Usability: From the SUS to the UMUX-Lite.

Источники

Актуальные материалы по продуктовой аналитике и исследованиям лежат в моем телеграм-канале Product Science.

Открыть Product Science в Telegram

Just Noticeable Difference

Слышали про “магические” 20%, на которые надо ориентироваться, чтобы улучшать продукт? Подробности читайте в этой статье.

Недавно узнал про “магические” 20%, на которые надо ориентироваться, чтобы улучшать продукт. Быстрый поиск через Google не дал конкретики, а запрос “JND 20%” только один раз встретился на SlideShare, где также не было ссылки на первоисточник.

Я заинтересовался вопросом и копнул интернет поглубже. Уж больно хотелось найти обоснование, которое затем можно использовать в работе.

Русская Википедия переводит это понятие как “порог различения”. В интернете хорошо ищется по сокращению JND и альтернативному названию — difference threshold.

И так, приступим…

Что это?

Термином just noticeable difference (JND) обозначают количество воздействия, которое нужно применить, чтобы человек смог заметить разницу между двумя сигналами как минимум в половине случаев.

>
“The Difference Threshold (or “Just Noticeable Difference”) is the minimum amount by which stimulus intensity must be changed in order to produce a noticeable variation in sensory experience.”

— Frank Schieber, Professor and Human Factors Researcher at University of South Dakota

В паре с этим понятием идет absolute threshold — количество воздействия, которое необходимо применить, чтобы заметить сигнал на минимуме. Под сигналами подразумеваются пять основных чувств человека: осязание, зрение, вкус, обоняние и слух.

Например, абсолютный трешхолд для звука будет минимальное значение громкости на магнитоле, которое человек может обнаружить.

>
“JND — минимальное изменение громкости, которое человек сможет ощутить между уровнями громкости.”

Кто придумал и как исследовали?

Изначальная теория

Эрнст Генрих Вебер — немецкий психофизиолог. В 1834 году он обнаружил, что воспринимается не абсолютный, а относительный прирост силы раздражителя.

В XIX веке много экспериментировал с чувствами и в итоге пришел к математически выраженному закону.

Для каждого из чувств были найдены константные доли, на которые необходимо изменить значение сигнала, чтобы оно было заметным. Также затем нашли и много ограничений для этого закона.

Применимость в бизесе: оффлайн

Вебер доказал применимость своей теории для физический ощущений. В середине XX века группа ученых решила исследовать применимость этого же принципа для психологических воздействий. Исследователи экспериментировали с:

размером вознаграждения в зависимости от квалификации работника
размером скидки для покупателей в магазинах
ценообразованием на новую и старую модель одного и того же автомобиля

Они пришли к такому выводу:

>
“20% — это порог различения в вопросе ценообразования и качества”

Важно понимать, что эти результаты основаны на результатах наблюдения и интервью, поэтому они основаны на субъективных ощущениях наблюдателей и респондентов. Исследователи минимизировали погрешности и вывели среднее значение, но это не означает, что оно работает для всех и всегда.

Применимость в бизнесе: онлайн

С конца 90-х и в начале 00-х разродилась целая гора книг и исследований о применимости этих знаний в маркетинге, в т.ч. онлайн. Самая популярная книга, которая упоминается чуть ли не везде — Consumer Behaviour за авторством Leon G. Schiffman и Joseph Wisenblit. В ней рассказывают про маркетинговые трюки с вниманием и ценообразованием. Все это приправлено ссылками на исследования и солидным опытом авторов.

В 2014 году вышла статья, где JND рассматривается в разрезе применимости к социальным группам: Rethinking the Concept of Just Noticeable Difference in Online Marketing. Автор сделал симулятор, где сравнивал “разреженные” и “плотные” соц.группы. Можно провести аналогию — рабочий коллектив из 3–5 человек = “разреженная” группа. Фейсбук с 1000 друзей — “плотная”.

В “разреженных” группах изменение, которое не пересекло средний порог различения вероятнее всего останется незаметным. Знание не распространится внутри группы. В “плотных” группах, если кто-то один заметит, то все остальные рано или поздно об этом узнают, как бы это не скрывали хитрые маркетологи.

Если вы работаете с изменениями, которые пересекают средний JND (допустим вы сделали анонс чего-то нового), то меняется только скорость распространения информации. Но даже значительные изменения могут остаться незамечиными в маленькой соц.группе.

Как использовать при разработке продукта и бизнесе?

Позитивные изменения

Делаете рефакторинг и оптимизируете скорость загрузки приложения? Убедитесь, что ваши пользователи заметят прирост как минимум на 20% и смело пишите об этом в описании обновления.
Сокращаете количество действий для определенного юзкейса на сайте? 9 вместо 10 — плохо. 7–8 вместо 10 — хорошо.
Планируете дать скидку на товар? 20% простимулируют к покупке.

Негативные изменения

Повышаете цену? Делаете это по 5–10%, чтобы не пересечь JND.
Use Case: Как не надо уменьшать размер шоколадки.

Запомнить

20% — это среднее значение для индивидуального восприятия. Верно не всегда и не везде.
Постарайтесь сами “прощупать” JND для своей аудитории (например, A/B тестами)
В соц.сети незначительные изменения рано или поздно заметят все.
Даже крупное событие может быть незаметно в маленьких коллективах.

Актуальные материалы по продуктовой аналитике и исследованиям лежат в моем телеграм-канале Product Science.

Читать Product Science в Telegram