Можно ли проводить A / B-тестирование по страницам, а не по отдельным лицам? - PullRequest
2 голосов
/ 06 апреля 2010

Допустим, у меня есть простой сайт электронной коммерции, который продает 100 различных дизайнов футболок. Я хочу провести некоторые тесты для оптимизации моих продаж. Допустим, я хочу протестировать две разные кнопки «купить». Как правило, я бы использовал тестирование AB для случайного назначения каждого посетителя, чтобы увидеть кнопку A или кнопку B (и пытался убедиться, что пользовательский опыт соответствует, сохраняя это назначение в сеансе, куки и т. Д.).

Можно ли использовать другой подход и вместо этого случайным образом назначить каждому из моих 100 дизайнов использование кнопки A или B и измерить коэффициент конверсии как (количество продаж дизайна n) / (просмотров страниц дизайн н)

Казалось бы, у этого подхода есть некоторые преимущества; Мне не нужно было бы беспокоиться о том, чтобы поддерживать согласованность пользовательского интерфейса - данная страница (например, www.example.com/viewdesign?id=6) всегда будет возвращать один и тот же HTML-код. Если бы я тестировал разные цены, пользователю было бы гораздо менее неприятно видеть разные цены для разных дизайнов, чем разные цены для одного и того же дизайна на разных компьютерах. Мне также интересно, может ли это быть лучше для SEO - я подозреваю, что Google «предпочел бы», чтобы он всегда видел один и тот же HTML при сканировании страницы.

Очевидно, что этот подход подходит только для ограниченного числа сайтов; Мне просто интересно, кто-нибудь пробовал?

Ответы [ 4 ]

1 голос
/ 06 апреля 2010

Ваша интуиция верна. В теории рандомизация по странице будет работать нормально. Обе группы лечения будут иметь сбалансированные характеристики в ожидании.

Тем не менее, размер выборки довольно мал, поэтому вы должны быть осторожны. Простая рандомизация может создать дисбаланс случайно. Стандартным решением является блок по характеристикам предварительной обработки рубашек. Наиболее важной характеристикой является ваш результат до лечения, который, как я полагаю, является коэффициентом конверсии.

Существует множество способов создания «сбалансированных» рандомизированных дизайнов. Например, вы можете создавать пары, используя оптимальное соответствие , и рандомизировать внутри пар. Более грубое совпадение может быть найдено путем ранжирования страниц по их коэффициенту конверсии за предыдущую неделю / месяц и последующего создания пар соседей. Или вы можете объединить блокированную рандомизацию с предложением Аарона: рандомизировать в парах, а затем переворачивать лечение каждую неделю.

Второй проблемой, несколько не связанной, является взаимодействие между обработками . Это может быть более проблематичным. Возможно, что если пользователь увидит одну кнопку на одной странице, а затем другую кнопку на другой странице, эта новая кнопка будет иметь особенно большой эффект. То есть вы действительно можете рассматривать лечение как независимое? Влияет ли кнопка на одной странице на вероятность перехода на другую? К сожалению, это возможно, особенно потому, что если вы покупаете футболку на одной странице, вы, скорее всего, вряд ли купите футболку на другой странице. Я бы беспокоился об этом больше, чем рандомизация. Стандартный подход - рандомизация уникальным пользователем - лучше имитирует ваш окончательный дизайн.

Вы всегда можете запустить эксперимент, чтобы увидеть, получаете ли вы те же результаты, используя эти два метода, а затем перейти к более простому, если вы это сделаете.

0 голосов
/ 06 апреля 2010

Проблема вашего подхода в том, что вы тестируете две вещи одновременно.

Скажем, дизайн x использует кнопку a. Дизайн у использует кнопку б. Design y получает больше продаж и больше конверсий.

Это потому, что кнопка b дает лучший коэффициент конверсии, чем кнопка a, или это потому, что дизайн y дает лучший коэффициент конверсии, чем дизайн x?

Если ваш объем дизайна очень высок, объем пользователей очень низок, и ваши конверсии распределены равномерно между вашими проектами, я мог бы видеть, что ваш подход лучше обычного - потому что есть риск, что «хорошо» дизайн объединяет и искажает ваш результат будет меньше, чем риск, который делают «хорошие» пользователи. Однако в этом случае у вас не будет особенно большого размера выборки конверсий, из которой можно сделать выводы - вам нужно достаточно большое количество пользователей, чтобы тестирование АБ стояло в первую очередь.

0 голосов
/ 06 апреля 2010

Вместо изменения кнопки продажи для некоторых страниц, запустите все страницы с кнопкой A на неделю, а затем перейдите к кнопке B на другую неделю. Это должно дать вам достаточно данных, чтобы увидеть, существенно ли меняется количество продаж между двумя кнопками.

Неделя должна быть достаточно короткой, чтобы сезонный / погодный эффект не действовал.

0 голосов
/ 06 апреля 2010

Вы не можете.

Пусть у 50 футболок есть кнопка A, а у остальных 50 - кнопка B. После теста вы поймете, что футболки с кнопкой A имеют лучший коэффициент конверсии.

Теперь - было ли преобразование лучше из-за кнопки А, или это было лучше, потому что дизайны футболок были действительно классными, и людям они нравились?

Вы не можете ответить на этот вопрос объективно, поэтому вы не можете проводить A / B-тестирование таким образом.

...