A/B 测试的定义
为何要以及何时开展 A/B 测试？
网站 A/B 测试的优势
如何执行 A/B 测试？
A/B 测试示例
分析在网站 A/B 测试中的作用
如何解释 A/B 测试结果？
在 A/B 测试中，应当注意哪些指标？
什么是多变量测试？与 A/B 测试有何不同？
在 iOS 和 Android 应用上运行 A/B 测试和多变量测试
多变量测试中的访客细分和细分聚类
使用 A/B 测试还是多变量测试？这是一个问题。

什么是 A/B 测试，如何做好A/B测试

通过常规 A/B 测试，您可以获得丰富的建议来调优营销绩效。而得益于几乎无限的可测试选项，您可以开展持续 A/B 测试。

A/B 测试的定义

A/B 测试（也被称为对比测试和分桶测试）旨在用于对比两个版本的内容的效果，识别哪一个版本对于访客/查看者更具吸引力。它将测试对照 (A) 版本与变量 (B) 版本，基于您的关键指标来衡量哪一个版本更成功。如果您是一名数字营销专业人员，无论是开展 B2B 营销还是 B2C 营销，您可以进行以下 A/B 测试：

网站 A/B 测试（文本、图像、配色、行动号召），即将流量平均分配给两个版本（A 和 B）的网站。您可以监视访客行为，识别哪一个版本的网站带来了更多的转化量，或促使访客执行了您预期的操作。
电子邮件营销 A/B 测试（主题行、图像、行动号召），即将收件人平均拆分为两个细分，确定哪一个版本的打开率更高。
对比测试编辑选择的内容或算法（基于用户行为）选择的内容，识别哪一种内容能带来更高水平的互动。

无论哪一种，A/B 测试都将助您确定如何提供理想的客户体验 (CX)。

除了 A/B 测试，您还可以执行 A/B/N 测试，其中“N”表示“未知”。A/B/N 测试指对两种以上的变体进行测试。

为何要以及何时开展 A/B 测试？

如果您持续进行 A/B 测试，它将为您提供最大助力。通过常规 A/B 测试，您可以获得丰富的建议来调优营销绩效。而得益于几乎无限的可测试选项，您可以开展持续 A/B 测试。

如上所述，A/B 测试可评估任何数字营销资产，包括：

电子邮件
时事通讯
广告
文本消息
网页
Web 页面上的组件
移动应用

A/B 测试有助于识别有效因素和无效因素，对于营销活动管理具有重要意义。它可以揭示您的受众对哪些内容感兴趣，会响应哪些内容，帮助您了解您营销策略中的哪些要素的影响力最大，哪些要素需要改进，以及哪些要素需要被完全删除。

以上我们介绍了为何要执行 A/B 测试，以下是选择何时执行 A/B 测试的两个标准。

您的数字营销活动或要素未取得最佳效果，无法满足您的期望。A/B 测试可揭示营销绩效问题，促进营销绩效提升。
您即将投放新的营销活动（网页、电子邮件营销等等），但不确定哪种方式（例如消息传递）可取得最佳效果。通过提前执行 A/B 测试，您可以比较和对比两种不同营销方法的绩效，识别哪一种方法更好。

网站 A/B 测试的优势

网站 A/B 测试可量化展示哪种营销策略对网站访客最有效，助您轻松验证一项直觉是正确还是错误。除此之外，您还可以排除无效选项，吸引更多访客在您的网站上花费更多时间，点击更多链接。

此外，通过对比测试常见/常用的网站组件/部分，您不仅可以改进测试页面，还可以推而广之，优化更多类似页面。

如何执行 A/B 测试？

A/B 测试并不复杂，但需要遵循明确定义的流程。以下是 A/B 测试的九个基本步骤：

规划和执行 A/B 测试的基本步骤

1. 衡量并审查绩效基准
2. 使用绩效基准确定测试目标
3. 提出测试将如何提高营销绩效的假设
4. 确定测试对象或位置
5. 创建待测试的 A 版本和 B 版本
6. 利用 QA 工具验证测试设置
7. 执行测试
8. 使用 Web 和测试分析来跟踪和评估测试结果
9. 基于测试结果来改善客户体验

如果您有明确的测试目标和可靠的假设并遵循上述步骤，您就可以避免常见的 A/B 测试错误。

A/B 测试将提供数据和实验证据来助您提高营销绩效。基于 A/B 测试洞察，您将获得更大的营销影响力，将能够设计更具吸引力的客户体验 (CX)，编写更引人入胜的文本，创建更绚丽的可视化效果。在持续优化的过程中，您的营销策略将变得更加有效，将带来更高的投资回报率和更多收入。

A/B 测试示例

您可以对一下一个或多个数字营销要素开展测试：

导航链接
行动号召 (CTA)
设计/布局
文本
内容
标题
电子邮件主题行
友好的电子邮件“发件人”地址
图像
社交媒体按钮（或其他按钮）
徽标和标记线/标语

您需要根据业务目标、绩效目标和基准以及当前的营销活动组合，决定对那些项目开展测试。

分析在网站 A/B 测试中的作用

在所有 A/B 测试的整个生命周期中，分析都是规划、执行和捕获绩效建议的关键。

首先，提出测试假设就离不开强大的分析能力，例如您需要理解当前的营销绩效和流量水平。在 Web 分析中，分析系统将在规划过程中为您提供丰富的关键数据点，包括：

待评估的页面、组件或其他元素的流量（页面访问量、独立访客数量量）
互动水平（时长、每次访问的页面数量、跳出率）
转化情况（点击、注册、退出）
一定时期内的绩效趋势

如果没有可靠的分析做基础，测试场景或绩效评估就可能受到个人主观偏好和印象的影响，这样的假设经测试证明也通常是错误的。

其次，A/B 测试启动后，分析也将发挥重要作用。您可以使用仪表盘来实时监视绩效指标；验证测试是否按预期运行；及时响应所有异常或意外结果，包括停止测试、进行调整和重新启动；确保所有变更及变更时间都在绩效数据中得到反映。总而言之，绩效仪表盘可助您确定测试的持续时间，取得富有统计学意义的结果。

最后，测试结束后，分析将助您捕获后续行动建议。例如是否将测试的获胜者作为被测试网站页面的标准展示，以及是否将其作为长期标准。营销人员应开发可重用的分析模板以更好地洞悉测试结果，并在必要时调整模板，反映特定测试中的特定元素。

如何解释 A/B 测试结果？

在规划 A/B 测试时，设立测试目标非常重要，这有助于您评估测试结果、识别测试获胜者并相应更新营销活动和/或网站。为此，很多情况下，一名受众会被预细分为留出组，接收测试获胜版本的消息。

测试结果将基于您选择的衡量指标，揭示一项元素相比另一项元素的效果。衡量指标一般包括：

访客数量
打开率
点击通过率
注册数量（针对时事通讯等等）
订阅量

A/B 测试期间，您需要持续监视两个元素，直到获得有统计学意义的结果。

您也可以基于收入数据来衡量转化率，考察销售数量以及变更对实际销售收入的影响。请记住，您可以捕获任何可衡量操作的转化率，不仅仅是电子商务站点和销售。这包括：

销售
生成的销售线索/提交的注册
时事通讯注册
横幅广告点击量
访客在站点上花费的时间

在 A/B 测试中，应当注意哪些指标？

这取决于您的测试假设和目标。通常情况下，您应当重点关注可指示受众与营销内容之间互动水平的指标。

对于网页测试，请关注独立访客数量、回头访客数量以及访客在页面上的停留时间、跳出率和退出率。对于电子邮件营销测试，请关注哪些人打开了电子邮件以及 CTA 的点击通过率。

什么是多变量测试？与 A/B 测试有何不同？

多变量测试通常与 A/B 测试并存，了解多变量测试是什么及其与 A/B 测试有何不同非常重要。简而言之，这二者相关，但也存在一些明显差异。

多变量测试可跨一个或多个网页或电子邮件营销活动测试多个元素（A/B 测试只能测试一个元素），识别可带来最高转化率的最佳组合。

多变量测试使用统计模型来测试可实现整体体验和网站优化的变更组合。以下是多变量测试的一些关键特征：

广泛的元素

多变量测试旨在对网站/电子邮件的一系列变更进行测试，例如图像、文本、颜色、字体、链接和 CTA 按钮等等；对落地页的内容和布局以及结账等流程进行测试。在多变量测试中，被测试组合一般不超过 50 个。

从假设到结果

多变量测试的第一步是提出一个假设，例如某项内容变更将提高转化率。您可以将内容变更拆分为多个单独元素，以便确定可带来最高转化率的最佳组合。无论对用户体验进行细微还是重大调整，都会对整体结果产生影响。

转化率

转化率指访客执行预期操作的比例，例如点击某一元素或将产品添加至购物车。您可以使用更多其他指标来评估测试结果，例如每个订单的收入或点击通过率；可以通过分析，基于转化率或其他自定义指标，了解哪一个变更组合可实现最佳效果。

持续优化

当您定义一个业务目标，通过测试来识别可实现这一目标的最佳访客体验时，您可以使用软件来自动优化访客体验。

在 iOS 和 Android 应用上运行 A/B 测试和多变量测试

2020 年，移动应用端的电子商务支出约为 2.9 万亿美元。到 2021 年底，这一数据预计将再次增长 1 万亿美元，增速超过零售和电子商务行业的平均水平。在许多国家和地区，移动电话比笔记本电脑更加便捷，因此线上总流量中的移动份额增速将持续领先桌面系统。不过，尽管在越来越多的案例中，客户购买旅程的起始点都是 iOS 或 Android 应用，受屏幕尺寸影响，移动设备端的弃购率 (87%) 却高于台式机/笔记本电脑 (73%)。

因此，移动端体验优化比以往任何时候都更加重要。鉴于 iOS 和 Android 应用的限制，您需要合适的工具才能做到这一点。

多变量测试中的访客细分和细分聚类

通过一种体验来满足所有访客/收件人的需求是不切实际的。多变量测试的一项重要优势就是能够识别访客细分，识别不同体验下各个访客细分的行为/互动情况。例如，您可以发现新访客和回头访客分别偏好不同的体验，从而改善整体结果。此外，某些更先进的系统可自动提供访客细分建议，助您更快速地分析数百个访客属性的测试结果。

针对不同的访客细分提供不同的体验可大幅提高转化率。为取得最佳测试效果，您可以基于大量访客属性（从环境属性到行为属性）进行精准定位，并引入其他系统（例如 CRM 系统）的客户属性。

使用 A/B 测试还是多变量测试？这是一个问题。

A/B 测试固然强大，但如果想测试两个以上的选项来识别“最佳体验”，您可能需要执行多变量测试而不是 A/B 测试。

对两个以上的选项执行测试耗时较长，且无法揭示单个页面上多个变量之间的交互情况。相比之下，A/B 测试易于理解，可以很好地打消怀疑论者对网站和营销活动优化的疑虑，揭示设计变更或调优带来的可衡量影响。

多变量测试尤其适用于具有多个待比较元素（例如图像和类别标题的不同组合）的资产（例如网页或电子邮件）。然而，选项越多，对流量的要求也越高。因此，请不要盲目测试页面上的所有内容，因为当过多的页面元素发生变更时，可能会产生海量的组合。例如，对 10 个不同元素运行测试可能会产生超过 3500 万种组合方式，绝大多数网站和电子邮件营销活动都没有足够的流量来开展如此大规模的测试。