A/B 测试计算器:样本大小 (Sample Size)

计算统计研究和实验所需的样本量,同时考虑显著性水平和置信区间。

灰色区域的转化率将无法与基线区分。

如果存在最小效应,检测到该效应的概率

如果不存在差异,检测到差异的概率

样本量

1,030

每个变体

保存结果

https://devbox.tools/zh/utils/sample-size-calculator/#!rate=20&power=80&alpha=5&effect=5&type=absolute

"样本量计算器" 工具功能

确定最少观察次数

可以计算需要多少数据才能获得具有统计学意义的结果。

考虑置信区间和显著性水平

有助于减少实验和营销测试中出现错误的几率。

适用于 A/B 测试

通过消除用于分析的冗余资源简化数据收集流程。

A/B 测试计算器:样本大小 (Sample Size)

alien

样本量计算器可帮助您确定需要多少观测值才能获得具有统计学意义的结果。这对于规划实验、研究和营销测试非常重要。

样本应该足够大,结果才会可靠,但也不能过大,以免浪费不必要的资源。我们的工具会考虑数据的置信度、误差幅度和预期变异性。

该工具适用于分析师、研究人员、营销人员以及任何处理统计数据并希望优化研究设计的人员。

常见问题 (FAQ)

样本量取决于所需的置信水平、允许误差、总体大小和预期效应大小 (MDE)。效应越大所需的样本量越小,而效应越小则需要更大的样本量才能检测到。

置信水平(通常为 95%)表示您对结果的信心程度。允许误差是您的估计周围的不确定性范围。更高的置信水平或更小的允许误差需要更大的样本量。

采用保守方法 - 将两组以 50/50 的比例均分。

如果总体有限,请使用有限总体校正并尝试最大化覆盖范围。对于非常小的样本,请使用非参数分析方法并考虑降低统计功效。

如果选择的 MDE 过小,将需要巨大的样本量,这可能不切实际。如果选择的 MDE 过大,则可能会错过微小但重要的效应。最佳 MDE 应反映效应的业务或研究价值。

统计功效是检测到真实效应(如果存在)并避免第二类错误(假阴性)的概率。更高的功效(通常为 80% 或更高)需要更大的样本量,以确保您不会错过重要结果。

总体数据中的变异性(标准差)越大,为了达到相同的精度,所需的样本量就越大。这是因为更大的变异性使得获得总体平均值的准确估计更加困难。

对于比较研究,您需要一个样本量计算器,它考虑最小可检测效应(您认为重要的最小差异)和统计功效,以确保您的实验能够检测到这种差异。

评价此工具
4.5(25 用户评价)