样本量计算器
通用API
新
【更新时间: 2025.10.24】
此API产品为样本量计算器,帮助用户确定统计显著性的所需样本量,考虑误差范围、置信水平和初始比例估计,适用于各类研究。
|
浏览次数
1
采购人数
0
试用次数
0
收藏
×
完成
取消
×
书签名称
确定
|
- 详情介绍
- API文档
样本量计算器
如果您正在进行研究并想知道需要多少次测量才能具有统计显著性,这个样本量计算器可以帮助您。您只需要在使用之前问自己这三个问题:
- 您的结果应该有多准确?(误差边界)
- 您需要什么置信水平?(置信水平)
- 您的初始估计是什么?(比例估计)
继续阅读以了解如何使用此工具计算样本量,以及样本量计算公式中所有变量的含义。
什么是样本量?
样本量是指从总体中收集的用于研究或调查的观察值或数据点的数量。它是确保研究结果准确性和可靠性的关键因素,这被称为统计显著性。正确选择的样本量有助于反映总体的真实特征,减少抽样误差。
在查看样本量公式和计算之前,有几个有用的统计术语需要注意:
- 总体:您想要研究的整个群体(如您的所有客户或一个城市的居民)。
- 误差边界:衡量您的结果与真实情况可能相差多少的指标。
- 置信水平:您对结果反映真实情况的确信程度(通常为95%)。
- 标准差:告诉您数据分散程度的数字。
- 研究功效:如果真实差异或效应存在,您的研究发现它们的机会。
样本量公式和计算
我们的样本量计算器使用的方程是:
参数说明:
- Z — 与您选择的置信水平相关的z分数。我们的统计显著性计算器会自动计算此值。
- ME — 误差边界:此值告诉您,在给定的置信水平下(例如95%),您可以确信真实值与您获得的值的差异不会超过此误差边界。
- p — 您的初始比例估计:例如,如果您正在学生中进行调查,试图找出他们中有多少人去年读了5本以上的书,您可能知道之前调查的结果——40%。如果您没有这样的估计,请使用保守值50%。
- n₁ — 所需的样本量。
如果您的总体是有限的——例如,您只在一个学院的学生中进行调查——您需要包含以下形式的修正:
有限总体修正参数:
- N — 总体规模。
- n₂ — 从整个总体中抽取的样本量,这将使您的研究具有统计显著性。
如何计算样本量:一个例子
我们将逐步分析一个调查案例,这样您就可以清楚地了解如何使用我们的样本量计算器。您计划进行一项调查,以找出校园内定期在校园食堂吃午餐的学生比例。
计算步骤:
- 决定您希望结果有多准确。假设食堂知道结果是必要的,误差边界最大为2%。
- 决定您的置信水平。我们可以假设您希望99%确信您的结果是正确的。
- 您有初始比例猜测吗?假设您查阅了10年前的类似调查,比例等于30%。您可以将其作为初始估计。
- 学生总数是否高到可以假设它是无限的?可能不是。您需要找到校园内学生数量的当前数据——假设是25,000。
- 现在您需要做的就是将所有这些数据输入我们的样本量计算器。它发现结果具有统计显著性所需的样本量是3,051。您需要问那么多学生同样的问题...您确定不能接受95%的置信水平吗?😀
结果解释: 这个例子展示了如何系统地确定样本量。通过设定明确的准确性要求(2%误差边界)和高置信水平(99%),我们得到了一个相对较大的样本量要求。如果降低置信水平到95%,所需的样本量会显著减少。
影响样本量的因素以及如何选择正确的样本量
以下是一些需要考虑的因素,以确保从您的样本量中获得可靠的结果:
总体规模
对于大总体(超过10,000),在95%置信水平和±5%误差边界下,大约384的样本通常就足够了。对于较小的总体(少于1,000),您需要应用有限总体修正(FPC)来相应调整样本量。
置信水平和误差边界
更高的置信水平或更小的误差边界(例如,±3%而不是±5%)需要更大的样本来实现更高的精度。
研究功效
更高的研究功效需要更大的样本量来减少假阴性的风险。
总体中的变异性
如果总体非常多样化,需要更大的样本来捕获这种变异性。当不确定时,通常使用50%变异性的保守估计来计算样本量。
研究类型
不同的研究需要不同的样本量。探索性调查可能需要较少的参与者,而临床试验或敏感话题的研究需要更大的样本以确保准确性。如果分析子群体(例如,年龄或性别),请确保您的样本量考虑到每个群体。
💡 如何选择好的样本量? 首先定义您的研究目标,然后估计变异性和总体规模。对于大多数研究,100到400的样本量就足够了。为了更高的精度,目标是1,000或更多。超过这个数量,增加样本量的收益递减。同样,这很大程度上取决于您的项目和上面列出的因素。记住,更大的样本并不总是保证更好的结果,所以除非必要,避免过度抽样。
超越样本量计算器的其他有用工具
现在您知道如何计算样本量,您可以进一步使用它来计算研究中感兴趣的其他统计量:
- 抽样误差计算器:样本量是预测抽样误差时最有影响力的特征。使用它来计算您样本的误差。
- 抽样分布的正态概率计算器:使用您的样本量、总体均值和标准差来找出您样本均值落在特定范围内的概率。
- 样本比例的抽样分布计算器:使用您的样本量和总体比例来找出您的样本比例落在特定范围内的概率。
常见问题
什么是可靠的样本量?
可靠的样本量能给出准确的结果并充分代表您的目标总体。对于大多数大总体,300到400之间的样本量通常足以在5%误差边界下达到95%的置信水平。但是,如果您的总体很小或研究的风险很高(如临床试验),您可能需要更大的比例或更精确的计算。
如何计算样本量?
要计算样本量,使用样本量公式:n = (Z² × p × (1 − p)) / e²。其中:n — 样本量;Z — z分数(95%置信度为1.96);p — 估计会以某种方式回答的人的百分比(如果不确定使用0.5);e — 误差边界(例如,5%为0.05)。
什么样本量太小?
在大多数情况下,少于30个样本被认为太小,无法提供统计上可靠的结果。特别是如果您正在处理大总体时更是如此。样本如此之小,您面临高误差边界和对结果低置信度的风险。
样本量如何影响置信区间?
您的样本量越大,您的置信区间就越窄。这意味着您的估计更精确且具有统计显著性。相反,小样本量给您一个宽的置信区间,这为您的结果增加了更多的不确定性。所以,更多的样本通常意味着更可靠的数据。
| 参数名 | 参数类型 | 默认值 | 是否必传 | 描述 |
|---|---|---|---|---|
| confidenceLevel | number | 95 | 否 | 研究结果的可信度,表示结果反映真实情况的概率,通常使用95%或99% |
| populationSize | integer | 否 | 研究目标总体的总数量。如果总体很大(超过10000),可以设置为null表示无限总体 | |
| proportionEstimate | number | 50 | 否 | 预期结果的初始估计比例,以百分比表示。如果没有先验知识,建议使用50%作为保守估计 |
| marginOfError | number | 5 | 否 | 允许的最大误差范围,以百分比表示,如5表示5%的误差边界 |
| 参数名 | 参数类型 | 默认值 | 描述 |
|---|---|---|---|
| effectiveMarginOfError | number | 基于计算样本量的实际误差边界,以百分比表示 | |
| zScore | number | 对应置信水平的标准正态分布临界值 | |
| isFinitePopulation | boolean | 指示是否应用了有限总体修正 | |
| sampleSize | integer | 达到统计显著性所需的最小样本数量 |
| 错误码 | 错误信息 | 描述 |
|---|---|---|
| FP00000 | 成功 | |
| FP03333 | 失败 |
参考上方对接示例