- API介绍
- API接口
- 定价
直方图计算器
一个直方图计算器应该能够非常响亮地回答"如何制作直方图?"这个问题,至少要说"很容易"。但一个真正令人惊叹的直方图制作器应该更进一步,还要回答"什么是直方图?"、"直方图与条形图的区别是什么?"等问题,同时让您保持兴趣,并教您关于直方图在经典概率中的应用以及左偏/右偏直方图的复杂性。
那么,这是一个真正令人惊叹的直方图计算器吗?这由您来判断。
如何使用直方图计算器制作直方图
如果您来到这里,很可能您只是想制作一个直方图,并且您已经知道什么是直方图以及它是如何定义的(如果您不知道,请先查看我们更简单的点图计算器)。所以,让我们不要浪费您宝贵的时间,直接开始吧。
直方图计算器由两个部分组成:
- 数据部分
- 直方图或条形图本身
- 从字段名称#1开始,用您的数据点之一填充每个字段
- 新字段将根据需要出现,直方图会随着每个新数据点的添加而更新
图表中每个区间的比例和限制会根据您的输入自动调整,始终保持十个区间并使所有数据点可见。如果您希望控制条形图的外观,可以通过选择下面的"调整图表参数"复选框来实现。
直方图计算公式
其中区间宽度决定了每个柱子的宽度范围,频率表示每个区间内数据点的数量,相对频率表示该区间占总数据的比例。
使用直方图制作器的快速直方图示例
为了避免用太多数据点使这个直方图示例过于复杂,让我们在直方图制作展示中只使用6个点。假设我的数据点反映了重复6次掷骰子的结果。结果是:1,4,3,6,4,4。
创建示例直方图的分步过程:
1. 转到直方图计算器,在标记为#1的字段中输入数字1。
2. 在标记为#2的字段中输入数字4。将出现一个标记为#3的新字段。
3. 继续输入您的数据点,直到到达#6,这应该对应我们最后的4。
4. 您应该看到一个直方图。我们可以编辑它使其看起来更好。
5. 选择条形图下方的"调整图表参数"。
6. 对于这个直方图示例,我们建议使用:显示的最小值 = 1,显示的最大值 = 7,区间宽度 = 1,这应该导致区间数 = 6。
7. 现在您应该得到一个类似于上面显示的直方图。
8. 现在继续输入您自己的数据,看看您能让它看起来多酷!
在这个例子中,我们绘制了几个概率测试(掷骰子)的结果。如果我们有大量的测试(准确地说是无限的),结果将重现概率分布。这对于分析模式和做出预测非常有用,正如我们稍后将看到的。
什么是直方图?直方图定义和示例
直方图是一种通过事件发生的频率而不是发生的时刻来表示数据的方法。您可以看到频率分布计算器将数据表示为直方图,例如。
直方图的特征:
在直方图中,图表中每个柱子的高度表示这种事件发生的次数,而x轴告诉我们该事件是什么。最常见的是,x轴由数字(或一些可以排序的质量)表示。
使直方图成为直方图的最重要的事情之一是x值不是连续的(即使它们在数据中可能是连续的),而是通过将它们分组到表示特定x值范围的区间中来离散化的。
直方图与条形图的区别:
如果我们想比较直方图与条形图,我们需要将直方图视为所有可能条形图的一个小子集。这样的子集是所有条形图的汇编,其中我们在y轴上绘制了特定范围/类别中的事件数量,将x轴留给组织所述范围。
然而,在条形图中,每个柱子的高度可以表示任何数量,x轴可以是我们想要的任何字段,不一定是范围或类别。直方图与条形图之间的混淆通常来自于它们看起来非常相似(毕竟它们都是条形图),并且它们都用于表示非连续数据。
左偏/右偏直方图和统计分布
因此,解释什么是左偏直方图和右偏直方图是公平的。顾名思义,这些是数据严重偏向图表左边缘或右边缘的直方图。这可能有很多原因,让我们来看看它们。
第一个原因是随机性,或者没有"足够"的数据来表示变量之间的真实关系。例如,想象一下,我们之前直方图示例中的骰子结果是:5, 2, 6, 6, 5, 和 6,这并不是完全不合理的。在这种情况下,我们会有一个右偏直方图,因为最高的柱子会在图表的那一边。
偏斜的第二个原因是实际的概率分布确实向右或向左偏斜。典型的分布,如正态分布或泊松分布,往往围绕其最频繁的值对称。然而,有一些分布,如玻尔兹曼分布(在物理学中用于描述黑体的温度),偏向一边或另一边,创建左偏直方图或右偏直方图。
另一个潜在原因是用户错误、实验设计错误或所执行实验的其他类似限制。例如,泊松分布只有在均值两边的值同样被允许时才是对称的。这就是为什么当您将这样的分布集中在接近零的地方而不允许负值时,您最终会得到一个左偏直方图。
要点总结
💡 如果您只能记住一件事
那么,如果有的话,您应该从所有这些您(希望)已经阅读的文本中带走什么?如果您只能记住一件事,那应该是对什么是直方图的良好理解。直方图是在条形图中显示的数据点集合,表示事件的范围(或类别)和该范围内的频率(或事件总数)。
🎯 直方图的应用价值
但是,如果您能稍作努力并学习其他东西,即使您不能完美地记住它,那应该是什么使直方图具有它所具有的形状。那就是所测量事件的潜在统计分布,无论是二项分布、指数分布还是其他一些非对称形状。最终,我们希望这个计算器能帮助您理解、使用和制作直方图。这个世界充满了直方图、条形图和各种统计数据,能够理解和分析它们将在您的日常生活中帮助您,即使只是为了提高您成功的几率!
| 参数名 | 参数类型 | 默认值 | 是否必传 | 描述 |
|---|---|---|---|---|
| binCount | integer | 10 | 否 | 直方图的区间(bins)数量,用于将数据分组 |
| minValue | number | 否 | 直方图显示的最小值,如果不指定则自动计算 | |
| maxValue | number | 否 | 直方图显示的最大值,如果不指定则自动计算 | |
| dataPoints | array | [1,4,3,6,4,4] | 否 | 用于生成直方图的数值数据点列表,最多支持50个数据点 |
| 参数名 | 参数类型 | 默认值 | 描述 |
|---|---|---|---|
| bins | array | 直方图各区间的详细信息 | |
| chartParameters+chartMaxValue | number | 图表显示的最大值 | |
| chartParameters+chartMinValue | number | 图表显示的最小值 | |
| chartParameters+actualBinWidth | number | 最终使用的区间宽度 | |
| chartParameters+actualBinCount | integer | 最终使用的区间数量 | |
| statistics+minValue | number | 数据中的最小值 | |
| statistics+median | number | 数据的中位数 | |
| statistics+mean | number | 所有数据点的算术平均值 | |
| statistics+maxValue | number | 数据中的最大值 | |
| statistics+skewness | string | 数据分布的偏斜方向 | |
| statistics+totalCount | integer | 输入数据点的总数量 | |
| statistics+standardDeviation | number | 数据的标准差 |
| 错误码 | 错误信息 | 描述 |
|---|---|---|
| FP00000 | 成功 | |
| FP03333 | 失败 |
参考上方对接示例
