మెషీన్ ల్యార్నింగ్ - నార్మల్ డాటా వితరణ

正态数据分布(Normal Data Distribution)

在上一章中,我们学习了如何创建给定大小且在两个给定值之间的完全随机数组。

在本章中,我们将学习如何创建一个将值集中在给定值周围的数组。

在概率论中,在数学家卡尔·弗里德里希·高斯(Carl Friedrich Gauss)提出了这种数据分布的公式之后,这种数据分布被称为正态数据分布或高斯数据分布。

实例

典型的正态数据分布:

import numpy
import matplotlib.pyplot as plt
x = numpy.random.normal(5.0, 1.0, 100000)
plt.hist(x, 100)
plt.show()

结果:


运行实例

注释:由于正态分布图具有钟形的特征形状,因此也称为钟形曲线。

直方图解释

我们使用 numpy.random.normal() 方法创建的数组(具有 100000 个值)绘制具有 100 栏的直方图。

మేము సగటును 5.0 మరియు ప్రాధామిక వ్యత్యాసాన్ని 1.0 అని నిర్దేశించాము.

ఇది ఈ విలువలు 5.0 మరియు సగటు నుండి తక్కువగా ఉండాలని అర్థం చేస్తుంది 1.0 వంటి సాధారణ వ్యత్యాసం లేదు.

హిస్టోగ్రామ్ నుండి కనిపిస్తుంది, అత్యంత మూడు విలువలు 4.0 మరియు 6.0 మధ్య ఉన్నాయి, అత్యంత పెద్ద విలువ రాబోయే 5.0 వంటిది.