📚机器学习数学笔记📈
导读 今天来聊聊数据分布中的两个重要概念——偏度 (Skewness) 和 峰度 (Kurtosis) 📊。它们能帮助我们更好地理解数据的对称性和分布形态。
今天来聊聊数据分布中的两个重要概念——偏度 (Skewness) 和 峰度 (Kurtosis) 📊。它们能帮助我们更好地理解数据的对称性和分布形态。💡
偏度 衡量数据分布是否对称。正偏度意味着长尾在右侧(右偏),负偏度则相反(左偏)。公式为:
\[
Skewness = \frac{n}{(n-1)(n-2)} \sum \left(\frac{x_i - \bar{x}}{s}\right)^3
\]
其中 \( n \) 是样本数量,\( \bar{x} \) 为均值,\( s \) 为标准差。
峰度 描述数据分布的陡峭程度,与正态分布相比,高斯分布的峰度为 3。公式如下:
\[
Kurtosis = \frac{n(n+1)}{(n-1)(n-2)(n-3)} \sum \left(\frac{x_i - \bar{x}}{s}\right)^4 - \frac{3(n-1)^2}{(n-2)(n-3)}
\]
想快速计算?用 Python 的 `scipy.stats` 库即可!
```python
from scipy.stats import skew, kurtosis
data = [1, 2, 2, 3, 4, 5]
print("Skewness:", skew(data))
print("Kurtosis:", kurtosis(data))
```
掌握这些工具,数据分析更得心应手!💪
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢。