📚机器学习数学笔记📈
今天来聊聊数据分布中的两个重要概念——偏度 (Skewness) 和 峰度 (Kurtosis) 📊。它们能帮助我们更好地理解数据的对称性和分布形态。💡
偏度 衡量数据分布是否对称。正偏度意味着长尾在右侧(右偏),负偏度则相反(左偏)。公式为:
\[
Skewness = \frac{n}{(n-1)(n-2)} \sum \left(\frac{x_i - \bar{x}}{s}\right)^3
\]
其中 \( n \) 是样本数量,\( \bar{x} \) 为均值,\( s \) 为标准差。
峰度 描述数据分布的陡峭程度,与正态分布相比,高斯分布的峰度为 3。公式如下:
\[
Kurtosis = \frac{n(n+1)}{(n-1)(n-2)(n-3)} \sum \left(\frac{x_i - \bar{x}}{s}\right)^4 - \frac{3(n-1)^2}{(n-2)(n-3)}
\]
想快速计算?用 Python 的 `scipy.stats` 库即可!
```python
from scipy.stats import skew, kurtosis
data = [1, 2, 2, 3, 4, 5]
print("Skewness:", skew(data))
print("Kurtosis:", kurtosis(data))
```
掌握这些工具,数据分析更得心应手!💪
免责声明:本答案或内容为用户上传,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。 如遇侵权请及时联系本站删除。