DMER站长博客分析师资源站

DMER数据分析

 找回密码
 立即注册

扫一扫,访问微社区

QQ登录

只需一步,快速开始

查看: 1630|回复: 1

[python] pandas 常用统计方法 Python

[复制链接]

448

主题

559

帖子

1万

积分

版主

Rank: 7Rank: 7Rank: 7

积分
18821
发表于 2016-10-8 01:40:28 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
本帖最后由 tingting 于 2016-10-8 01:41 编辑

统计方法pandas 对象有一些统计方法。它们大部分都属于约简和汇总统计,用于从 Series 中提取单个值,或从 DataFrame 的行或列中提取一个 Series。
比如 DataFrame.mean(axis=0,skipna=True) 方法,当数据集中存在 NA 值时,这些值会被简单跳过,除非整个切片(行或列)全是 NA,如果不想这样,则可以通过 skipna=False 来禁用此功能:

>>> df
    one  two
a  1.40  NaN
b  7.10 -4.5
c   NaN  NaN
d  0.75 -1.3
[4 rows x 2 columns]
>>> df.mean()
one    3.083333
two   -2.900000
dtype: float64
>>> df.mean(axis=1)
a    1.400
b    1.300
c      NaN
d   -0.275
dtype: float64
>>> df.mean(axis=1,skipna=False)
a      NaN
b    1.300
c      NaN
d   -0.275
dtype: float64


其他常用的统计方法有:
########################******************************************
count非 NA 值的数量
describe针对 Series 或 DF 的列计算汇总统计
min , max最小值和最大值
argmin , argmax最小值和最大值的索引位置(整数)
idxmin , idxmax最小值和最大值的索引值
quantile样本分位数(0 到 1)
sum求和
mean均值
median中位数
mad根据均值计算平均绝对离差
var方差
std标准差
skew样本值的偏度(三阶矩)
kurt样本值的峰度(四阶矩)
cumsum样本值的累计和
cummin , cummax样本值的累计最大值和累计最小值
cumprod样本值的累计积
diff计算一阶差分(对时间序列很有用)
pct_change计算百分数变化


http://www.cnblogs.com/chaosimple/p/4153083.html
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|关于我们|小黑屋|手机版|Archiver|帮助|DMER 数据分析 ( 蜀ICP备13007024号-2  

GMT+8, 2018-9-20 19:37 , Processed in 0.336233 second(s), 35 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表