大橙子网站建设,新征程启航
为企业提供网站建设、域名注册、服务器等服务
首先,普及一下pandas与numpy的区别:
创新互联专注为客户提供全方位的互联网综合服务,包含不限于成都网站设计、网站建设、外贸网站建设、仁化网络推广、成都微信小程序、仁化网络营销、仁化企业策划、仁化品牌公关、搜索引擎seo、人物专访、企业宣传片、企业代运营等,从售前售中售后,我们都将竭诚为您服务,您的肯定,是我们最大的嘉奖;创新互联为所有大学生创业者提供仁化建站搭建服务,24小时服务热线:18982081108,官方网址:www.cdcxhl.com
pandas操作的数据集是Series,本质上是列表与字典的混合,常用的数据形式为DataFrame;
numpy操作的数据集是数组或矩阵。
1、对数组求均值、方差、标准差
2、对矩阵求标准差
注意:在求标准差时需要注意几个问题:
1、在统计学中,标准差分为两种:
(1)总体标准差:标准差公式根号内除以n,是有偏的。
(2)样本标准差:标准差公式根号内除以n-1,是无偏的。
2、pandas与numpy在计算标准差时的区别
(1)numpy
在numpy中计算标准差时,括号内要指定ddof的值,ddof表示自由度,当ddof=0时计算的是总体标准差;当ddof=1时计算的是样本标准差,当不为ddof设置值时,其默认为总体标准差。
(2)pandas
在使用pandas计算标准差时,其与numpy的默认情况是相反的,在默认情况下,pandas计算的标准差为样本标准差。
import numpy as np
#可以直接用std函数
a = np.arange(10)
#array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
np.std(a)
#2.8722813232690143
#或者按标准差公式写
a = np.arange(10)
#array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
mid = 0
for i in mid:
mid = mid + (i - np.mean(a)) ** 2
np.sqrt(mid/a.size)
#2.8722813232690143
std()函数就是初高中学的标准差 numpy.std()
求标准差的时候默认是除以 n 的,即是有偏的,np.std无偏样本标准差方式为加入参数 ddof = 1
def fangcha(): a=float(raw_input("请输入a:")) b=float(raw_input("请输入b:")) c=float(raw_input("请输入C:")) d=(a+b+c)/3.0 e=((a-d)**2+(b-d)**2+(c-d)**2)/3.0 print "平均数是:%f方差是:%f" %(d,e) fangcha() Python2.7可用