#-*-coding:utf-8-*-frompandasimportSeriesimportmatplotlib.pyplotaspltdata=Series.from_csv('minimum.csv',header=0)data.astype(float)print(data.head())data.plot(style='r.')plt.show()也可以只看其中一年的,比方说1990年,如下:
(2)直方图和密度图
(3)箱形图
frompandasimport*importmatplotlib.pyplotaspltdata=Series.from_csv('minimum.csv',header=0)groups=data.groupby(TimeGrouper('A'))years=DataFrame()forname,groupingroups:years[name.year]=group.valuesyears.boxplot()plt.show()这里贴一下图:
顺便介绍一下箱形图,它能显示出一组数据的最大值、最小值、中位数、及上下四分位数,其中最主要的是最大值最小值给的是在上下四分位数的某个区间里面,形成一个盒子加上胡须(因此也叫盒须图),例如上图1981年,最大值是20-25之间,最小值在0-5之间,务必记住是在一个大概率区间里面最大最小,不是实际的最大最小,离开了这个区间会有很多小圆圈和*表示,圆圈表示离群值,*表示极端值。
当然也可以取出其中一年分析一下:
frompandasimport*importmatplotlib.pyplotaspltdata=Series.from_csv('minimum.csv',header=0)data=data['1990']groups=data.groupby(TimeGrouper('M'))months=concat([DataFrame(x[1].values)forxingroups],axis=1)months=DataFrame(months)months.columns=range(1,13)months.boxplot()plt.show()(4)热力图
热力图就更加形象点了,虽然我们不知道数值,但是通过颜色我们能看看极值的分布,颜色越鲜艳,数值越大(红黄),颜色越暗淡,数值越小(蓝绿),当然显示也有可能不一样。
#1988年的例子frompandasimport*importmatplotlib.pyplotaspltdata=Series.from_csv('minimum.csv',header=0)data=data['1988']groups=data.groupby(TimeGrouper('M'))months=concat([DataFrame(x[1].values)forxingroups],axis=1)months=DataFrame(months)months.columns=range(1,13)plt.matshow(months,interpolation=None,aspect='auto')plt.show()(5)滞后图和散点图
frompandasimportSeriesimportmatplotlib.pyplotaspltfrompandas.plottingimportautocorrelation_plotseries=Series.from_csv('minimum.csv',header=0)autocorrelation_plot(series)plt.show()