AdventureintheWondersofMachineLearningandBigDataProcessing
matplotlib是python最著名的绘图库,它提供了一整套和matlab相似的命令API,十分适合交互式地行制图。而且也可以方便地将它作为绘图控件,嵌入GUI应用程序中。
它的文档相当完备,并且Gallery页面中有上百幅缩略图,打开之后都有源程序。因此如果你需要绘制某种类型的图,只需要在这个页面中浏览/复制/粘贴一下,基本上都能搞定。
在Linux下比较著名的数据图工具还有gnuplot,这个是免费的,Python有一个包可以调用gnuplot,但是语法比较不习惯,而且画图质量不高。
本文目录
Matplotlib.pyplot快速绘图
matplotlib实际上是一套面向对象的绘图库,它所绘制的图表中的每个绘图元素,例如线条Line2D、文字Text、刻度等在内存中都有一个对象与之对应。
为了方便快速绘图matplotlib通过pyplot模块提供了一套和MATLAB类似的绘图API,将众多绘图对象所构成的复杂结构隐藏在这套API内部。我们只需要调用pyplot模块所提供的函数就可以实现快速绘图以及设置图表的各种细节。pyplot模块虽然用法简单,但不适合在较大的应用程序中使用。
为了将面向对象的绘图库包装成只使用函数的调用接口,pyplot模块的内部保存了当前图表以及当前子图等信息。当前的图表和子图可以使用plt.gcf()和plt.gca()获得,分别表示"GetCurrentFigure"和"GetCurrentAxes"。在pyplot模块中,许多函数都是对当前的Figure或Axes对象进行处理,比如说:
plt.plot()实际上会通过plt.gca()获得当前的Axes对象ax,然后再调用ax.plot()方法实现真正的绘图。
可以在Ipython中输入类似"plt.plot"的命令查看pyplot模块的函数是如何对各种绘图对象进行包装的。
matplotlib所绘制的图表的每个组成部分都和一个对象对应,我们可以通过调用这些对象的属性设置方法set_*()或者pyplot模块的属性设置函数setp()设置它们的属性值。
因为matplotlib实际上是一套面向对象的绘图库,因此也可以直接获取对象的属性
绘制一幅图需要对许多对象的属性进行配置,例如颜色、字体、线型等等。我们在绘图时,并没有逐一对这些属性进行配置,许多都直接采用了matplotlib的缺省配置。
matplotlib将这些缺省配置保存在一个名为“matplotlibrc”的配置文件中,通过修改配置文件,我们可以修改图表的缺省样式。配置文件的读入可以使用rc_params(),它返回一个配置字典;在matplotlib模块载入时会调用rc_params(),并把得到的配置字典保存到rcParams变量中;matplotlib将使用rcParams字典中的配置进行绘图;用户可以直接修改此字典中的配置,所做的改变会反映到此后创建的绘图元素。
Matplotlib里的常用类的包含关系为Figure->Axes->(Line2D,Text,etc.)一个Figure对象可以包含多个子图(Axes),在matplotlib中用Axes对象表示一个绘图区域,可以理解为子图。
可以使用subplot()快速绘制包含多个子图的图表,它的调用形式如下:
subplot(numRows,numCols,plotNum)subplot将整个绘图区域等分为numRows行*numCols列个子区域,然后按照从左到右,从上到下的顺序对每个子区域进行编号,左上的子区域的编号为1。如果numRows,numCols和plotNum这三个数都小于10的话,可以把它们缩写为一个整数,例如subplot(323)和subplot(3,2,3)是相同的。subplot在plotNum指定的区域中创建一个轴对象。如果新创建的轴和之前创建的轴重叠的话,之前的轴将被删除。
subplot()返回它所创建的Axes对象,我们可以将它用变量保存起来,然后用sca()交替让它们成为当前Axes对象,并调用plot()在其中绘图。
如果需要同时绘制多幅图表,可以给figure()传递一个整数参数指定Figure对象的序号,如果序号所指定的Figure对象已经存在,将不创建新的对象,而只是让它成为当前的Figure对象。
matplotlib的缺省配置文件中所使用的字体无法正确显示中文。为了让图表能正确显示中文,可以有几种解决方案。
面向对象画图
matplotlibAPI包含有三层,Artist层处理所有的高层结构,例如处理图表、文字和曲线等的绘制和布局。通常我们只和Artist打交道,而不需要关心底层的绘制细节。
直接使用Artists创建图表的标准流程如下:
importmatplotlib.pyplotasplt
X1=range(0,50)Y1=[num**2fornuminX1]#y=x^2X2=[0,1]Y2=[0,1]#y=x
Fig=plt.figure(figsize=(8,4))#Createa`figure'instanceAx=Fig.add_subplot(111)#Createa`axes'instanceinthefigureAx.plot(X1,Y1,X2,Y2)#CreateaLine2Dinstanceintheaxes
Fig.show()Fig.savefig("test.pdf")
参考:
Matplotlib.pylab快速绘图
matplotlib还提供了一个名为pylab的模块,其中包括了许多NumPy和pyplot模块中常用的函数,方便用户快速进行计算和绘图,十分适合在IPython交互式环境中使用。这里使用下面的方式载入pylab模块:
>>>importpylabaspl1安装numpy和matplotlib
>>>importnumpy>>>numpy.__version__
>>>importmatplotlib>>>matplotlib.__version__
2两种常用图类型:Lineandscatterplots(使用plot()命令),histogram(使用hist()命令)
2.1折线图&散点图Lineandscatterplots
2.1.1折线图Lineplots(关联一组x和y值的直线)
2.1.2散点图Scatterplots
把pl.plot(x,y)改成pl.plot(x,y,'o')即可,下图的蓝色版本
2.2美化Makingthingslookpretty
2.2.1线条颜色Changingthelinecolor
红色:把pl.plot(x,y,'o')改成pl.plot(x,y,’or’)
2.2.2线条样式Changingthelinestyle
虚线:plot(x,y,'--')
2.2.3marker样式Changingthemarkerstyle
蓝色星型markers:plot(x,y,’b*’)
2.2.4图和轴标题以及轴坐标限度Plotandaxistitlesandlimits
2.2.5在一个坐标系上绘制多个图Plottingmorethanoneplotonthesamesetofaxes
做法是很直接的,依次作图即可:
2.2.6图例Figurelegends
pl.legend((plot1,plot2),(’label1,label2’),'best’,numpoints=1)
其中第三个参数表示图例放置的位置:'best’‘upperright’,‘upperleft’,‘center’,‘lowerleft’,‘lowerright’.
如果在当前figure里plot的时候已经指定了label,如plt.plot(x,z,label="$cos(x^2)$"),直接调用plt.legend()就可以了哦。
2.3直方图Histograms
importnumpyasnpimportpylabaspl#makeanarrayofrandomnumberswithagaussiandistributionwith#mean=5.0#rms=3.0#numberofpoints=1000data=np.random.normal(5.0,3.0,1000)#makeahistogramofthedataarraypl.hist(data)#makeplotlabelspl.xlabel(’data’)pl.show()如果不想要黑色轮廓可以改为pl.hist(data,histtype=’stepfilled’)
2.3.1自定义直方图bin宽度Settingthewidthofthehistogrambinsmanually
增加这两行
bins=np.arange(-5.,16.,1.)#浮点数版本的rangepl.hist(data,bins,histtype=’stepfilled’)
3同一画板上绘制多幅子图Plottingmorethanoneaxispercanvas
如果需要同时绘制多幅图表的话,可以是给figure传递一个整数参数指定图标的序号,如果所指定序号的绘图对象已经存在的话,将不创建新的对象,而只是让它成为当前绘图对象。
Youcanplayaroundwithplottingavarietyoflayouts.Forexample,Fig.11iscreatedusingthefollowingcommands:
f1=pl.figure(1)pl.subplot(221)pl.subplot(222)pl.subplot(212)
当绘图对象中有多个轴的时候,可以通过工具栏中的ConfigureSubplots按钮,交互式地调节轴之间的间距和轴与边框之间的距离。如果希望在程序中调节的话,可以调用subplots_adjust函数,它有left,right,bottom,top,wspace,hspace等几个关键字参数,这些参数的值都是0到1之间的小数,它们是以绘图区域的宽高为1进行正规化之后的坐标或者长度。
pl.subplots_adjust(left=0.08,right=0.95,wspace=0.25,hspace=0.45)
4绘制文件中的数据Plottingdatacontainedinfiles
4.1从Ascii文件中读取数据Readingdatafromasciifiles
numpy的loadtxt方法可以直接读取如下文本数据到numpy二维数组
**********************************************
#fakedata.txt0011243941652563674986498100112439416525636749864981
4.2写入数据到文件Writingdatatoatextfile
写文件的方法也很多,这里只介绍一种可用的写入文本文件的方法,更多的可以参考官方文档。
对LaTeX数学公式的支持
Matlplotlib对LaTeX有一定的支持,如果记得使用raw字符串语法会很自然:
xlabel(r"$\frac{x^2}{y^4}$")
在matplotlib里面,可以使用LaTex的命令来编辑公式,只需要在字符串前面加一个“r”即可
Hereisasimpleexample:
#plaintextplt.title('alpha>beta')
produces“alpha>beta”.
Whereasthis:
这里给大家看一个简单的例子。
x=arange(1,1000,1)r=-2c=5y=[5*(a**r)forainx]
fig=plt.figure()
ax=fig.add_subplot(111)ax.loglog(x,y,label=r"$y=\frac{1}{2\sigma_1^2},c=5,\sigma_1=-2$")ax.legend()ax.set_xlabel(r"x")ax.set_ylabel(r"y")
程序执行结果如图3所示,这实际上是一个power-law的例子,有兴趣的朋友可以继续google之。
再看一个《用Python做科学计算》中的简单例子,下面的两行程序通过调用plot函数在当前的绘图对象中进行绘图:
plt.plot(x,y,label="$sin(x)$",color="red",linewidth=2)plt.plot(x,z,"b--",label="$cos(x^2)$")
plot函数的调用方式很灵活,第一句将x,y数组传递给plot之后,用关键字参数指定各种属性:
详细的可以参考matplotlib官方教程:
有几个问题:
对数坐标轴
在实际中,我们可能经常会用到对数坐标轴,这时可以用下面的三个函数来实现