最近想学习一些python数据分析的内容,就弄了个爬虫爬取了一些数据,并打算用Anaconda一套的工具(pandas,numpy,scipy,matplotlib,jupyter)等进行一些初步的数据挖掘和分析。
运行环境:
python2.7
LinuxCentos7
问题:
matplotlib画图,无法显示中文
问题原因:
linux操作系统以及matplotlib的字体库中,没有可用的中文字体
matplotlib包默认只支持ASCII码,不支持unicode码
网上资料总结:
给linux安装中文字体,并修改matplotlib的资源配置文件。(呵呵,并没有作用)
解决方案:
其实也是综合了网上的各种解决方案。总体说来有以下几个步骤:
1.获取matplotlibrc文件所在路径。在jupyternotebook中获取:
importmatplotlibmatplotlib.matplotlib_fname()例如,我的这个文件在:
u'~/miniconda2/lib/python2.7/site-packages/matplotlib/mpl-data/matplotlibrc'后续步骤会修改此文件中的font参数。
2.看看系统中的所有字体,以及可用的中文字体。也是在jupyternb中:
frommatplotlib.font_managerimportFontManagerimportsubprocessfm=FontManager()mat_fonts=set(f.nameforfinfm.ttflist)printmat_fontsoutput=subprocess.check_output('fc-list:lang=zh-f"%{family}\n"',shell=True)print'*'*10,'系统可用的中文字体','*'*10printoutputzh_fonts=set(f.split(',',1)[0]forfinoutput.split('\n'))available=mat_fonts&zh_fontsprint'*'*10,'可用的字体','*'*10forfinavailable:printf做完上述操作,会发现“可用的字体”这里为空。因为没有中文字体给matplotlib用(所以才会中文都显示“框框”)
解压rar文件。在/usr/share/fonts路径下创建存放此字体的文件夹yourfontdir,并下载的ttf文件复制到yourfontdir中(可以给文件改个英文名,方便操作)
4.给cenos安装这个字体。
cd/usr/share/fonts/yourfontsdir#生成字体索引信息.会显示字体的font-familysudomkfontscalesudomkfontdir#更新字体缓存:fc-cache5.修改matplotlibrc文件
修改步骤1中获取的matplotlibrc文件配置。
将font.family部分注释去掉,并且在font.serif支持字体加上一个中文字体。这里就加上刚才下载的中文字体的font-family.可以通过fc-list命令查找一下(所以前面最好记下来)。我这里增加的是"WenQuanYiZenHeiMono"字体。
下面这句注释要去掉,不然中文减号也显示方块:
axes.unicode_minus:False6.这一步骤最重要!为matplotlib增加中文字体
完成步骤5后,再操作步骤2,会发现“可用的中文字体”已经有了刚才安装的字体,但是画图仍然不能显示中文。这是因为你这个字体给centos安装了、也告诉matplotlib要用这个字体了,但是,matplotlib找不到这个字体的ttf文件啊。。。。所以需要给它弄一个。