如果你之前没有编程基础,没关系。希望你不要限于浏览,而是亲自动手尝试一番。到完成的那一步,你不仅可以做出第一张词云图,而且这还将是你的第一个有用的编程作品。
1、请确保你的python环境没有问题,用的开发工具是VsCode,首先你要在Python扩展中安装python开发环境(当然,这不是为你的windows安装python)。
2、那么你还需要安装所需要的第三方库,那么在VSCode中并没有PyCharm那么专业,这里需要获得你自己的Python脚本位置。
3、我们可以发现里面有一个名为pip.exe文件,这个文件就是python官方给我们去安装python第三方库的一个程序,那么我们可以在VsCode的终端中就可以去通过它,这也是我们为什么要获取python安装位置的根本原因。
4、python做词云呢,需要导入的包有wordcloud和PIL,其中PIL(PythonImageLibrary)是python平台图像处理标准库,功能是真的强大。首先需要读取文件。
5、如果python引入无误,并代码无误,那么会弹出你生成的图片,该图片会储存在你的系统。
importnumpyasnp#数据处理
importmatplotlib.pyplotasplt#作图
fromwordcloudimportWordCloud#词云函数
importjieba#分割中文的包
fromimageioimportimread#读取图片....后面还有根据自己需要安装包
解决办法:在open函数中加上encoding="utf-8"
withopen("./xxx.txt",'r',encoding='utf-8')asf:
text=f.read()
f.close()
解决办法:选择一个支持中文显示的字体。如在电脑中C:\Windows\Fonts\选择有个中文的字体,如,font=r'C:\Windows\Fonts\simfang.ttf',后面再使用WordCloud的参数font_path=font。
几个简单实例:
importnumpyasnp
importmatplotlib.pyplotasplt
fromwordcloudimportWordCloud
text="square"#表示内容
x,y=np.ogrid[:300,:300]
mask=(x-150)**2+(y-150)**2130**2
mask=255*mask.astype(int)
wc=WordCloud(background_color="white",repeat=True,mask=mask)
wc.generate(text)
plt.axis("off")
plt.imshow(wc,interpolation="bilinear")
plt.show()
单字内容
importos
fromosimportpath
#getdatadirectory(usinggetcwd()isneededtosupportrunningexampleingeneratedIPythonnotebook)
d=path.dirname(__file__)if"__file__"inlocals()elseos.getcwd()
#Readthewholetext.
text=open(path.join(d,'constitution.txt')).read()
#Generateawordcloudimage
wordcloud=WordCloud().generate(text)
#Displaythegeneratedimage:
#thematplotlibway:
plt.imshow(wordcloud,interpolation='bilinear')
#lowermax_font_size
wordcloud=WordCloud(max_font_size=40).generate(text)
plt.figure()
plt.imshow(wordcloud,interpolation="bilinear")
多字的内容,内容从本地电脑中获取
fromPILimportImage
fromwordcloudimportWordCloud,STOPWORDS
text=open(path.join(d,'alice.txt')).read()
#readthemaskimage
#takenfrom
#
alice_mask=np.array(Image.open(path.join(d,"alice_mask.png")))
stopwords=set(STOPWORDS)
stopwords.add("said")
wc=WordCloud(background_color="white",max_words=2000,mask=alice_mask,
stopwords=stopwords,contour_width=3,contour_color='steelblue')
#generatewordcloud
#storetofile
wc.to_file(path.join(d,"alice.png"))
#show
plt.imshow(wc,interpolation='bilinear')
plt.imshow(alice_mask,cmap=plt.cm.gray,interpolation='bilinear')
使用图片来做词云
更多信息可以参看wordcloud官网:
上面有更多的例子,上面内容也来自于网站整理。
也可参考网站:
wordcloud库简介
python中的wordcloud库是一个用来制作词云的第三方库
安装wordcloud库
pipinstallwordcloud123
使用w=wordcloud.WordCloud()创建一个词云对象
2.WordCloud()参数介绍
3.实现效果
4.问题
并没有按照词云的样式展示,这里需要使用jieba库进行分词
安装jieba库
pipinstalljieba
5.使用jieba库进行分词
6.效果
将txt文本中的内容生成词云
获取文件中的内容
f=open('./xxx.txt','r',encoding='utf-8')
说明
encoding=‘utf-8’这个参数表示读取的内容以utf-8的编码方式读取文件