大橙子网站建设,新征程启航
为企业提供网站建设、域名注册、服务器等服务
这篇文章给大家分享的是有关python如何根据文本生成词云图的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。
作为一家“创意+整合+营销”的成都网站建设机构,我们在业内良好的客户口碑。成都创新互联公司提供从前期的网站品牌分析策划、网站设计、网站设计制作、网站建设、创意表现、网页制作、系统开发以及后续网站营销运营等一系列服务,帮助企业打造创新的互联网品牌经营模式与有效的网络营销方法,创造更大的价值。效果
代码
from wordcloud import WordCloud import codecs import jieba #import jieba.analyse as analyse from scipy.misc import imread import os from os import path import matplotlib.pyplot as plt from PIL import Image, ImageDraw, ImageFont # 绘制词云 def draw_wordcloud(): #读入一个txt文件 comment_text = open('data.txt','r',encoding='utf-8').read() #结巴分词,生成字符串,如果不通过分词,无法直接生成正确的中文词云 cut_text = " ".join(jieba.cut(comment_text)) d = path.dirname(__file__) # 当前文件文件夹所在目录 color_mask = imread("bilibili.jpg") # 读取背景图片 cloud = WordCloud( #设置字体,不指定就会出现乱码 font_path="C:/Windows/Fonts/STXINGKA.TTF", #font_path=path.join(d,'simsun.ttc'), #设置背景色 background_color='white', #词云形状 mask=color_mask, #允许大词汇 max_words=2000, #大号字体 max_font_size=100 ) word_cloud = cloud.generate(cut_text) # 产生词云 word_cloud.to_file("bilibilirankword.jpg") #保存图片 # 显示词云图片 plt.imshow(word_cloud) plt.axis('off') plt.show() if __name__ == '__main__': draw_wordcloud()
步骤以及注意点
1.首先要导入对应的库
2.文字会根据背景图而分布
3.背景图的选择对于最终效果很重要,选一个尽量大一点的背景图,这个背景图随便找就好,任何图片都可以不过最好大一些,图案不太复杂
4.如果字号小的话,可以调整字体,或者换个背景图
5.font_path要使用自己的字体库,不过你的电脑是windows的话,应该不用改,用我这个就可以,除此之外呢,这个字体如果是别的的话,可能会出现
中文不能产生词云图的现象,总之用我的就好了。
感谢各位的阅读!关于“python如何根据文本生成词云图”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!
另外有需要云服务器可以了解下创新互联scvps.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。