https://www.waitig.com/%E5%88%A9%E7%94%A8python%E6%90%AD%E5%BB%BA%E7%94%A8%E6%88%B7%E7%94%BB%E5%83%8F%E7%B3%BB%E7%BB%9F.html
[popexizhi:
安装依赖
sudo pip install wordcloud
sudo pip install jieba
sudo pip install scipy
sudo pip install matplot
sudo pip install matplotlib
sudo apt-get install python-tk
设置分析文件 test.txt, 字体文件Simfang.ttf,原始图像alice.png 就可以使用了:)
感觉这个是个很不错的关键词出现概率后的展示方式,可以尝试使用其他的数据分析使用。
]
步骤为:获取数据–>分析数据–>生成用户画像–>网站实现
获取数据:在我们的实际开发中,原始数据是通过在数据库中获取,本文为了方便通过test.txt文件读取数据;
分析数据:在该步骤中,我们需要对读取的数据进行切割,并提取关键词及计算关键词的权重,这里我们我们利用Python的一个中文分词工具jieba,如果还没安装的可以使用pip安装(安装命令为:pip install jieba);
生成用户画像:在这个步骤中,我们需要把获得关键词生成云词图,这里借用wordcloud生成云词图(如果还没安装可以通过命令pip install wordcloud进行安装)
分析数据:在该步骤中,我们需要对读取的数据进行切割,并提取关键词及计算关键词的权重,这里我们我们利用Python的一个中文分词工具jieba,如果还没安装的可以使用pip安装(安装命令为:pip install jieba);
生成用户画像:在这个步骤中,我们需要把获得关键词生成云词图,这里借用wordcloud生成云词图(如果还没安装可以通过命令pip install wordcloud进行安装)
没有评论:
发表评论