基于Python+Flask+SQLite的网易云音乐评论情感分析系统
基于Python+Flask+MySQL的网易云音乐评论情感分析系统,采用Echart构建图表,支持一键切换颜色主题,通过连接数据库获取评论数据。对失效的爬虫代码进行了更新,可通过歌曲id半自动获取评论,具体可以看下方的过程展示。 进入首页,获取来自数据库的信息,数据库的修改可以通过Navicat这个数据库操作软件进行修改。源码提供了制作好的包含歌曲评论的sql文件,只需要导入Navicat就可以实现可视化的分析,非常方便,使用简单,可以免费提供Navicat的使用指导哦。
首页
统计结果展示了数据库中的歌曲数量,总评论数量,以及情感分析中正面情感的占比,并预留了两个空位放置图。
统计结果展示
可视化分析展示,主要分析了不同歌曲的评论数量(折线图),不同歌曲的vip用户数量(环形图),使用sklearn对评论文字进行情感分析统计(柱状图),主要使用sklearn与nltk实现但是精准度不如百度的接口。后期可以在这方便进行改进。
图表展示结果
词云
利用百度的情感分析接口获取评论的情感倾向,需要登录百度账号,获取token,代码中的token随时失效,每个用户都有一定免费额度可以调用,作为效果演示完全没有问题。
调用aip分析
数据库字段主要有用户id,评论内容GetData,点赞数likeCount,时间,是否VIP用户,IP地址和情感倾向。原项目使用加密解密的方式获取评论,这里进行了修改,采用过滤请求的网址手动保存为har文件的方式,然后对har文件读取,得到评论保存为json文件,然后将json文件写入数据库。
数据库展示
本项目在python3.8下通过测试,具体可以查看requirements中的环境要求,在这里出一个简单的项目使用教程,一般项目中的requirements.txt中包含了项目的python依赖环境,在安装好python的前提下只需要在cmd窗口中pip install -r requirements.txt 有时候因为路径问题会提示requirements这个文件不存在,可以改为完整的路径,比如c:\requirements.txt,对于本项目只需要运行main.py,在pycharm的配置更为方便,可以不用每次都在终端输入命令使用。
有需要的小伙伴可以通过后台联系方式获取,如果加不上可以后台留言留下联系方式