舆情分析技术
来自CloudWiki
数据可视化
Python-在线网页导出为图片或pdf:https://blog.csdn.net/y472360651/article/details/105393396/
按日/周/月 生成舆情分析报告。
舆情分析技术
中文分词技术
对微博/帖子中的文字拆分成短语,
pytthon jieba 分词(over)
关键词提取算法
关键词提取算法:提取微博/帖子中的关键词
TF/IDF算法,TextRank算法,LSA/LSI/LDA算法
TF/IDF算法,LSA/LSI/LDA算法 : python gensim包
TextRank算法: pytthon jieba包
文本向量化
文本向量化:计算微博/文章的相似度 ,寻找同一主题的文章
向量化算法word2vec, str2vec
word2vec训练中文词向量:https://blog.csdn.net/lilong117194/article/details/82849054
文本聚类
文本聚类:用K-means 对文本进行聚类 ?
情感分析
情感分析算法:
词法分析 基于机器学习的分析 混合分析
python实现情感分析(Word2Vec):https://blog.csdn.net/qq_45874897/article/details/107662626
大数据架构技术:hadoop,spark
基于spark的舆情分析研究:
https://www.doc88.com/p-7334988699450.html
基于hadoop的中文舆情分析
https://blog.csdn.net/weixin_34381666/article/details/89613017