“Spark:基于内容的推荐系统”的版本间的差异
来自CloudWiki
(→ElasticSearch后台) |
(→ElasticSearch后台) |
||
第4行: | 第4行: | ||
'''spark索引创建'''<br> | '''spark索引创建'''<br> | ||
1.我们这里使用logstash上传到ES,分为三个字段分别是"当前商品、其他商品、相似度"<br> | 1.我们这里使用logstash上传到ES,分为三个字段分别是"当前商品、其他商品、相似度"<br> | ||
+ | '''2.源数据格式''' | ||
[[文件:2020920.jpg]]<br> | [[文件:2020920.jpg]]<br> | ||
+ | 3.编写logstash配置文件 | ||
+ | [root@master config]# cat spak-tj.conf | ||
+ | input { | ||
+ | file { | ||
+ | path => ["/root/0920data.csv"] | ||
+ | start_position => "beginning" | ||
+ | } | ||
+ | } | ||
+ | filter { | ||
+ | csv { | ||
+ | separator => "," | ||
+ | columns => ["current merchandise","other commodities","similarity"] | ||
+ | } | ||
+ | } | ||
+ | output { | ||
+ | elasticsearch { | ||
+ | hosts => ["master:9200"] | ||
+ | index => "spark-tj" | ||
+ | } | ||
+ | } |
2020年9月20日 (日) 14:31的版本
vue前端
ElasticSearch后台
spark索引创建
1.我们这里使用logstash上传到ES,分为三个字段分别是"当前商品、其他商品、相似度"
2.源数据格式
3.编写logstash配置文件
[root@master config]# cat spak-tj.conf input { file { path => ["/root/0920data.csv"] start_position => "beginning" } } filter { csv { separator => "," columns => ["current merchandise","other commodities","similarity"] } } output { elasticsearch { hosts => ["master:9200"] index => "spark-tj" } }