“实时推荐系统”的版本间的差异
来自CloudWiki
Xiaolongyang(讨论 | 贡献) (→实训步骤) |
Xiaolongyang(讨论 | 贡献) (→实训步骤) |
||
第29行: | 第29行: | ||
*[[Kafka——集群安裝部署(自带Zookeeper)]] | *[[Kafka——集群安裝部署(自带Zookeeper)]] | ||
*[[Kafka数据缓存]] | *[[Kafka数据缓存]] | ||
− | *[[ | + | *[[配置开发环境intellij & IDEA && Maven && JDK]] |
*[[Flink实时数据处理]] | *[[Flink实时数据处理]] |
2020年8月9日 (日) 10:26的版本
简介
电商平台网站 G 随着业务量越来越大,公司希望了解用户在浏览公司站点时的行为习惯和消费习惯,需要收集用户在站点的实时访问数据,并根据用户的购买偏好进行实时商品推荐。
用户数据来源分为两部分,即用户的网站日志和业务数据库。公司大数据工程师需要通过这两类数据来源中的数据分析用户的消费偏好。
实训环境
(1) 使用 CentOS 6.10 的 Linux 操作系统搭建的 3 个节点。
(2) 使用 1.8 的 JDK 。
(3) 使用 3.4.6 版本的 ZooKeeper 。
(4) 使用 2.6.4 版本的 Hadoop 。
(5) 使用 1.2.1 版本的 Hive 。
(6) 使用 1.9.0 版本的 Flume 。
(7) 使用 2.3.1 的 Kafka 。
(8) 使用 1.10.1 版本的 Flink 。