|
|
第1行: |
第1行: |
| ==大数据集群搭建== | | ==大数据集群搭建== |
− | ===Hadoop伪分布式搭建===
| |
− | *[https://docs.qq.com/doc/DUFpIbnNPZUtBVnFz hadoop伪分布式搭建]
| |
| | | |
| ===Hadoop分布式搭建=== | | ===Hadoop分布式搭建=== |
第9行: |
第7行: |
| *[[安装hadoop]] | | *[[安装hadoop]] |
| *[[hbase安装]] | | *[[hbase安装]] |
− |
| |
− | ===Spark集群搭建===
| |
− | *[[Spark运行架构]]
| |
− | *[https://docs.qq.com/doc/DUE1Ld2NzckZWRERJ Spark的安装和使用]
| |
− |
| |
− | ===Spark大数据分析===
| |
− | *[https://docs.qq.com/doc/DUGJVYVhhblZKRVhJ Spark RDD编程]
| |
− | *[https://docs.qq.com/doc/DUEt3TFNmZW9RQ0VT Spark 键值对RDD编程]
| |
− | *[[Spark案例:词频统计]]
| |
− | *[[Spark案例:计算PM2.5]]
| |
− |
| |
− | ===Spark机器学习===
| |
− | *[[Spark 线性回归之二手房预测]]
| |
− | *[[Spark 决策树之银行贷款预测]]
| |
| | | |
| ===HDFS操作=== | | ===HDFS操作=== |