“全国大数据技能大赛”的版本间的差异

来自CloudWiki
跳转至: 导航搜索
Spark机器学习
第1行: 第1行:
 
==大数据集群搭建==
 
==大数据集群搭建==
===Hadoop伪分布式搭建===
 
*[https://docs.qq.com/doc/DUFpIbnNPZUtBVnFz hadoop伪分布式搭建]
 
  
 
===Hadoop分布式搭建===
 
===Hadoop分布式搭建===
第9行: 第7行:
 
*[[安装hadoop]]
 
*[[安装hadoop]]
 
*[[hbase安装]]
 
*[[hbase安装]]
 
===Spark集群搭建===
 
*[[Spark运行架构]]
 
*[https://docs.qq.com/doc/DUE1Ld2NzckZWRERJ Spark的安装和使用]
 
 
===Spark大数据分析===
 
*[https://docs.qq.com/doc/DUGJVYVhhblZKRVhJ Spark RDD编程]
 
*[https://docs.qq.com/doc/DUEt3TFNmZW9RQ0VT Spark 键值对RDD编程]
 
*[[Spark案例:词频统计]]
 
*[[Spark案例:计算PM2.5]]
 
 
===Spark机器学习===
 
*[[Spark 线性回归之二手房预测]]
 
*[[Spark 决策树之银行贷款预测]]
 
  
 
===HDFS操作===
 
===HDFS操作===

2019年7月20日 (六) 08:53的版本

大数据集群搭建

Hadoop分布式搭建

HDFS操作

构建数据仓库

数据采集

数据分析