“大数据分析”的版本间的差异
来自CloudWiki
(→大数据平台搭建) |
(→大数据平台搭建) |
||
第34行: | 第34行: | ||
*[[搭建ambari管理平台]] | *[[搭建ambari管理平台]] | ||
*[[配置ambari server]] | *[[配置ambari server]] | ||
+ | *[[配置ambari agent]] | ||
*[[HDFS的管理]] | *[[HDFS的管理]] | ||
*[[MapReduce简介]] | *[[MapReduce简介]] |
2018年7月24日 (二) 14:19的版本
网址收藏
网络爬虫入门
获取网页
解析网页
存储数据
存储数据的基础技术:存入txt文件和存入csv文件。存储数据的进阶技术:存入MySQL数据库和存入MongoDB数据库。
提升爬虫速度
大数据平台搭建
- 大数据背景知识
- 大数据处理流程
- 大数据分析工具
- 大数据案例构思
- 大数据系统整体架构
- 搭建ambari管理平台
- 配置ambari server
- 配置ambari agent
- HDFS的管理
- MapReduce简介
- 聚类分析
其他
参考文档: