“Hadoop、Spark大数据实践案例”的版本间的差异
来自CloudWiki
第30行: | 第30行: | ||
*[https://docs.qq.com/doc/DUGJVYVhhblZKRVhJ Spark RDD编程] | *[https://docs.qq.com/doc/DUGJVYVhhblZKRVhJ Spark RDD编程] | ||
*[https://docs.qq.com/doc/DUEt3TFNmZW9RQ0VT Spark 键值对RDD编程] | *[https://docs.qq.com/doc/DUEt3TFNmZW9RQ0VT Spark 键值对RDD编程] | ||
− | |||
*[[Spark案例:词频统计]] | *[[Spark案例:词频统计]] | ||
*[[Spark案例:计算PM2.5]] | *[[Spark案例:计算PM2.5]] | ||
===Spark机器学习=== | ===Spark机器学习=== | ||
+ | *[[Python爬虫案例:爬取二手房信息]] | ||
*[[Spark 线性回归之二手房预测]] | *[[Spark 线性回归之二手房预测]] | ||
*[[Spark 决策树之银行贷款预测]] | *[[Spark 决策树之银行贷款预测]] |
2019年7月20日 (六) 08:20的版本
目录
大数据的案例
大数据公司挖掘数据价值的49个典型案例
https://blog.csdn.net/zw0pi8g5c1x/article/details/81277567
大数据的应用
工业系统数据分析
通过分析真实的工业应用系统数据,为该系统的功能或性能优化提出可行的建议。
网页文本信息的获取与处理
网页文本信息的获取与处理:通过对真实网页数据的爬取与搜集,为政府、企业或个人提供有价值的信息,如:舆情信息、某一方面的流行趋势、热门话题等信息。
公共交通数据的分析与挖掘
通过分析真实的公共交通流量数据,如:道路交通数据、铁路客运信息、民航客票信息等,提出线路优化或个人出行建议。