“敏捷数据开发”的版本间的差异

来自CloudWiki
跳转至: 导航搜索
第4章 记录收集与展示
 
(未显示同一用户的27个中间版本)
第1行: 第1行:
敏捷数据科学有两大目标:
+
==第1章 理论==
 +
*[[敏捷数据开发:前言]]
 +
*[[敏捷数据科学]]
  
一是为了使用Python和Spark搭建出任意规模的数据分析应用,
+
==第2章 敏捷工具==
 +
*[[Spark全栈:可伸缩性=易用性]]
 +
*[[Spark全栈:敏捷数据科学之数据处理]]
 +
*[[Spark全栈:下载数据到本地]]
 +
*[[Spark全栈:下载并运行代码]]
 +
*[[Spark全栈:工具集概览]]
  
二是帮助产品团队学会使用敏捷的方式协作开发分析应用来保障工作成效。
+
==第3章 数据==
 +
*[[Spark全栈:飞行航班数据]]
 +
*[[Spark全栈:天气数据]]
 +
*[[Spark全栈:敏捷数据科学中的数据处理]]
 +
*[[Spark全栈:SQL vs.NoSQL]]
  
我为本书维护了一个网页(http://datasyndrome.com/book),里面有最新的更新,以及为读者准备的相关资料。
+
==第4章 记录收集与展示==
 +
*[[Spark全栈:攀登金字塔]]
 +
*先备知识:
 +
**[[PySpark实战:下载Spark]]
 +
**[[PySpark实战:Linux搭建Spark环境]]、[[PySpark实战:Windows搭建Spark环境]]
 +
**[[PySpark实战:用PySpark建立第一个Spark RDD]]、[[PySpark实战:PySpark Shell 建立RDD]]、[[PySpark实战:Python文件 建立RDD]]
 +
**[[PySpark实战:DataFrame存储csv数据]]
 +
*[[Spark全栈:航班数据收集与序列化]]
  
Data Syndrome提供视频课程《使用Kafka、PySpark、Spark MLlib和Spark Streaming进行实时预测分析》(Realtime Predictive Analytics with Kafka,PySpark, Spark MLlib and Spark Streaming. http://datasyndrome.com/video),使用了第7章和第8章的材料,教观看者如何用Kafka、Spark Streaming及网络应用的前端页面构建出整套的实时预测系统(见图P-2)。如果想进一步了解,请访问http://datasyndrome.com/video 或联系rjurney@datasyndrome. com。
 
  
*[[本书主要结构]]
+
*先备知识:
 +
**[[PySpark实战:安装MongoDB]]
 +
**[[PySpark实战:MongoDB基本操作]]
 +
**[[PySpark实战:安装pymongo]]
 +
**[[PySpark实战:安装MongoDB的Java驱动]]
  
补充材料(代码示例、练习等)可以在https://github.com/rjurney/Agile_Data_Code_2中下载到。
+
排错:
 +
https://blog.csdn.net/zhangxiaohui4445/article/details/104412312
  
国内:www.broadview.com.cn
+
https://blog.csdn.net/zhangxiaohui4445/article/details/104412312
  
页面入口:http://www.broadview.com.cn/35166
+
https://blog.csdn.net/qq_28626909/article/details/81636803
  
 +
**[[PySpark实战:安装mongo-spark]]
 +
**[[MongoDB + Spark: 完整的大数据解决方案  https://blog.51cto.com/u_15486212/5239193]]
 +
**[[PySpark实战:安装mongo-hadoop]]
 +
**[[PySpark实战:安装pymongo_spark]]
 +
*[[Spark全栈:航班记录处理与发布]]
  
 
==第5章 使用图表进行数据可视化==
 
==第5章 使用图表进行数据可视化==
第23行: 第50行:
 
==第6章 通过报表探索数据==
 
==第6章 通过报表探索数据==
 
*[[Spark全栈:通过报表探索数据]]
 
*[[Spark全栈:通过报表探索数据]]
 +
 +
参考文档:https://github.com/rjurney/Agile_Data_Code_2

2022年7月21日 (四) 10:35的最新版本

第1章 理论

第2章 敏捷工具

第3章 数据

第4章 记录收集与展示


排错: https://blog.csdn.net/zhangxiaohui4445/article/details/104412312

https://blog.csdn.net/zhangxiaohui4445/article/details/104412312

https://blog.csdn.net/qq_28626909/article/details/81636803

第5章 使用图表进行数据可视化

第6章 通过报表探索数据

参考文档:https://github.com/rjurney/Agile_Data_Code_2