敏捷数据开发
来自CloudWiki
Cloud17
(
讨论
|
贡献
)
2022年7月20日 (三) 10:53的版本
(
→
第4章 记录收集与展示
)
(
差异
)
←上一版本
|
最后版本
(
差异
) |
下一版本→
(
差异
)
跳转至:
导航
,
搜索
目录
1
第1章 理论
2
第2章 敏捷工具
3
第3章 数据
4
第4章 记录收集与展示
5
第5章 使用图表进行数据可视化
6
第6章 通过报表探索数据
第1章 理论
敏捷数据开发:前言
敏捷数据科学
第2章 敏捷工具
Spark全栈:可伸缩性=易用性
Spark全栈:敏捷数据科学之数据处理
Spark全栈:下载数据到本地
Spark全栈:下载并运行代码
Spark全栈:工具集概览
第3章 数据
Spark全栈:飞行航班数据
Spark全栈:天气数据
Spark全栈:敏捷数据科学中的数据处理
Spark全栈:SQL vs.NoSQL
第4章 记录收集与展示
Spark全栈:攀登金字塔
先备知识:
PySpark实战:下载Spark
PySpark实战:Linux搭建Spark环境
、
PySpark实战:Windows搭建Spark环境
PySpark实战:用PySpark建立第一个Spark RDD
、
PySpark实战:PySpark Shell 建立RDD
、
PySpark实战:Python文件 建立RDD
PySpark实战:DataFrame存储csv数据
Spark全栈:航班数据收集与序列化
先备知识:
PySpark实战:安装MongoDB
PySpark实战:MongoDB基本操作
Spark全栈:航班记录处理与发布
第5章 使用图表进行数据可视化
Spark全栈:使用图表进行数据可视化
第6章 通过报表探索数据
Spark全栈:通过报表探索数据
参考文档:
https://github.com/rjurney/Agile_Data_Code_2
导航菜单
个人工具
登录
命名空间
页面
讨论
变种
视图
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
帮助
工具
链入页面
相关更改
特殊页面
固定链接
页面信息