敏捷数据开发

来自CloudWiki
Cloud17讨论 | 贡献2021年8月14日 (六) 09:26的版本
跳转至: 导航搜索

敏捷数据科学有两大目标:

一是为了使用Python和Spark搭建出任意规模的数据分析应用,

二是帮助产品团队学会使用敏捷的方式协作开发分析应用来保障工作成效。

我为本书维护了一个网页(http://datasyndrome.com/book),里面有最新的更新,以及为读者准备的相关资料。

Data Syndrome提供视频课程《使用Kafka、PySpark、Spark MLlib和Spark Streaming进行实时预测分析》(Realtime Predictive Analytics with Kafka,PySpark, Spark MLlib and Spark Streaming. http://datasyndrome.com/video),使用了第7章和第8章的材料,教观看者如何用Kafka、Spark Streaming及网络应用的前端页面构建出整套的实时预测系统(见图P-2)。如果想进一步了解,请访问http://datasyndrome.com/video 或联系rjurney@datasyndrome. com。

补充材料(代码示例、练习等)可以在https://github.com/rjurney/Agile_Data_Code_2中下载到。

国内:www.broadview.com.cn

页面入口:http://www.broadview.com.cn/35166


第5章 使用图表进行数据可视化

第6章 通过报表探索数据