本书主要结构

来自CloudWiki
跳转至: 导航搜索

本书主要结构

本书分为两个部分。第Ⅰ部分介绍的是我们在第Ⅱ部分中需要用到的数据集和工具集。第Ⅰ部分故意写得简明扼要,只是为了尽可能快地介绍这些工具。第Ⅱ部分会更深入地探讨这些工具的使用,所以如果在读第Ⅰ部分时感觉有些不知所措也不用担心。第Ⅰ部分的章节如下。

第1章 理论

介绍敏捷数据科学的方法论。

第2章 敏捷工具

介绍要用的工具集,并且讲解工具如何上手与安装。

第3章 数据

描述本书中使用的数据集。

第Ⅱ部分是我们使用敏捷数据科学来构建一个分析应用的教程。这是一份笔记本式的分析应用构建指南。我们逐层攀登数据价值金字塔,始终应用敏捷的原则。这一部分会展示在敏捷迭代进程中一步一步发掘数据价值的方法。第Ⅱ部分由以下所列章节组成。

第4章 记录收集与展示

帮你下载航班数据,并且通过网络应用展示航班记录。

第5章 使用图表进行数据可视化

一步步引导你如何在网络应用中加入一些简单的图表来展示数据。

第6章 通过报表探索数据

教你如何从数据中提取出实体关系,将其参数化并相互关联以创建交互式的报表。

第7章 进行预测

在先前所做的基础上对某一航班准点与否进行预测。

第8章 部署预测系统

展示如何部署预测系统来确保真正发挥作用。

第9章 改进预测结果

不断迭代提高我们的准点航班预测应用的表现。