PySpark实战

来自CloudWiki
跳转至: 导航搜索

大数据时代

大数据的瑞士军刀--Spark

Spark实战环境设定

建立Spark环境前提

一分钟建立Spark环境

打造交互式Spark环境

活用PySpark

RDD的操作与观察

共享变数

DataFrames与Spark SQL

撰写第一个Spark程序

PySpark ETL实战

PySpark分布式机器学习

PySpark+Kafka实时项目

Flask版

Django版


路线图

PySpark基础统计

PySpark推荐系统

PySpark+ 机器学习/人工智能

pyspark教程:http://xueai8.com/book/6