“PySpark实战”的版本间的差异

来自CloudWiki
跳转至: 导航搜索
PySpark分布式机器学习
PySpark分布式机器学习
第134行: 第134行:
 
*[[PySpark实战:资料清理与变形]]
 
*[[PySpark实战:资料清理与变形]]
 
*[[PySpark实战:认识Pipeline]]
 
*[[PySpark实战:认识Pipeline]]
 +
*[[PySpark实战:逻辑回归原理与应用]]

2021年7月31日 (六) 13:51的版本

大数据时代

大数据的瑞士军刀--Spark

Spark实战环境设定

建立Spark环境前提

一分钟建立Spark环境

打造交互式Spark环境

活用PySpark

RDD的操作与观察

共享变数

DataFrames与Spark SQL

撰写第一个Spark程序

PySpark ETL实战

PySpark分布式机器学习