“PySpark实战”的版本间的差异

来自CloudWiki
跳转至: 导航搜索
活用PySpark
RDD的操作与观察
第39行: 第39行:
 
*[[PySpark实战:RDD的操作与观察]]
 
*[[PySpark实战:RDD的操作与观察]]
 
*[[PySpark实战:first操作-获取第一个元素]]
 
*[[PySpark实战:first操作-获取第一个元素]]
*[[PySpark实战:max操作]]
+
*[[PySpark实战:max操作-获取最大元素]]
 
*[[PySpark实战:sum操作]]
 
*[[PySpark实战:sum操作]]
 
*[[PySpark实战:take操作]]
 
*[[PySpark实战:take操作]]

2022年7月31日 (日) 09:23的版本

大数据时代

大数据的瑞士军刀--Spark

Spark实战环境设定

建立Spark环境前提

一分钟建立Spark环境

打造交互式Spark环境

活用PySpark

RDD的操作与观察

共享变数

DataFrames与Spark SQL

撰写第一个Spark程序

PySpark ETL实战

PySpark分布式机器学习

PySpark+Kafka实时项目

Flask版

Django版


路线图

PySpark基础统计

PySpark推荐系统

PySpark+ 机器学习/人工智能

pyspark教程:http://xueai8.com/book/6