“PySpark实战”的版本间的差异

来自CloudWiki
跳转至: 导航搜索
PySpark分布式机器学习
RDD的操作与观察
 
(未显示同一用户的27个中间版本)
第38行: 第38行:
 
===RDD的操作与观察===
 
===RDD的操作与观察===
 
*[[PySpark实战:RDD的操作与观察]]
 
*[[PySpark实战:RDD的操作与观察]]
*[[PySpark实战:first操作]]
+
*[[PySpark实战:first操作-获取第一个元素]]
*[[PySpark实战:max操作]]
+
*[[PySpark实战:max操作-获取最大元素]]
*[[PySpark实战:sum操作]]
+
*[[PySpark实战:sum操作-求和操作]]
*[[PySpark实战:take操作]]
+
*[[PySpark实战:take操作-获取前n个元素]]
*[[PySpark实战:top操作]]
+
*[[PySpark实战:top操作-获取排名前N位]]
*[[PySpark实战:count操作]]
+
*[[PySpark实战:count操作-获取元素总个数]]
*[[PySpark实战:collect操作]]
+
*[[PySpark实战:collect操作-将RDD类型的数据转化为数组]]
*[[PySpark实战:collectAsMap操作]]
+
*[[PySpark实战:collectAsMap操作-将RDD 转换为Map映射]]
*[[PySpark实战:countByKey操作]]
+
*[[PySpark实战:countByKey操作-统计RDD中每个键的数量]]
*[[PySpark实战:countByValue操作]]
+
*[[PySpark实战:countByValue操作-统计RDD中各个value出现的次数]]
 
*[[PySpark实战:glom操作]]
 
*[[PySpark实战:glom操作]]
 
*[[PySpark实战:coalesce操作]]
 
*[[PySpark实战:coalesce操作]]
第134行: 第134行:
 
*[[PySpark实战:资料清理与变形]]
 
*[[PySpark实战:资料清理与变形]]
 
*[[PySpark实战:认识Pipeline]]
 
*[[PySpark实战:认识Pipeline]]
 +
*[[PySpark实战:逻辑回归原理与应用]]
 +
*[[PySpark实战:决策树原理及应用]]
 +
 +
==PySpark+Kafka实时项目==
 +
===Flask版===
 +
*[[PySpark实战:PySpark+Kafka介绍]]
 +
*[[windows下搭建Kafka环境]]
 +
*[[PySpark实战:Flask环境搭建]]
 +
*[[FLASK搭建网站框架]]
 +
*[[PySpark实战:Kafka和Flask代码实现]]
 +
*数据平台实践①——Flume+Kafka+SparkStreaming(pyspark): https://www.jianshu.com/p/c2e5c347fe60
 +
 +
===Django版===
 +
*[[PySpark实战:PySpark+Kafka+Django介绍]]
 +
*[[windows下搭建Kafka环境]]
 +
*[[在Windows上创建Django项目]]、[[Linux上创建第一个Django 项目]]
 +
*[[PySpark实战:Spark 和Django集成]](还可以考虑通过redis 向前端传递数据)
 +
*数据平台实践①——Flume+Kafka+SparkStreaming(pyspark): https://www.jianshu.com/p/c2e5c347fe60
 +
 +
 +
==路线图==
 +
===PySpark基础统计===
 +
 +
===PySpark推荐系统===
 +
 +
===PySpark+ 机器学习/人工智能===
 +
pyspark教程:http://xueai8.com/book/6

2022年8月5日 (五) 13:36的最新版本

大数据时代

大数据的瑞士军刀--Spark

Spark实战环境设定

建立Spark环境前提

一分钟建立Spark环境

打造交互式Spark环境

活用PySpark

RDD的操作与观察

共享变数

DataFrames与Spark SQL

撰写第一个Spark程序

PySpark ETL实战

PySpark分布式机器学习

PySpark+Kafka实时项目

Flask版

Django版


路线图

PySpark基础统计

PySpark推荐系统

PySpark+ 机器学习/人工智能

pyspark教程:http://xueai8.com/book/6