“PySpark实战”的版本间的差异

来自CloudWiki
跳转至: 导航搜索
PySpark+Kafka实时项目
RDD的操作与观察
 
(未显示同一用户的18个中间版本)
第38行: 第38行:
 
===RDD的操作与观察===
 
===RDD的操作与观察===
 
*[[PySpark实战:RDD的操作与观察]]
 
*[[PySpark实战:RDD的操作与观察]]
*[[PySpark实战:first操作]]
+
*[[PySpark实战:first操作-获取第一个元素]]
*[[PySpark实战:max操作]]
+
*[[PySpark实战:max操作-获取最大元素]]
*[[PySpark实战:sum操作]]
+
*[[PySpark实战:sum操作-求和操作]]
*[[PySpark实战:take操作]]
+
*[[PySpark实战:take操作-获取前n个元素]]
*[[PySpark实战:top操作]]
+
*[[PySpark实战:top操作-获取排名前N位]]
*[[PySpark实战:count操作]]
+
*[[PySpark实战:count操作-获取元素总个数]]
*[[PySpark实战:collect操作]]
+
*[[PySpark实战:collect操作-将RDD类型的数据转化为数组]]
*[[PySpark实战:collectAsMap操作]]
+
*[[PySpark实战:collectAsMap操作-将RDD 转换为Map映射]]
*[[PySpark实战:countByKey操作]]
+
*[[PySpark实战:countByKey操作-统计RDD中每个键的数量]]
*[[PySpark实战:countByValue操作]]
+
*[[PySpark实战:countByValue操作-统计RDD中各个value出现的次数]]
 
*[[PySpark实战:glom操作]]
 
*[[PySpark实战:glom操作]]
 
*[[PySpark实战:coalesce操作]]
 
*[[PySpark实战:coalesce操作]]
第140行: 第140行:
 
===Flask版===
 
===Flask版===
 
*[[PySpark实战:PySpark+Kafka介绍]]
 
*[[PySpark实战:PySpark+Kafka介绍]]
*[[PySpark实战:Kafka和Flask环境搭建]]
+
*[[windows下搭建Kafka环境]]
 +
*[[PySpark实战:Flask环境搭建]]
 
*[[FLASK搭建网站框架]]
 
*[[FLASK搭建网站框架]]
 
*[[PySpark实战:Kafka和Flask代码实现]]
 
*[[PySpark实战:Kafka和Flask代码实现]]
第147行: 第148行:
 
===Django版===
 
===Django版===
 
*[[PySpark实战:PySpark+Kafka+Django介绍]]
 
*[[PySpark实战:PySpark+Kafka+Django介绍]]
*[[PySpark实战:Kafka和Django环境搭建]]
+
*[[windows下搭建Kafka环境]]
*[[在Windows上创建Django项目]]
+
*[[在Windows上创建Django项目]]、[[Linux上创建第一个Django 项目]]
*[[Linux上创建第一个Django 项目]]
+
*[[PySpark实战:Spark 和Django集成]](还可以考虑通过redis 向前端传递数据)
 +
*数据平台实践①——Flume+Kafka+SparkStreaming(pyspark): https://www.jianshu.com/p/c2e5c347fe60
 +
 
 +
 
 +
==路线图==
 +
===PySpark基础统计===
  
*[[FLASK搭建网站框架]]
+
===PySpark推荐系统===
*[[PySpark实战:Kafka和Flask代码实现]]
+
 
*数据平台实践①——Flume+Kafka+SparkStreaming(pyspark): https://www.jianshu.com/p/c2e5c347fe60
+
===PySpark+ 机器学习/人工智能===
 +
pyspark教程:http://xueai8.com/book/6

2022年8月5日 (五) 13:36的最新版本

大数据时代

大数据的瑞士军刀--Spark

Spark实战环境设定

建立Spark环境前提

一分钟建立Spark环境

打造交互式Spark环境

活用PySpark

RDD的操作与观察

共享变数

DataFrames与Spark SQL

撰写第一个Spark程序

PySpark ETL实战

PySpark分布式机器学习

PySpark+Kafka实时项目

Flask版

Django版


路线图

PySpark基础统计

PySpark推荐系统

PySpark+ 机器学习/人工智能

pyspark教程:http://xueai8.com/book/6