Spark编程基础(Python版)
来自CloudWiki
跳转至:
导航
,
搜索
https://study.163.com/course/introduction.htm?courseId=1209408816#/courseDetail?tab=1
目录
1
章节1:大数据技术概述
2
章节2:Spark的设计与运行原理
3
章节3:Spark环境搭建和使用方法
4
RDD编程基础
章节1:大数据技术概述
云计算,大数据,物联网
Hadoop简介
HDFS相关概念
章节2:Spark的设计与运行原理
Spark概述
RDD
章节3:Spark环境搭建和使用方法
安装Spark
在pyspark中运行代码
开发Spark独立应用程序
Spark集群环境搭建
在集群上运行Spark应用程序
RDD编程基础
视频RDD创建
RDD操作(转换操作之filter,map,flatMap)
RDD操作(转换操作之groupByKey,reduceByKey)
RDD操作(行动操作)
视频持久化
视频分区(分区的作用和原则、设置分区的方法)
导航菜单
个人工具
登录
命名空间
页面
讨论
变种
视图
阅读
查看源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
帮助
工具
链入页面
相关更改
特殊页面
可打印版本
固定链接
页面信息