PySpark实战:max操作-获取最大元素
来自CloudWiki
介绍
max操作,是一个动作算子
获取RDD中最大的一个元素
代码
import findspark findspark.init() ############################################## from pyspark.sql import SparkSession spark = SparkSession.builder \ .master("local[1]") \ .appName("RDD Demo") \ .getOrCreate(); sc = spark.sparkContext ############################################# rdd =sc.parallelize(["a","b","c"]) #max()获取元素最大值 #c print(rdd.max()) rdd =sc.parallelize([1,2,3]) #3 print(rdd.max()) ############################################## sc.stop()
输出
c
3