DatabricksコミュニティエクスペリエンスPySpark#2の使用
4032 ワード
Intro
Contents
[
最初に作成した鍵を、前の
import collections
from pyspark.sql import SparkSession
spark = SparkSession.builder.appName('GCSFilesRead').getOrCreate()
lines = spark.sparkContext.textFile("gs://ehddnr301/movies/u.data")
ratings = lines.map(lambda x: x.split()[2])
result = ratings.countByValue()
sortedResult = collections.OrderedDict(sorted(result.items()))
for k, v in sortedResult.items():
print(k, ' ', v)
Outro
Reference
この問題について(DatabricksコミュニティエクスペリエンスPySpark#2の使用), 我々は、より多くの情報をここで見つけました https://velog.io/@ehddnr/Databricks-로-무료로-PySpark-체험하기-2テキストは自由に共有またはコピーできます。ただし、このドキュメントのURLは参考URLとして残しておいてください。
Collection and Share based on the CC Protocol