pyspark sql.SparkSession


documentation - https://spark.apache.org/docs/latest/api/python/reference/pyspark.sql.html#spark-session-apis
sql.SparkSession
  • DataSetとDataFrameAPIを使用してSparkプログラミングのポイントを起動します.
  • Sparkセッションを作成するには、SparkSessionを実行します.builderプロパティを使用する必要があります.
  • sql.SparkSession.builder
  • appName-アプリケーションの名前を設定し、Spark Web UIに
  • を表示します.
  • config - Sets a config option
  • マスター-接続するSparkマスターのURLを設定します.ex)ローカル実行時は「local」、4コアローカル実行時は「local[4]
  • getOrCreate-存在するSparkSessionを読み込みまたは存在しない場合は、コンストラクタに存在するオプションに基づいて1つを生成します.
  • from pyspark import sql
    spark = sql.SparkSession.builder.appName("apis").master("local").getOrCreate()