Spark
2055 ワード
1.特徴
スパークコア
- RDD(Resilient Distributed Datasets)
-MRとは異なり、メモリに格納および処理が高速であることを示すデータセット
-メモリの特性上、エラーが発生した場合、すべてのデータが失われます.
-この問題を解決するデータ構造はRDD
-読み取り専用構造は変更されていません
-
Spark SQL
スパークフロー
スパークMLlib
噴火パターンX
RDD
- immutable, Read-only
-Datasource->RDD、RDD->RDDにのみ変更できます.
-リソースが配備されることを事前に考慮し、最適なルートを迂回できます.
-Sparkを使用するには、SparkContextオブジェクトを作成する必要があります.
SparkConf conf = new SparkConf().setAppName(appName).setMaster(local/spark);
JavaSparkContext sc = new JavaSparkContext(conf);
- appName : cluster UI에서 보이는 Application Name
- master : spark, mesos, yarn cluster url, local mode
- cluster mode : 자원 관리 프레임워크
- local: local 환경에서 사용할수 있는 mode
- spark : spark standalone
Reference
この問題について(Spark), 我々は、より多くの情報をここで見つけました https://velog.io/@kht1997/Sparkテキストは自由に共有またはコピーできます。ただし、このドキュメントのURLは参考URLとして残しておいてください。
Collection and Share based on the CC Protocol