Spark
Spark の Python 実行環境である PySpark を Jupyter Notebook で起動する方法です。PySpark 単体だと補完も効かずに使いにくいですが、Jupyter Notebook と組み合わせる事で使い勝手が格段に向上します。
Apache Spark の ペアRDD(PairRDDFunctions)について。
Apache Spark の DoubleRDD(Functions)について。
Apache Spark の RDD について。
Spark アプリケーションの実行コマンドである spark-submit の使用方法と実行のサンプルプログラムです。
Spark のインストールについてまとめました。