[PySpark] 액션 –
Thomas Dramab과 Denny Lee의 “Learning PySpark”를 보면서 학습 과정을 기록한 기록입니다♪ .count(…) 함수 – 항목 수를 계산 >>> data_reduce = sc.parallelize((1, 2, .5, .1, 5, .2), 3) >>> data_reduce.count() 6 → 6개 이상의 요소수에 따라 출력 .saveAsTextFile(…) 함수 – RDD를 텍스트 파일로 저장 – 별도의 파일에 각 파티션! >>> data_key = sc.parallelize( … ((‘a’, 4), … Read more