关于Spark和RDD下列说法错误的是()
A: Spark支持三种类型的部署方式:Standalone,SparkonMesos,SparkonYARN
B: 在选择SparkStreaming和Storm时,对实时性要求高(比如要求毫秒级响应)的企业更倾向于选择流计算框架Storm
C: RDD提供的转换接口既适用filter等粗粒度的转换,也适合某一数据项的细粒度转换
D: RDD采用惰性调用,遇到“转换(Transformation)”类型的操作时,只会记录RDD生成的轨迹,只有遇到“动作(Action)”类型的操作时才会触发真正的计算
A: Spark支持三种类型的部署方式:Standalone,SparkonMesos,SparkonYARN
B: 在选择SparkStreaming和Storm时,对实时性要求高(比如要求毫秒级响应)的企业更倾向于选择流计算框架Storm
C: RDD提供的转换接口既适用filter等粗粒度的转换,也适合某一数据项的细粒度转换
D: RDD采用惰性调用,遇到“转换(Transformation)”类型的操作时,只会记录RDD生成的轨迹,只有遇到“动作(Action)”类型的操作时才会触发真正的计算
举一反三
- RDD操作包括转换(Transformation)和动作(Action)两种类型,下列RDD操作属于动作(Action)类型的是
- Spark的RDD的转换会触发Spark计算操作。
- 关于RDD的叙述错误的是? A: RDD是不可变的 B: RDD支持两种类型的操作:转换(Transformation) 和动作(Actions) C: RDD是Spark的核心概念 D: 以上均正确
- Spark对RDD的操作主要分为行动(Action)和转换(Transformation)两种类型,两种类型操作的区别是什么?
- Spark RDD采用了惰性调用,在RDD的执行过程中,真正的计算发生在RDD的“行动”操作,对于“行动”操作之前的所有“转换”操作,仅记录下操作应用的一些基础数据集以及RDD生成的轨迹,并不会出发真正的操作。