spark中cache是缓存数据,默认是缓存在内存中,其本质还是调用persist()
查看答案
关于spark中数据倾斜引发原因正确的选项有()
A. key本身分布不均衡
B. 计算方式有误
C. 过多的数据在一个task里面
D. shuffle并行度不够
下列函数中参数必须为空的有()
A. readLine
B. readInt
C. readDouble
D. readChar
spark的存储级别包含()
A. MEMORY_ONLY
B. MEMORY_ONLY_SER
C. MEMORY
D. MEMORY_AND_DISK_SER