最近我们专业开了《Spark大数据分析与实战(高职)》这门课,教材内容很贴合高职层次,从Spark安装配置讲起,逐步深入到RDD、DataFrame、SQL及流处理等核心模块,每章还配有实际案例和代码示例,感觉挺适合零基础入门的。
学起来发现光看书还是不够,特别希望找到能跟着跑的配套数据集和完整的项目代码,最好再有几套课后练习题和模拟实训的指导。另外,如果配套视频能把书上那些复杂的概念再讲透一点,理解起来会轻松很多。
我自己目前卡在性能调优和Spark SQL优化那部分,代码跑起来总报错或者内存溢出。不知道有没有学过的同学能分享下怎么啃实战章节,是先抄代码再理解,还是直接拿真实日志练手更有效?希望大家给点建议,一起交流进步!