最近开始学《数据科学方法与实践 ——基于 Python 技术实现》这门课,书里从数据清洗、特征工程到建模评估讲得挺连贯,代码示例也是用Python一步一跑,刚上手觉得挺友好。不过半学期下来发现课后练习不多,很多实战细节还靠自己摸索,遇到报错经常卡住。
真心想找些配套的习题集或者项目案例来练手,比如Kaggle入门赛的解析或者小数据集的全流程代码。听说有些平台有同步的实操题,但不确定哪些最适合跟这本书搭配——主要是想练会书上那些pandas和sklearn的用法,最好能有带注释的对照版本。
现在学习方法基本就是边看书边敲代码,可遇到调参和特征选择时总觉得经验不够。有没有学长学姐分享过这本书的学习顺序?比如先跳过哪些章节,或者配合哪个视频课效率更高?作业里自己搭建的模型总比别人差一点,求指点~