1. 写在前面
零基础入门数据挖掘系列是记录自己在Datawhale举办的数据挖掘专题学习中的所学和所想, 该系列笔记使用理论结合实践的方式,整理数据挖掘相关知识,提升在实际场景中的数据分析、数据清洗,特征工程、建模调参和模型融合等技能。所以这个系列笔记共五篇重点内容,也分别从上面五方面进行整理学习,既是希望能对知识从实战的角度串联回忆,加强动手能力的锻炼,也希望这五篇笔记能够帮助到更多喜欢数据挖掘的小伙伴,我们一起学习,一起交流吧。
既然是理论结合实践的方式,那么我们是从天池的一个二手车交易价格预测比赛出发进行学习,既可以学习到知识,又可以学习如何入门一个数据竞赛, 下面我们开始吧。
今天是零基础入门数据挖掘的第一天,今天只是先放一个学习路径的思维导图,可以帮助梳理数据挖掘步骤和用到的技术, 类似于一个思维的大框架吧(该图来自Datawhale团队):
接下来的14天时间,我们从一个二手车价格预测的比赛出发,围绕这个大框架进行展开,分为六篇文章学习上面的细节部分。
PS:本次数据挖掘路径学习,专题知识将在天池分享,详情可关注公众号Datawhale.