通过机器学习中特征工程的分析与研究,对数据进行缺失值处理,在处理缺失值的时候,使用了随机森林算法进行数据补充,然后进行归一化,标准化等特征预处理,最后使用降维操作,与原维度数据进行对比,通过matplotlib对数据进行可视化,使用sklearn,学习曲线确定接口超参数,使用嵌入法对特征矩阵进行选择,能够提高模型运行时间的同时,保证预测准确度
评论