硅基未来式 数据感知 看表头维度:查看表头数据,有哪些维度 拆分:拆分训练集、测试集 分布:查看各个维度的分布 相关性:查看各个维度之间的相关性 复合相关性:查看符合维度(维度之间的计算)的相关性 准备 清理:剔除、填充 异常数据 预处理:文本、分类数据处理(One-Hot Encoding) 特征缩放:(MinMax:减去最小值,再除以 最大值-最小值的差;标准化) transformer、transformerPipeline 选择与训练模型 在训练集上,训练与评估 交叉校验(Cross Validation) FineTune 网格搜索(GridSearch) 随机搜索(RandomSearch) 分析最佳模型 在测试集上评估系统 用joblib持久化模型