2023.03.15 加入,已入驻 425 天。
项目职责:使用Python完成10万+数据清洗工作,包括异常值剔除、缺失值补全等。 对年龄、收入等连续变量进行分箱处理,以此来减少数据噪音和极端值的影响。 建立逻辑回归模型,并制作评分卡。最终模型准确率不到70%,总结在分箱步骤需要进行更精细化处理,例如运用随机森林 等模型对数据进行训练分类。