机器学习:多一个常数列,以及get_dummies(drop_first=True/False)对预测结果的影响
总结
多一个常数列
get_dummies(drop_first=True/False)
总结
多一个常数列
get_dummies(drop_first=True/False)
场景:一个df,有categorized columns,经过one-hot以后用于训练某些模型;训练好了以后现在修改了这个df的categorized columns的内容,由于某些原因,导致【可能有原本存在的feature丢失】,而且我们并不知道是否丢失/丢了多少类/丢了哪些类。
主要回忆多年前刚开始玩这个游戏的几个存档以及2024年六月的复健(复健失败,一把都没打完)
即使保持测试电脑的网络环境不变,也还有各种不可控的上游影响因素:家庭宽带的上游ISP、cloudflare、服务器的ISP、服务器的机房甚至服务器的母鸡网络环境...都会影响测试的结果。所以这篇笔记并没有什么价值。