处理表格数据的最重要任务之一是处理特征提取。TabML允许用户独立定义多个功能,而不必担心其他功能。如果你的团队有多个成员同时开发不同的功能,这有助于减少编码冲突。此外,如果需要更新一项功能,则可以不涉及不相关的功能。通过这种方式,计算成本相对较小(与运行管道以重新生成所有其他特征相比)。
参数在配置文件中指定为protobuf文件。每次训练后,此配置文件会自动保存到实验文件夹中,以实现可重复性。
TabML与 MLflow集成,允许用户跟踪所有模型参数和指标。
支持表格数据的多个ML包:
LightGBM
XGBoost
CatBoos
评论