TabML 表格数据的机器学习管道开源项目

我要开发同款
匿名用户2021年09月14日
30阅读
开发技术Python
所属分类人工智能、机器学习/深度学习
授权协议Apache-2.0

作品详情

TabML旨在创建一个通用的机器学习框架来处理表格数据。 主要特点:

处理表格数据的最重要任务之一是处理特征提取。TabML允许用户独立定义多个功能,而不必担心其他功能。如果你的团队有多个成员同时开发不同的功能,这有助于减少编码冲突。此外,如果需要更新一项功能,则可以不涉及不相关的功能。通过这种方式,计算成本相对较小(与运行管道以重新生成所有其他特征相比)。

参数在配置文件中指定为protobuf文件。每次训练后,此配置文件会自动保存到实验文件夹中,以实现可重复性。

TabML与 MLflow集成,允许用户跟踪所有模型参数和指标。

支持表格数据的多个ML包:

LightGBM

XGBoost

CatBoos

 

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论