理解机 调用 ML 模型的 Spark SQL 框架开源项目

我要开发同款
匿名用户2023年03月02日
54阅读
开发技术Python
所属分类人工智能、机器学习/深度学习
授权协议Apache-2.0

作品详情

理解机(英文名为Liga,是“理解”的汉语吴音)是一个在SQL引擎中集成机器学习模型能力的通用框架。

理解机的设计目标是:模块化、可扩展、面向任意规模数据。

理解机的设计理念理解机V0.2.x是基于ApacheSpark实现的,这并不意味着理解机是一个基于ApacheSpark的开源项目。SparkSQL仅仅是理解机这套框架想要适配的SQL引擎之一。同样,理解机V0.2.x支持MLflow这个模型注册系统,这并不意味着理解机只能用MLflow这个特定的模型注册系统。理解机V0.2.x支持使用SQL语法将机器学习应用于大规模的数据集。由于模型注册系统可以将模型的训练和预测解耦。当下,我们专注于实现基于理解机框架的模型应用和服务化。理解机是一个通用框架,并不限定具体的领域。视觉理解机是基于理解机框架实现的专注于计算机视觉领域的解决方案。未来,我们还会实现听觉、自然语言处理等领域的专用理解机解决方案。理解机SQL扩展参考SQL:创建模型--CreatemodelCREATE[ORREPLACE]MODELmodel_name[FLAVORflavor][MODEL_TYPEmodel_type][OPTIONS(key1=value1,key2=value2,...)]USING"uri";SQL:管理模型--Describemodel{DESC|DESCRIBE}MODELmodel_name;--ShowallmodelsSHOWMODELS;--DeleteamodelDROPMODELmodel_name;历史

理解机源于ETO公司的Rikai项目,在第四次Tubi黑客马拉松中,理解机的作者们将Rikai项目中扩展SparkSQL实现调用机器学习模型的部分从Rikai项目剥离并重构。

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论