cuDF GPU DataFrame库开源项目

我要开发同款
匿名用户2019年08月06日
204阅读

技术信息

开源地址
https://gitee.com/mirrors/cuDF
授权协议
Apache

作品详情

cuDF基于ApacheArrow柱状内存格式构建,是一个GPUDataFrame库,用于加载,连接,聚合,过滤和操作数据。

cuDF提供了类似padas的API,数据工程师和数据科学家都很熟悉它们,因此他们可以使用它轻松加快工作流程,而无需深入了解CUDA编程的细节。

例如,以下代码段下载CSV,然后使用GPU将其解析为行和列并运行计算:

importcudf,io,requestsfromioimportStrigIOurl="https://github.com/plotly/datasets/raw/master/tips.csv"cotet=requests.get(url).cotet.decode('utf-8')tips_df=cudf.read_csv(StrigIO(cotet))tips_df['tip_percetage']=tips_df['tip']/tips_df['total_bill']*100#displayaveragetipbydiigpartysizeprit(tips_df.groupby('size').tip_percetage.mea())

输出结果:

size121.729201548727808216.571919173482897315.215685473711837414.594900639351332514.149548965142023615.622920072028379Name:tip_percetage,dtype:float64

功能介绍

cuDF 基于Apache Arrow柱状内存格式构建,是一个GPU DataFrame库,用于加载,连接,聚合,过滤和操作数据。 cuDF提供了类似 pandas 的 API,数据工程师和数据...

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论