OLAP查询代理

我要开发同款
飞有飞言2022年09月23日
140阅读

作品详情

项目描述: 数据平台同时存在Hive, SparkThriftServer, Impala等几种数据查询服务. 并且没有权限验证
功能.
开发本项目是为了解决
1. 统一入口+权限认证
2. SQL记录和分析
3. 队列自动选择
2018/09-2019/12
2019/04-2019/05代理实现了hive的thrift server, 客户端使用datagrip(使用hive jdbc)或者hive jdbc、python hive clien
t等可以方便连接到查询代理, 执行sql语句.
代理首先认证用户(使用公司统一认证中心), 在用户提交SQL时, 分析SQL使用到的表、视图, 然后查询
用户是否拥有读权限. 没有权限的用户请求会被拒绝执行.权限检查通过的SQL会交由后端的hive, sts或
者impala执行.
后端hive, sts或impala都是多实例部署, 一开始采用随机选择后端服务策略, 计划实现根据SQL来选择
不同后端的策略(快慢、优先级等)
用户执行的SQL都会保存下来, 进行批量分析, 找到其中的问题, 对用户提出优化建议.还可以辅助找到对
常用的表, 进行优化, 加快执行速度.
使用技术 scala thrift mysql nginx
项目职责: 架构、开发、辅助分析
项目业绩: 每天执行数万条SQL, 辅助找到使用量占80%的表, 提供优化策略
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论