proginn1043215125
9天前在线
全职 · 1000/日  ·  21750/月
工作时间: 工作日09:00-17:30、周末09:00-17:30工作地点: 远程
服务企业: 0家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

我是 程序员客栈的陈云亮,一名 资深架构师

毕业于 中山大学,曾担任某独角兽企业的 资深数据架构师,在数据架构与系统设计领域积累了丰富的实战经验。

至今已主导并参与 10 余个项目的开发与管理,涵盖 大数据平台、数据治理、分布式计算 等方向。

技术栈涵盖多个核心领域:

大数据技术:精通 Hive、HBase、HDFS、Spark、Flink,具备高效数据处理与优化能力。后端开发:熟练掌握 Java、Python、Shell、C++,具备强大的系统研发与优化能力。数据库技术:深入研究 MySQL、PostgreSQL、Greenplum、Oracle、MPPDB,擅长数据库架构设计与性能调优。

致力于推动企业级 数据架构优化、数据中台建设与技术创新,助力企业实现数据驱动增长。

工作经历

  • 2018-12-28 -至今华傲数据资深数据架构师

    根据企业业务需求,制定 数据架构蓝图(Data Architecture Blueprint)。 设计 数据存储、计算、流转、治理 等核心组件的架构方案。 确保数据架构与企业 IT 架构(如微服务、大数据平台、云计算等)保持一致。 评估并选择适合业务场景的数据库(如 GaussDB、Oracle、PostgreSQL、MySQL、ClickHouse 等)。 设计OLTP(在线事务处理) 和 OLAP(在线分析处理) 架构,如 数据湖+数仓融合架构。 规划分布式存储、分区、索引、缓存策略,优化数据查询性能。 设计关系型数据库(ER 模型),包括 概念、逻辑、物理模型。 设计数据仓库(Dimensional Modeling)、数据湖架构(Lakehouse)、数据中台架构。 规范数据模型标准(如数据命名规范、主键外键策略)。 设计ETL/ELT 数据管道,优化数据同步、增量更新。 采用Kafka、Flink、Airflow 等工具进行 实时/离线数据处理。 设计数据 API、消息队列,确保系统间的数据高效流转。

教育经历

  • 2006-09-01 - 2009-06-01中山大学计算机本科

技能

Kafka
Nginx
postgres
MySQL
Oracle
系统架构
0
1
2
3
4
5
0
1
2
3
4
5
作品
dbt-gaussdbdws

1.在数据分析与建模领域,dbt-core(Data Build Tool) 是一个广泛使用的 SQL 转换工具,能够简化数据建模、转换和治理流程。然而,原生 dbt-core 并不支持华为 GaussDB,导致以下问题: 无法直接在 GaussDB 上运行 dbt 模型,数据分析和转换需要额外的 SQL 脚本或 ETL 工具。 缺乏标准化的数据建模流程,使团队难以协作,增加了数据治理的复杂度。 数据测试与质量控制困难,无法利用 dbt 的测试功能检查数据一致性和正确性。 本项目适配 dbt-core 以支持 GaussDB,解决了这些问题,使数据团队能够: 直接在 GaussDB 上运行 dbt 转换、数据建模和数据质量测试。 采用 SQL + Jinja 进行标准化数据处理,提高数据一致性和可维护性。 利用 dbt 的 lineage(血缘追踪)功能,轻松管理数据依赖关系。 提升数据开发效率,减少 ETL 代码维护成本。 2.技术选型 数据库连接:使用 dbt Adapter(dbt-gaussdbdws),适配 GaussDB。 SQL 解析:基于 Jinja 模板引擎,支持 SQL 代码参数化和复用。 数据测试:集成 dbt Tests,可对 GaussDB 表进行数据质量检查。 数据血缘分析:dbt 原生支持数据血缘关系,可视化展示表间依赖。 调度与执行:可以与 Airflow、Dagster 等调度工具集成,实现自动化数据处理。 3.可以参考【https://bbs.huaweicloud.com/blogs/442659】 快速上手。

0
2025-02-10 11:23
OpenMetadata

1.在数据治理领域,元数据管理是核心环节。OpenMetadata 是一个开源的元数据管理平台,能够提供数据发现、数据血缘分析、数据质量管理等功能。然而,原生 OpenMetadata 并不直接支持华为 GaussDB,这导致在使用 GaussDB 作为数据源时,缺乏有效的元数据管理工具。 本项目适配了 OpenMetadata 以支持 GaussDB,解决了以下问题: 元数据采集:通过适配 GaussDB,使 OpenMetadata 能够自动采集数据库的表、列、索引、存储过程等元数据信息。 数据血缘分析:支持 GaussDB 相关的数据血缘追踪,帮助用户理解数据的流向和依赖关系。 数据质量监控:在 OpenMetadata 现有框架下,扩展了对 GaussDB 数据质量规则的支持,提高数据治理能力。 统一数据目录:让 GaussDB 的数据资产可以在 OpenMetadata 统一管理,与其他数据源(如 MySQL、PostgreSQL、HDFS)无缝集成。 2.本项目的核心技术栈基于 OpenMetadata,同时引入了适配 GaussDB 的技术方案。 技术选型 数据库连接:采用 JDBC 适配 GaussDB,使 OpenMetadata 能够与 GaussDB 进行高效通信。 数据提取:使用 OpenMetadata Ingestion Framework,并扩展支持 GaussDB,能够定期或实时同步数据库中的元数据。 API 设计:利用 OpenMetadata 的 REST API,支持通过 API 访问和管理 GaussDB 的元数据。 存储与索引:元数据存储采用 Elasticsearch,确保数据查询速度快,同时支持全文搜索。 技术特点 高效的元数据采集:基于 OpenMetadata 原生 ingestion 机制,优化了对 GaussDB 的适配,支持增量同步和定期扫描。 数据血缘可视化:通过 OpenMetadata UI,提供 GaussDB 数据血缘关系图,便于分析数据流转情况。 安全与权限控制:集成 OpenMetadata 的 RBAC(基于角色的访问控制),确保不同用户对 GaussDB 数据的访问权限受控。 可扩展性:支持与其他数据源(如 Kafka、MongoDB、Hive)一起管理,适用于复杂的数据治理场景。 3.本项目基于 OpenMetadata,提供了适配 GaussDB 的完整安装指南,用户可以通过参考【https://bbs.huaweicloud.com/blogs/445193】 快速上手。

0
2025-02-10 11:10
更新于: 02-10 浏览: 28