proginn1043215125架构师-程序员客栈

1月前来过

资深数据架构师

深圳

全职 · 1000/日 · 21750/月信用一般

工作时间: 工作日09:00-17:30、周末09:00-17:30工作地点: 远程

服务企业: 0家累计提交: 0工时

联系方式:

********

查看联系方式

聊一聊

使用APP扫码聊一聊

去下载APP

个人主页

我是 程序员客栈的陈云亮，一名 资深架构师。

毕业于 中山大学，曾担任某独角兽企业的 资深数据架构师，在数据架构与系统设计领域积累了丰富的实战经验。

至今已主导并参与 10 余个项目的开发与管理，涵盖 大数据平台、数据治理、分布式计算 等方向。

技术栈涵盖多个核心领域：

大数据技术：精通 Hive、HBase、HDFS、Spark、Flink，具备高效数据处理与优化能力。后端开发：熟练掌握 Java、Python、Shell、C++，具备强大的系统研发与优化能力。数据库技术：深入研究 MySQL、PostgreSQL、Greenplum、Oracle、MPPDB，擅长数据库架构设计与性能调优。

致力于推动企业级 数据架构优化、数据中台建设与技术创新，助力企业实现数据驱动增长。

2018-12-28 -至今华傲数据资深数据架构师
根据企业业务需求，制定数据架构蓝图（Data Architecture Blueprint）。设计数据存储、计算、流转、治理等核心组件的架构方案。确保数据架构与企业 IT 架构（如微服务、大数据平台、云计算等）保持一致。评估并选择适合业务场景的数据库（如 GaussDB、Oracle、PostgreSQL、MySQL、ClickHouse 等）。设计OLTP（在线事务处理）和 OLAP（在线分析处理）架构，如数据湖+数仓融合架构。规划分布式存储、分区、索引、缓存策略，优化数据查询性能。设计关系型数据库（ER 模型），包括概念、逻辑、物理模型。设计数据仓库（Dimensional Modeling）、数据湖架构（Lakehouse）、数据中台架构。规范数据模型标准（如数据命名规范、主键外键策略）。设计ETL/ELT 数据管道，优化数据同步、增量更新。采用Kafka、Flink、Airflow 等工具进行实时/离线数据处理。设计数据 API、消息队列，确保系统间的数据高效流转。

2006-09-01 - 2009-06-01中山大学计算机本科

英语

普通话

Python

Shell

Kafka

Nginx

postgres

Java

MySQL

Oracle

系统架构

作品

dbt-gaussdbdws

1.在数据分析与建模领域，dbt-core（Data Build Tool）是一个广泛使用的 SQL 转换工具，能够简化数据建模、转换和治理流程。然而，原生 dbt-core 并不支持华为 GaussDB，导致以下问题：无法直接在 GaussDB 上运行 dbt 模型，数据分析和转换需要额外的 SQL 脚本或 ETL 工具。缺乏标准化的数据建模流程，使团队难以协作，增加了数据治理的复杂度。数据测试与质量控制困难，无法利用 dbt 的测试功能检查数据一致性和正确性。本项目适配 dbt-core 以支持 GaussDB，解决了这些问题，使数据团队能够：直接在 GaussDB 上运行 dbt 转换、数据建模和数据质量测试。采用 SQL + Jinja 进行标准化数据处理，提高数据一致性和可维护性。利用 dbt 的 lineage（血缘追踪）功能，轻松管理数据依赖关系。提升数据开发效率，减少 ETL 代码维护成本。 2.技术选型数据库连接：使用 dbt Adapter（dbt-gaussdbdws），适配 GaussDB。 SQL 解析：基于 Jinja 模板引擎，支持 SQL 代码参数化和复用。数据测试：集成 dbt Tests，可对 GaussDB 表进行数据质量检查。数据血缘分析：dbt 原生支持数据血缘关系，可视化展示表间依赖。调度与执行：可以与 Airflow、Dagster 等调度工具集成，实现自动化数据处理。 3.可以参考【https://bbs.huaweicloud.com/blogs/442659】快速上手。

2025-02-10 11:23

OpenMetadata

1.在数据治理领域，元数据管理是核心环节。OpenMetadata 是一个开源的元数据管理平台，能够提供数据发现、数据血缘分析、数据质量管理等功能。然而，原生 OpenMetadata 并不直接支持华为 GaussDB，这导致在使用 GaussDB 作为数据源时，缺乏有效的元数据管理工具。本项目适配了 OpenMetadata 以支持 GaussDB，解决了以下问题：元数据采集：通过适配 GaussDB，使 OpenMetadata 能够自动采集数据库的表、列、索引、存储过程等元数据信息。数据血缘分析：支持 GaussDB 相关的数据血缘追踪，帮助用户理解数据的流向和依赖关系。数据质量监控：在 OpenMetadata 现有框架下，扩展了对 GaussDB 数据质量规则的支持，提高数据治理能力。统一数据目录：让 GaussDB 的数据资产可以在 OpenMetadata 统一管理，与其他数据源（如 MySQL、PostgreSQL、HDFS）无缝集成。 2.本项目的核心技术栈基于 OpenMetadata，同时引入了适配 GaussDB 的技术方案。技术选型数据库连接：采用 JDBC 适配 GaussDB，使 OpenMetadata 能够与 GaussDB 进行高效通信。数据提取：使用 OpenMetadata Ingestion Framework，并扩展支持 GaussDB，能够定期或实时同步数据库中的元数据。 API 设计：利用 OpenMetadata 的 REST API，支持通过 API 访问和管理 GaussDB 的元数据。存储与索引：元数据存储采用 Elasticsearch，确保数据查询速度快，同时支持全文搜索。技术特点高效的元数据采集：基于 OpenMetadata 原生 ingestion 机制，优化了对 GaussDB 的适配，支持增量同步和定期扫描。数据血缘可视化：通过 OpenMetadata UI，提供 GaussDB 数据血缘关系图，便于分析数据流转情况。安全与权限控制：集成 OpenMetadata 的 RBAC（基于角色的访问控制），确保不同用户对 GaussDB 数据的访问权限受控。可扩展性：支持与其他数据源（如 Kafka、MongoDB、Hive）一起管理，适用于复杂的数据治理场景。 3.本项目基于 OpenMetadata，提供了适配 GaussDB 的完整安装指南，用户可以通过参考【https://bbs.huaweicloud.com/blogs/445193】快速上手。

2025-02-10 11:10

更新于: 02-10 浏览: 56

个人介绍

工作经历

教育经历

语言

技能

相似推荐换一批

重点城市程序员兼职推荐

重点岗位程序员兼职推荐