个人介绍
工作能力介绍:
1. 5 年互联网公司开发经验,擅长 WEB 系统与后端开发,能独立完成产品从需求分析到实现到部署与运维的所有过程;2. 对分布式、集群、负载均衡、查询优化、容器化、持续集成等有实践经验;3. 有 Hadoop 集群部署与运维经验;4. 有项目负责人经历;5. 有 Flink、Kafka、数据同步等流式数据处理经验;技术栈介绍:
1. 熟悉 Angular、HTML/CSS/JQuery 等前端技术;2. 熟悉 Java 开发与 Spring、Spring-boot、Spring-cloud、Hibernate、Liquibase 等常用开源框架;3. 熟悉 Orcale、MySQL、SQLServer、HBase 等数据库相关技术;4. 熟悉 Zookeeper、ETCD、kafka 等中间件相关技术;5. 熟练 Linux、Docker、持续集成等部署相关技术;6. 熟悉 Git、SVN、Maven、npm 等基础开发工具;7. 熟悉 HDFS、HBase、Yarn 等 Hadoop 相关技术;8. 有使用 Python、C++、Node.js、Spark 开发经验;工作经历
2016-07-06 -至今Newegg高级后端工程师
负责 Hadoop 系统相关监控与自助化平台的研发,负责数据异构同步系统的研发等,熟悉高并发、高性能系统的设计与研发
2015-05-03 -2016-07-01金网安泰软件开发工程师
负责大宗商品电子商务系统的后端研发,曾针对部分会员设计过新的交易算法,使交易量可提升100%以上
教育经历
2011-09-02 - 2015-06-26西华大学计算机科学与技术本科
负责院校网站的开发
技能
项目主要包含以下功能: 1. 自动收集11个线上Hadoop集群的基础信息,包括最新的版本、配置文件、HBase表详情、HDFS目录详情、支持的服务等信息,以供用户与DBA快速查阅; 2. 监控HBase性能数据,并通过计算得到表的大小增长速度、读写速度、Region分布等信息,以协助用户与DBA快速定位问题; 3. 提供用户自助提交HBase DDL以及HDFS目录操作脚本的功能,系统通过语法检查、规范检查、权限检查、传染性检查、审批、限流、定时等手段在保障安全的同时,替代了原本的用户通过邮件交互提交需求的流程,为用户与DBA至少提升效率在90%以上; 4. 根据用户的提交的脚本,自动分析关联表与项目之间的关系,为传染性检测生成参考数据; 5. 提供插件功能,DBA可自定义可运行工具程序,系统会自动解析配置文件,并生成对应的表单界面以供其快速操作; 6. 项目管理、邮件管理、用户管理、权限管理等功能 项目主要基于Spring、Spring MVC、MySQL、SQLServer等技术或框架开发; 该项目自上线以后,使原先需要DBA协助的关于Hadoop相关的工作降低了90%以上,并获得公司2017 Q1优秀项目。
描述: 该项目旨在为公司的开发人员提供一个通用的、在线且实时的数据异构同步平台,目前的主要实现为将 SQLServer 中的数据在线实时或离线同步至 HBase 之中。在平台中,用户只需要进行简单的配置,便可实现数据同步的功能。除此之外,整个平台的主要功能与特点还包括: - 使用流式数据传输,支持限流(速度控制); - 数据同步性能指标实时监控; - 读与写组件支持多任务运行; - 核心同步器节点相互隔离且支持动态横向扩展; - 支持一对多数据同步(单个 SQLServer 数据同步至多个 HBase 集群),且能保证数据的最终一致性; - 支持可扩展的同步器组件(监听器、读取器、写入器); - 用户友好且易于操作的前端管理平台; - 方便的持续集成与项目发布与管理平台; - 同环境下,各组件均为单线程的情况下可达 14000 行每秒的同步速度,多线程高于 20000 行每秒(约 10 cloumn * 10 bytes 大小每行); 实现概述: 项目主要使用 Angular、SpringBoot、Docker、ETCD、MessageQueue、SQLServer、HBase 以及公司自研的 docker 容器管理平台 Humpback、自动化 CI/CD 平台 Gensis、基于 Nginx + Redis 的网关服务 ApiGateway、基于 Mongodb 的云存储服务 CloudData、基于 Zookeeper 的配置中心 ConfigSever 等技术或服务。项目主要分 console、portal、core、master、hbaseWriter 等节点,并采用分布式部署在 docker 集群中。