Cherokee
1月前来过
全职 · 1000/日  ·  21750/月
工作时间: 工作日8:00-20:00、周末8:00-20:00工作地点: 远程
服务企业: 8家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

15年开发经验,熟悉java, python, nodejs, golang语言及相应的技术栈。
数据库:mysql, mongodb,redis,neo4j
队列:rabbitmq, kafka
大数据:hadoop, habse, spark, storm
在网络爬虫、搜索引擎、智能推荐方面有丰富的经验

工作经历

  • 2014-09-01 -至今上海妙点网络科技有限公司系统架构

    完整的财经资讯智能推荐生态链,包括网络爬虫、数据实时处理、搜索引擎、智能推荐、数据挖掘、创作平台、应用终端( A***硬件)、用户运营系统。我负责整体的系统架构,一些关键环节的设计和代码实现。

  • 2014-02-01 -2014-09-01上海淘米网络科技有限公司高级搜索引擎工程师

    打造移动在线教育平台,一方面汇聚名师,为中小学一对一解答问题,另一方面基于搜索系统的自动答题系统能给学生实时答复。我带领的项目组负责研发自动答题系统,涵盖网络爬虫题库采集、题目解析和索引、问答匹配。

  • 2012-02-01 -2014-02-01久兴信息技术(上海)有限公司搜索引擎研发主管

    打造二手汽车领域的垂直搜索引擎,从互联网聚合大量的二手车信息,数据通过过滤、排重、筛选后进行索引,向用户提供便捷智能的搜索平台。作为项目主管,负责整体架构和主干框架的程序编写(爬虫框架、实时数据处理框架、分词系统、全文检索框架、分布式处理框架)。

  • 2010-05-01 -2012-02-01上海艾克斯网络传播有效公司研发经理

    研发面向 B端市场的在线教育学习平台,以及与淘宝合作的淘宝大学在线学习系统、在线考试系统。我是研发中心负责人,负责系统架构,关键技术突破。

  • 2005-07-01 -2010-03-01云南云游天下旅游电子商务有限公司研发经理

    世博旅游集团控股的电子商务子公司,在集团内部承担信息处职能负责集团公司本部及20多个下属企业的信息化建设,整合集团旅游资源用电子商务信息化手段对外进行推广营销。涉及的项目 ToB的旅游行业 ERP、 BPR系统; ToC的有集团旗下4A景区门户站、云游天下旅行网。本人从开发工程师

教育经历

  • 2018-01-01 - 2020-05-01上海交通大学计算机科学与技术本科

    计算机科学与技术.................

  • 2000-09-01 - 2005-07-01楚雄师范学院初等教育大专

    选修计算机课程,参与校园网建设。..................

技能

HTML5
Node.js
0
1
2
3
4
5
0
1
2
3
4
5
作品
大型智能推荐平台

基于数据挖掘的财经领域智能推荐平台。分布式爬虫采集网页、*、及APP内容、流处理系统实时处理数据入库、离线处理系统对文章及用户行为做数据挖掘、智能推荐系统个性化信息流。包括46个中/后台系统,采用微服务架构。 【技术概要】 ● 编程语言:Java、Nodejs、Python、Go。客户端接口/面向业务的后台/爬虫系统使用Nodejs;对内存和性能比较敏感的中台系统使用JAVA;机器学习和数据挖掘使用Python;部分服务和客户端工具使用Go。用Thrift rpc跨语言相互调用,基于ZK的微服务治理。 ● 数据仓库:Hbase、Mongodb、Mysql、Redis、Neo4J。Hbase累积新闻数据便于spark大规模的文本挖掘;Mongodb存储新闻内容;Mysql用于事务性业务逻辑数据;Redis高速缓存在各系统中普遍运用;Neo4j图数据用于推荐系统及用户标签数据挖掘。 ● 队列系统:RabbitMQ、Kafka、Redis(pubsub),在新闻采集流程、服务端流程、中台系统都充分运用队列系统解决系统解耦及分布式扩展的问题。 ● Nodejs分布式爬虫系统,支持爬虫资源调度,phantomjs/chrome headless动态渲染抓取,*微博抓取,防屏蔽策略,爬虫端运行于ARM开发板,低功耗分布式运行,充分利用ADSL的IP数。 ● 类Storm分布式流处理系统,经过文本解析、规整化、打标签、主题分类、提摘要、配图、广告识别、查重复、评分等环节30秒内处理完毕入库前端信息流中可用。 ● Spark+Hbase做大规模的文本及用户行为挖掘,如:词向量、词关联、标签发现、用户聚类、主题聚类等。 ● Python机器学习项目,如:词语发现、推荐/搜索中的机器学习排序、神经网络模型文章自动配图等。 ● 自研实时推荐系统,从兴趣协同过滤、地理位置、用户聚类、关联推荐、兴趣转移多个角度结合机器学习排序取得较好的兴趣推荐效果,根据文章主题聚类和实时推荐效果回馈调整推荐策略解决用户冷启动问题。 ● 基于ElasticSearch的搜索系统,根据自有标签库对analyzer/normalization做了定制,排序结合文本相关性、时间、文章质量等因素。 ● 面向客户端的后台接口系统采用事件驱动分布式结构,服务端仅接受请求将具体业务处理分发到中台系统,中台系统异步返回结果,服务端再异步返回给客户端。此架构便于根据请求量按需扩展分布式集群规模。 ● 面向*、聊天机器人,开发基于Websocket的对话式交互系统,后台可配置解析规则和动态应答规则(不是固定答案)。 ● 基于ROS、Android的聊天机器人、智能手表定制开发。 ● 财经雷达系统监测关键信息,实时情报推送*和智能手表,推拉结合的Feed流。 ● 后台流媒体系统支撑沉浸式短视频模块(类似抖音),同时兼容横竖屏,视频预载秒开,研发在线直播室。 ● 智能推送系统:个性化内容、个性化推送时间点推送,主流机型(如:华为、小米、oppo)采用系统通道推送,高效送达率。 ● 研发*个人号消息分发系统,及时向用户推送推送财经情报,同时用于公司内部业务操作,对话式处理内容采编、审核、系统预警。 ● 客户端反爬虫,后台接口防嗅探策略。 ● 用户日志、后台服务日志进入kafka,ELK统计,还有另外自研的BI系统。 ● 基于docker,jenkins,k8s的自动化部署和运维。

0
2020-05-22 15:25
更新于: 2020-05-22 浏览: 262