南开大学计算机学院在读大四学生一枚,会c/c++和python,曾制作过一个基于hadoop的航空大数据分析软件,制作过一个基于布尔检索的小型搜索引擎的deemo,语言方面,通过了英语六级,目前正在做一个基于spark平台的,利用kd树数据结构制作的kmeans聚类算法,算法在iris数据集上能跑出百分之90的准确度,还在加速过程中,操作系统方面,曾系统研究过清华大学制作的ucore操作系统并完成了前5个lab

高考作文摘要提取系统,可以算是对一篇论文的复现,利用结巴分词,对文章进行分词,然后去停用词,之后利用word2vec模型将句子转化为向量,根据向量计算文本中心,筛选出与中心最相关的几句话,作成作文摘要
02021-12-18 03:51

信息检索大作业,基于布尔检索,支持模糊搜索,拼写矫正,从位置索引开始,一行一行地进行搜索,可以搜索多个词语拼成的句子,只可惜是用命令行窗口
02021-12-18 03:47

实习实训的项目,在hadoop系统下,利用mapreduce计算框架,进行航空用户数据的分析,并把分析结果,利用java的spring框架,显示在网页里
02021-12-18 03:43