对于原开源项目进行改进并且开发了作者信息提取工具;可以从网页中提取网页正文,作者信息以及网页发布日期;已与原开源软件有了数次分支合并操作。在本项目中,我使用了Python对于多种逻辑进行改正以及提升,最终在针对于中文网页优化方面提升了8%准确率。
评论