描述:
这个项目是一个AI基础平台组件服务,提供了数据治理、服务发现、自然语言处理、OCR图片文字识别等多个方面的API接口。其中数据治理部分包括字段中英文信息自动补齐接口、业务术语全量或增量更新接口、字段、标准数据全量或增量更新接口、标准智能落标接口、标准相似计算接口,服务发现部分仅介绍了1个服务测试接口,自然语言处理部分包括多个API接口,如命名实体识别、敏感词处理、基础分词、中文转拼音等,OCR图片文字识别部分主要介绍了OCR敏感词文件解析和PDF文件文字识别接口。该项目提供了丰富的文本处理工具和数据处理方式,旨在帮助开发者提高人工智能处理文本的效率和准确度
主要模块:
数据治理模块、自然语言处理模块、OCR识别模块
负责主要模块:
1、负责实现OCR敏感词文件解析、OCR图片、PDF文字识别。
2、负责实现敏感词识别、敏感词规则。
3、负责实现文本语义相似度、重新加载自定义词典、命名实体识别。
4、负责实现字段中英文信息自动补齐、标准智能落标。
主要技术栈:
Spring Boot、Spring Cloud Config、Nacos、OpenFeign、Lombok、JU