微调数据集:Text2SQL-中文-180K
https://modelscope.cn/datasets/JinzhangLi/CDC_AI-Lab_Text2SQL_CN_180K/summary
使用方式
pip install transformers -i https://pypi.tuna.tsinghua.edu.cn/simple
安装完成后,您可以使用以下代码来使用本模型
from transformers import AutoTokenizer,AutoModel
model_path="JinzhangLi/CDC_Schema_Query_Align"
Tokenizer=AutoTokenizer.from_pretrained(model_path)
model=AutoModel.from_pretrained(model_path)
Schema="singer{singer id,name,country,song name,song release year,age,is male}"
embedding=model(Tokenizer(Schema,return_tensors="pt").input_ids).pooler_output[0].tolist() #1024维向量
print(embedding)
评测(使用Cspider-dev数据集Query-Schema对进行测试)
模型名称 | top—10 | top-5 | top-3 | top-2 | top-1 |
---|---|---|---|---|---|
CDCSchemaQuery_Align | 0.98 | 0.93 | 0.85 | 0.74 | 0.52 |
M3E-large | 0.93 | 0.82 | 0.70 | 0.62 | 0.45 |
鸣谢以下工作
M3E-Large
https://modelscope.cn/models/Jerry0/M3E-large/summary
评论