为了方便测试,我直接用的jupyter notebook.
因为notebook里有所有问题的生成LOG,跟我最高分的提交是完全一样的,你们可以直接检查,都跟我最后提交的是一模一样的。
文件夹:
- ./data就放的question.json
- ./B_tmp是中间的生成文件,调试时候一步步保存过程的
- ./code 就是全部的代码
- ./code/db就是存缓存省tooken的,用的csv存缓存。
运行
没装什么特殊的包 接着其他人的程序运行估计包都装好了。 运行方式就是 notebook 0,1,2,3,4,5.
介绍
- 0. 把json 转成 csv
- 1.2. 解决2类生成文档问题,诉讼文书和整合报告
- 3. 给问题分类,分类方式就是让CHAT程序帮忙分类,分类为提到公司的,提到案号的,提到律所的,提到法院的,提到地址的。
- 4. 按不同分类解决问题,先把只有地址的解决,再搞律所和法院,摘要的,案号的,公司的,剩下的简单的,其他所有的。
- 5. csv转json,变成提交文件
备注
因为是初赛,我想着审核主要就是看是不是手动的,所以昨天最后运行时候,都整合了下运行直接带LOG的,大家都方便。 如果你们想重新运行应该可以生成分数差不多的,但是回答肯定不会完全一样,因为我是问CHAT让他回答的方式解决问题的temperature = 0.2就是回答还是会每次有些变化的。 如果重新运行,不要用我的TOOKEN,不多了。。 有啥问题再联系
评论