Law Game 2024
输入文件预处理
(1) 首先对原始问题进行模型打标 (输出路径为 s1b/data/question_b_with_labels.json
):
python -m react_baseline.get_question_labels
(2) 案件号, 法院名称, 公司名称, 律师事务所名称标准化缓存: 使用 react_baseline/verify_field_value.py:confirm_value
进行处理, 结果放在 s1b/data/confirmed_field_value.json
下:
注意: 此步骤仅仅是缓存并非人工标注, 所有的解法里对 API 的调用都使用了 confirm_value
进行前处理, 只要 confirm_value
的输入刚好在 s1b/data/confirmed_field_value.json
表里时, 可以省去大模型自动纠正的环节
一个例子: 第 41 题 龙龙元建设集团股份有限公司
在 confirmed_field_value.json
并不存在, 但实际运行 merge.py
时仍有可能通过装饰器的形式进行自动纠正
运行
python merge.py
评论