MatchZoo是中科院开源的一个文本匹配工具包。它着重于让大家更直观地了解深度文本匹配模型的设计、对比和共享。
架构
MatchZoo 有三个主要模块,分别为数据预处理、模型构建和训练与评测。它基于Keras开发,支持TensorFlow、CNTK及Theano,并能在CPU与GPU上无缝运行。
基准测试下面,以WikiQA数据集来举例说明MatchZoo的用法。
以DRMM为例,运行:
python main.py --phase train --model_file models/wikiqa_config/drmm_wikiqa.config在测试时可运行:
python main.py --phase predict --model_file models/wikiqa_config/drmm_wikiqa.config十个模型的比较结果如下:
loss训练曲线图如下:
MAP性能测试曲线图如下:
评论