主要任务:批量拆分word中的结构化标题和对应内容,储存为json格式。处理工具:python doc, pywin32, pandas等。达到目标:将大量word文件转换成python可识别可处理的结构化数据。
评论