多线程爬取网站数据, 再用beautifulSoup parse html, 解析目标内容, 对内容过滤并做逻辑加工, 最后已json或csv的形式持久化到磁盘上. 任务输入可以支持多重格式, 比如xlsx, csv, 或者自定义的格式等.
评论