Snorkel是一种快速创建、建模和管理训练数据的系统,目前主要聚焦在加速开发结构化或“黑暗”数据提取的应用程序,该应用程序适用于大规模标注训练集不切实际或不容易获取的领域。
Snorkel基于新的数据编程(dataprogramming)模式,开发人员专注于编写一组标记函数(labelingfunctions),这些函数只是以编程方式标记数据的脚本。由此产生的标签是杂乱的,但Snorkel可自动建模这个过程进行学习,本质上,标签函数比其他的更精确,然后用它来训练最终模型(例如,TensorFlow中的深度神经网络)。
评论