摘要:
背景:变应性鼻炎是一种慢性疾病,在日常生活中有多种危险因素使人容易罹患变应性鼻炎,包括接触变应原和吸入刺激物。分析可能诱发变应性鼻炎的潜在危险因素,可为患者在日常生活中减少其发生提供参考。目前关于变应性鼻炎危险因素的研究多基于调查方法,可能针对特定人群和特定场所。因此,它们可能对患者的广泛危险因素提供有限的见解。
目的:社交媒体平台的存在让用户可以分享经验和观点。本研究旨在构建基于社交媒体评论识别变应性鼻炎危险因素的智能方法(TopicS-ClusterREV)。
方法:检索知乎"变应性鼻炎"主题下2012年5月至2022年5月的所有数据,获得9,628条帖子和33,747条评论。首先,我们半自动构建主题词列表,通过增加预测中心词主题的任务来训练主题增强的词向量表示(topic-enhanced word vector representation, TopicS),对Skip-gram模型进行改进。然后,我们对包含危险因素的手动注释文本项进行矢量化,并训练危险因素分类器。最后,我们将这些分类文本分组,以更好地理解识别出的危险因素。
结果:我们的模型检查了3