首页 分享 Study on characteristics of patients and agent consultation in online healthcare consultation: A case study of dxy.com

Study on characteristics of patients and agent consultation in online healthcare consultation: A case study of dxy.com

来源:花匠小妙招 时间:2025-12-11 21:34

Study on characteristics of patients and agent consultation in online healthcare consultation: A case study of dxy.com

随着互联网的兴起和智能手机的普及,“互联网+医疗”从2010年开始萌芽,发展至今已经十余年,在线问诊作为一种重要的在线医疗模式,是线下医院和各级医疗卫生单位的重要补充[1],为慢性病、轻症患者的分诊提供了新的途径和手段[2],有效缓解了线下门诊的压力。当前主流的在线问诊平台有好大夫在线、丁香医生、春雨医生等。通过这些平台,患者可以足不出户与线上医生交流,方便快捷,但在线模式不可避免会给老年患者带来使用障碍,可能导致慢性病患者的就医需求得不到满足,由此产生的代问现象(由他人代理患者向医生咨询)在线上问诊中十分普遍,把握好代问现象和用户特征的特点和变化趋势可以更好地了解中老年患者的切实需求。本文基于“丁香医生”网站所有科室问诊的医患交流文本,同时结合线下医院数据,采用文本分析和数据挖掘的方法,借助各类图表对用户代问行为和患者特征进行分析,在此基础上探究平台的发展趋势,为平台发展和互联网诊疗相关政策的制定提供一定的实践指导。

1 资料与方法 1.1 数据来源

本研究使用的数据包括线上医疗社区数据和线下医院数据两部分。

线上问诊数据来源于在线医疗社区网站丁香医生(https://dxy.com/),丁香医生成立于2012年,2016年正式开设在线咨询板块,目前共7 168名医生开设了问诊业务,分别来自全国1 627所医院和各级医疗机构。本研究爬取了截至2020年底平台上所有问诊共307 978条,分别来自33大科室171个细分科室,收集的信息包括医患交流文本、发布时间和科室。

为探究线上问诊用户群体和线下医院的差异,本文收集了线下医院数据,数据来自中国卫生健康统计年鉴委员会发布的《2020中国卫生健康统计年鉴》,该年鉴披露了2019年全国内陆地区各省份的卫生健康事业发展情况和目前居民健康水平的统计数据。本研究主要使用了年鉴中患者的性别、年龄构成等数据。

1.2 特征提取

因为医患交流数据都是非结构化文本,难以量化,本研究通过正则表达式、文本匹配、数值规范化等方式从患者和医生的文本表述中提取更多特征,进一步丰富患者属性,增加研究维度。

1.2.1 患者性别和年龄

因为平台没有公开患者性别、年龄等信息,而这些特征对于研究患者行为特性非常重要,通过对数据的观察,发现很多患者在提问时会主动提供自己的性别和年龄信息,以便医生根据这些信息更好地进行诊断和治疗。通常患者会在第一次提问的开头几句便会提到这些特征信息,据此我们抽取出每个问诊的第一次提问文本,并截取前20个字符(去除空格和特殊符号此处特殊符号①),根据汉语对性别和年龄的一些表述规则来提取特征。

①   去除空格和特殊符号此处特殊符号是指由于爬虫技术的特性,文本中经常带有的无实质含义的字符,如 <br>,& & 等。

针对患者性别,利用正则表达式匹配关键字“男/女”,进一步根据科室增加和调整性别信息,如男科患者均为男性,妇科患者均为女性。对于年龄的提取比较复杂,需要分幼童和非幼童两种情况处理(表 1)。对于非幼童患者,大多以“岁/周岁”为后缀来描述年龄,但也有很多患者直接以“今年/年龄”等前缀叙述;对于幼童患者,大多以月/周/天来描述出生时长,所以需要根据时间代词的不同进行数值换算。另外,提问本文中年龄数值常以中文汉字形式出现,需要统一转换成阿拉伯数字,最后,提取到性别信息的问诊有113 727条,占总问诊数的36.03%,提取到年龄信息的问诊有122 174条,占比39.67%。

表 1 文本中包含的年龄和性别信息举例

1.2.2 代问称谓

通过分析医患问答数据,发现很多问诊都是患者的亲友帮忙代问,特别是儿童和老人。代问患者和自问患者(提问者为患者自己)的行为特征可能有所差异,不同年龄和性别的患者代问占比也可能存在差别,因此,对代问患者的准确识别对于患者行为模式研究具有重要意义。

观察数据发现,代问用户一般会在提问文本的开头提及代问对象,一般是和自己关系较为亲密的人,比如父母、子女、丈夫等,根据这点可以把代问问诊的识别转化为代问称谓的识别问题。我们截取每个问诊第一次提问的前30个字符,判断字符串中是否包含对应的称谓,最后共识别出80 459个代问问诊。通过整理,我们将所有称谓词汇分类汇总(表 2)。需要注意的是,这里识别代问的方式仅仅是称谓词的提取,少数代问文本并不包含称谓词,如“女,89岁,患冠心病三十五年……”,虽然从年龄上可以明显看出是代长辈问。针对这类情况,结合对数据的观察,将13岁以下和80岁以上未被识别出的患者都调整为代问患者,分别标记为“儿童”和“老人”,最终得到82 344个代问问诊,占比26.74%,这表明超过四分之一的问诊都是由患者亲友或熟人代问的,可见代问现象在在线医疗社区中非常普遍。表 2第三列列出了不同代问人群对应的问诊数量,其中儿童的代问数遥遥领先,这也和平台中儿童患者数量较多有关,此外数量较多的还有父母、配偶、和祖辈,可见代问的患者基本都是提问者的直系亲属。代问作为在线医疗社区不同于线下问诊的一个重要特征,相应患者的行为特征和由此产生的影响值得我们深入探索。

表 2 代问问诊称谓及其分类

2 研究结果 2.1 问诊量分布

从时间变化来看,除去特殊时期的异常波动,问诊量总体呈线性上升趋势(图 1)。从全部问诊的科室分布来看,儿科、皮肤科、骨科、消化内科、普通内科、心血管内科、呼吸内科等慢病、轻症为主的科室问诊量较大(图 2),这类疾病的治疗需要一个长期的过程,且症状较轻,线上通过图文交流可以描述清楚,不需要望闻问切,说明在线问诊在慢性轻症疾病治疗上具有重要的分诊作用,为各级医疗机构分担了不少压力,是线下医院一个很好的补充。

图 1 各周问诊数
图 2 各科室问诊数

2.2 患者年龄分布

年龄作为患者基本的人口统计学特征,直接关系到疾病的发病率、治疗手段、用药方式,对于医生诊断疾病和确定治疗方案至关重要,不同年龄段患者的患病种类和患病概率有很大差异。据统计,平台患者主要集中在6岁及以下的婴幼儿和18~33岁的中青年段,分别占总数的29.5%和37.86%。

图 3分别展示了平台所有患者和自问患者的年龄分布,为表述方便,分别以两个波谷13和42岁为断点,将问诊患者分为儿童、青壮年和中老年三类。儿童患者多集中在婴儿段,年龄越小问诊数越多,这是因为年纪较小的患者,特别是刚出生的婴儿抵抗力较差,容易感染各种疾病,而随着年龄的增长,孩子的抵抗力增强,患病几率也相应减小,同时孩童的父母一般正值青壮年,具备上网和打字技能,有条件进行线上问诊。成年患者中问诊主力是青壮年群体,发病率较高的中老年患者问诊量远少于青壮年患者,可见中老年患者很少使用在线问诊(图 3)。自问患者(用户为患者自身)多数为青壮年,中老年群体自问问诊数较少,说明平台真正的使用者仅仅集中于青壮年群体,中老年患者由于上网技能受限,除非托子女代问,否则很难享受到快捷便利的线上问诊服务(图 3)。

图 3 全部患者和自问患者年龄分布

为探究在线问诊患者的年龄分布与现实中所有患者年龄分布的差异,我们收集线下医院数据进行比较分析。2019年全国所有医院出院患者中,45岁及以上占比63.6%,而平台主要群体年龄介于15~44岁,45岁及以上患者仅占21.8%,可见在线问诊的用户主体与现实中的患病主体在年龄分布上差别很大。从各年龄段患者问诊量的变化趋势来看,儿童患者问诊数持续增加,青壮年和中老年患者的问诊量在2020年初的高峰过后呈下降趋势。

2.3 患者性别分布

性别作为患者的重要特征,同样对医生的诊断和治疗具有重要影响。平台女性患者占比61.4%,不同科室的性别构成有较大差异,多数科室女性占比均在半数以上,比例最高的是妇产科、甲状腺乳腺外科和美容整形科,均在0.7以上,占比较低有科室有泌尿外科、肾脏内科、风湿免疫科、心胸外科和儿科,女性不足半数。

从性别构成的变化趋势来看,女性占比几乎都在0.5以上,且近两年占比不断上升,可见在线问诊的女性用户明显多于男性用户,且差距仍在不断拉大(图 4)。经过分析,女性数量优势主要来源于妇科和产科,在其他性别属性不明显的科室与男性患者数相差不大。

图 4 平台各周问诊女性患者占比

结合性别和年龄特征可以发现,几乎所有年龄段的女性患者均多于男性,特别是在20~30岁和50~60岁两个高峰段差距更加明显(图 5)。而根据线下医院患者的年龄构成数据,除了15~44岁的中青年女性患者明显多于男性,其他年龄段均是男性患者居多,这与在线问诊的年龄分布有很大区别,可见女性用户占多数是互联网诊疗区别于线下问诊的一个重要特征。

图 5 平台不同性别、年龄患者问诊数

2.4 患者代问情况

代问是由亲友等熟人代替患者向医生询问疾病情况和诊治方案,是线上问诊特有的一种现象,特别是对于年纪很小和年纪较大的患者,由于不熟悉互联网操作技术,或者因为病情无法自行上网,只能通过父母或子女来代理自己咨询医生。全部问诊代问比例为26.74%,即超过四分之一的问诊都是出于代问目的。

不同科室患者的代问比例有较大差异,比例最高的科室是儿科、疫苗科、肿瘤科、眼科和心胸外科,儿科患者由于年纪较小,还不具备上网能力和设备,所以代问占比高达90%,远高于其他科室。其余四个科室代问比例介于30%~40%,疫苗科的咨询者很多是帮子女询问疫苗接种方面问题的父母,肿瘤科和心胸外科多是中老年患者,并且肿瘤科患者一般病情较重无法上网,而眼科患者由于患眼疾也存在打字障碍。代问占比较低的科室均与比较私密的疾病相关,如性病科、妇产科、美容整形、泌尿外科等,均在10%左右,消化内科和呼吸内科患者由于病症较轻,一般不会影响患者的上网能力,所以代问比例也较低。

为细粒度考察代问和年龄的关系,以1岁为间隔,计算每个年龄患者的代问比例,可以看到代问比例与患者年龄呈U型分布(图 6),即年纪较小和较大的患者采取代问的可能性更高,青壮年患者自问的概率更大。此外,20~40岁之间的青壮年患者代问比例很小,均在10%以下,超过40岁患者代问比例快速增加,60岁以上患者70.8%都是由亲友代问,可见在线上问诊中,代问现象在中老年患者群体中十分普遍。

图 6 平台不同年龄患者代问比例

从青壮年和中老年患者的代问比例变化趋势来看(儿童患者代问比例始终为1),2018年10月之后,中老年患者群体的代问比例不断上升,从开始的24%逐渐增长到现在的近80%,增长幅度很大,可见中老年群体的代问情况已经发生了重要变化。

代问比例在患者性别上也有所差异,从时间来看,男性的代问比例一直高于女性,且2019年后差距进一步拉大,2020年初男性代问比例实现了跳跃式增长,这主要是源于春节期间男性儿童患者数量的激增,而小于13岁的儿童均是由长辈代问,代问比例为1。

3 讨论 3.1 在线问诊具有重要的慢病轻症分诊作用

大医院人满为患是当下亟待解决的问题,而对常见病、轻症疾病进行分诊是缓解大医院扎推现象的有效手段。由研究可知,在线问诊中咨询量较大的科室以诊治慢病、轻症为主,慢性疾病主要有高血压、糖尿病等,这类疾病一般病程较长且发展缓慢,患者需要在很长一段时间内定期去医院检查、开药,耗费大量时间精力,而线上问诊可以让患者足不出户就完成上述医疗程序;其次,慢性病的症状比较简单,一般有具体的指标进行衡量,如高压、低压、血糖等,适合采用文字描述或检查报告等图文方式进行交流,对线上模式具有很强的适应性。轻症疾病大多为常见病,如感冒、鼻炎等,不具备紧急性和危重性,诊治方法也比较简单,通过几段文字即可描述清楚病情,不需要面对面望闻问切,因此也没必要去大医院挂号治疗。由此可见,在线问诊在慢性轻症疾病的治疗中具有重要的分诊作用,这为各级实体医疗机构分担了不少压力,是线下门诊的重要补充。

3.2 在线问诊用户主体与患病主体严重不匹配

据2020年《第七次全国人口普查》数据,我国人口老龄化形势严峻,2020年60岁及以上人口占比18.7%;同时老年人口患病率高,60岁及以上居民高血压患病率达58.9%,65岁以上居民慢性病患病率达62.33%。老年群体基数较大且各类疾病发病率高,是慢性疾病的患病主体,常年占据医院近半数的床位,老年人的健康已经成为不容忽视的问题。然而与之相反,在线问诊患者以幼童和青壮年为主,60岁及以上患者仅占8.9%,可见在线问诊的用户主体与真正的患病主体存在严重的不匹配。造成这种现象的主要原因是老年人很少具备互联网操作技能和打字技术,因此很难进行在线问诊,无法享受到方便快捷的在线医疗服务。这对于老年患者来说是一种资源的浪费,他们无法享受到在线问诊带来的诸多好处,如打破时空限制[1]、减少信息不对称性[2]、缓解医疗资源分配不均[3]等;同时这种不匹配性将严重影响在线问诊发挥慢病轻症分诊的作用,也必然会成为互联网医疗未来发展的瓶颈。

3.3 代问模式可缓解中老年人对在线问诊的使用障碍

通过代问,更多的中老年患者有了接触在线问诊的机会,享受到了互联网医疗带来的诸多便利。近年来中老年患者代问比例持续增加,一是因为年轻人对在线医疗接受度不断提高,他们更愿意通过方便快捷的在线模式为身边亲属的健康问题寻求解决办法;二是随着经济发展和社会进步,年轻人对父母和其他长辈的健康问题也更加关注;三是很多年轻人常年在外工作,而在线问诊打破了这种空间限制,子女可以在与父母沟通完病情后,到平台上选择合适的医生进行咨询并获得反馈,方便快捷且高效。代问作为在线问诊的独特性质,可以有效缓解大龄患者的平台参与困难,为中老年患者参与互联网医疗提供了一条可行途径。

3.4 女性患者更加善于利用在线建康服务改善自身健康状况

据春雨医生①数据显示,移动问诊人群女性偏多,占比超7成②,与丁香医生数据得到的结论具有一致性,说明女性用户占比较多是在线医疗社区有别于线下医院的一个重要特征,她们更倾向于在线咨询自己的健康状况。同时,在线问诊中男性患者代问比例持续高于女性,2020年后差异更加明显,代问比例在某种程度上反映了患者对互联网医疗的接受程度,女性在线健康消费服务用户多是年轻的高学历群体,她们对于网上新兴事物的学习和接受能力更强,使用在线健康网站和相关软件更加得心应手。随着我国女性地位的崛起和对自身健康的重视,健康类移动应用中女性占比逐年提高,相较于男性,女性更加善于利用在线建康服务和应用来改善自己的健康状况。

①   与丁香医生功能相似的另一在线医疗社区:https://www.chunyuyisheng.com/

②   相关调查结论和数据来自Analysys易观《中国移动问诊白皮书2017》

3.5 在线问诊成年患者数呈现负增长,用户需求定位值得深思

自2020年4月起,儿童患者规模持续上涨,占多数的成年用户数量却呈下降趋势,这对于平台来说是一个危险信号,因为问诊量是用户数量和活跃度的重要体现,作为患病主体的中老年用户在逐步流失,而作为平台问诊主力的青壮年患者数量也在下降,平台需要反思是否在儿科等科室的建设中投入了过多精力,从而忽略了其他用户的培育、留存和促活。从用户需求角度分析,根据KANO模型可以将用户需求分为基本型、期望型、兴奋型、无差异型和反向型五类,基本型需求满足用户的基本需要,是产品的核心需求;期望型需求和兴奋型需求是基本需求的外延,对于用户来说并不是必需品。需要警惕在线问诊服务对于成年用户来说是否只是期望型或兴奋型需求,即用户因为在线问诊新颖的模式而在猎奇心理的驱使下使用,但没有了在线问诊,用户同样可以通过附近的社区卫生服务中心和地方医院进行诊治,平台需要重新思考用户需求的定位。

4 建议 4.1 降低老年人使用在线问诊的操作门槛,拓宽咨询渠道

为缓解在线问诊老年用户过少的窘境,平台可以通过降低操作门槛、拓宽咨询渠道等方式增加老年患者的参与度。虽然要求具备一定的上网技能是在线问诊模式的天然弊端,但是仍然可以针对老年群体的特征采取一些具体有效的措施,比如在图文问诊方式之外,增加语音输入、语音通话问诊、视频问诊等形式,降低打字技能的要求;针对一些急性病和重症患者,可以开设老年人绿色专线,增设电话智能客服,采用多样化方式降低对老年人上网技能的要求。

在拓宽咨询渠道方面,针对老年患者中普遍存在的代问模式,可以增设代理咨询通道,提供专门的代问服务,具体而言,可以通过招募具备一定文化素养的青年志愿者或聘用专门的工作人员来为患者和医生之间的沟通架设桥梁,志愿者通过与老年患者进行电话沟通了解病情,然后整理成图文,并选择合适的医生进行咨询。代问渠道的开通使得更多老年患者有机会享受到快捷便利的医疗服务,同时也可以扩大平台用户规模,提升平台发展潜力。

4.2 优化女性用户满意度

女性作为在线问诊的主要用户,在平台上的参与度和活跃度都比较高,如何改善和提升她们的使用体验和满意度对平台来说至关重要。首先,女性天生更加感性,她们不仅注重诊治效果,也看重医生回复的态度和用心程度,比如医生措辞是否礼貌、态度是否友善、回复是否有耐心,有时候她们问诊更多的是寻求心理和情感上的慰藉。对此平台可以对医生进行问诊回复技巧方面的培训,如阐述上尽可能详尽、多加入一些事先编辑好的礼貌性用语、称呼和措辞表达更加亲切、事先准备好一些安慰性、鼓励性的话语,让女性患者感受到服务的温度。

其次,平台可以针对她们较为关注的健康问题设立专门的细分科室。当今女性的健康关注点主要在经期、孕期、产后、育儿和饮食健康,然而目前网站对女性科室的划分较为粗放,如直接划分为妇科、产科、儿科,用户其实很难找到适合自己情况的医生。对此平台可以进一步细化科室,如在妇科大类下分设经期问题、妇科疾病、不孕不育、女性肿瘤等细分科室,产科下分设孕期护理、产后修复等,对科室进行细分有助于平台更有针对性地服务女性群体,提升用户归属感和满意度。

最后,平台可以针对女性用户需求推出问诊以外的其他健康服务板块,如经期或孕期记录小程序、育儿100问、美容养生小常识等栏目或公众号推文,同时医生也可以根据同步的数据提出更有针对性的建议和处方。各个健康板块的科学配合可以形成健康生态圈,为女性用户提供更加优质、全面、贴心的服务,优化用户体验,全方位提升用户满意度。

4.3 提升男性用户参与度

在线问诊男性用户占比不到4成,但实体医疗机构中男性患者并非少数,这意味着男性群体是一个庞大的潜在客户群,提升男性用户数量和的参与度有助于扩大平台用户规模,提升平台发展潜力。不同于女性,男性天生更加理性,更注重做事效率和实际成果,他们在线咨询时可能更加看重医生回复信息的准确性和响应速度,以及实际的诊疗成效。对此,一是鼓励医生提高响应速度,回复时更加言简意赅,把更多的精力转移到回答的准确性和措辞的精准度上;二是构建医生和问诊的个性化推荐系统,根据患者的咨询文本自动为患者推荐合适的医生或者历史问诊,提高信息搜寻效率,让用户更切实地感受到在线问诊的方便快捷,提高用户粘性。

男性医生过少可能会影响男性患者的使用体验,因为男性和女性对于疾病或症状的关注点以及交流方式可能有所不同,这种性别差异可能导致男性患者不能从女性医生那得到想要的答案,对此平台可以通过注册礼券、接诊奖励等一系列措施激励更多优质男医生的加入,平衡和缓解这种性别分布不均,从而提升男性用户的参与度和活跃度。

4.4 用户需求定位转型

为避免成为线下门诊的替代品,在线健康社区需要思考如何将用户需求从期望型向基本型转化。首先可以培养用户对平台的使用习惯,通过一对一建立健康档案、通过公众号定期推送个性化的健康小贴士和医学科普文章、优化医生和问诊推荐算法、采用优惠券等方式激励用户,提高用户使用频率,增加用户粘度。其次需要挖掘在线平台不可替代的功能,对于工作很忙以及因疾病原因无法出门的患者来说,在线问诊的方便快捷、足不出户的特点是线下医院无法替代的优势,这部分群体一旦成为用户,往往对平台的忠诚度很高,准确有效地识别和挖掘出这部分群体对于平台问诊量的提升大有裨益。最后,针对青壮年用户的流失问题,平台可以增设年轻人比较关注的科室,如增设饮食健康大类,下设养生、营养、减脂代餐等;增设运动健康大类,下设运动营养学、损伤护肤、体育疗法等科室,更切实地贴合年轻人的需求,同时扩大该类科室的医生规模,吸引更多年轻人的加入。

4.5 加强市场监管,推动互联网医疗行业有序健康发展

近两年来,以在线问诊为代表的互联网医疗行业进入快速发展期,用户规模不断扩大,品类功能不断增多,富有巨大的发展潜力和活力,国家近年来也针对互联网医疗的发展出台了一系列举措,鼓励行业发展,规范行业秩序。但互联网医疗作为医疗宣传和咨询的重要渠道和新兴行业,相关政策制定还在起步阶段,监管方便仍需得到更多重视。首先,必须保障医疗信息的准确性,特别是在线问诊中医生回复信息的准确性,设置科学的医疗信息发布门槛和过滤系统,防止谣言和伪科学肆意传播,扰乱社会秩序、危害人民生命健康。第二,鼓励更多医生通过互联网的形式参与到人民健康的管理之中,互联网医疗作为实体医疗的重要补充,是与疾病抗争的第二战场,这种模式在特殊时期能发挥不可替代的作用,也得到了越来越多患者的认可,因此加入互联网医疗对医生来说,既拓展了职业路径,也能发挥更大的社会价值。第三,增加在线医疗的管理机制,针对在线平台医生的误诊、乱开药、过度医疗等违法行为,相关卫生部门可以设立投诉专线,强化追责机制;对于不了解相关政策条文的用户,也可以设立专门的政策咨询热线,更好地维护消费者权益。只有严格市场监管,加强违法惩戒,才能持续推动互联网医疗行业有序健康发展。

作者声明本文无实际或潜在的利益冲突。

相关知识

基于知识规则的赣南脐橙病虫害诊断系统的设计与实现.doc
Online Positive Affect Journaling in the Improvement of Mental Distress and Well
Xinhua Hospital Affiliated to Shanghai Jiao Tong University School of Medicine
Study on blood infection of Herbaspirillum huttiense in patient with lung adenocarcinoma
Overview
study与studying有什么区别
Short exposure to light treatment improves depression scores in patients with seasonal affective disorder: A brief report
Advances in study on resveratrol
An Experimental Study on Mango Irrigation Regimes in Youjiang River Valley of Guangxi
New design metal long study computer table desk

网址: Study on characteristics of patients and agent consultation in online healthcare consultation: A case study of dxy.com https://www.huajiangbk.com/newsview2500759.html

所属分类:花卉
上一篇: Python 爬虫实战:爬取丁香
下一篇: 2021医疗秋招报告:骨科跳槽最

推荐分享