【天天报资讯】我们用算法找到4222个想自杀的人,并向他们发了私信

2023-04-26 09:20:44 来源:格致论道讲坛©

大家好,我是朱廷劭,来自中国科学院心理研究所,下面我将向大家介绍一个比较沉重的话题——自杀。从最早的明星,如张国荣、乔任梁的自杀,到社会上一家三口因为借贷问题自杀、高中生自杀,自杀其实离我们并不遥远。

大家可能不太了解自杀问题的严重性。根据数据显示,在世界范围内,自杀在总人口死因中占第13位,且在15~39岁人群之间占首位;在中国,自杀在中国总人口死因中占第5位,且在15~34岁人群之间占首位。自杀确实已成为年轻人死亡的首要原因,所以我们需要对自杀问题做一些干预。

我们的初衷


【资料图】

目前,自杀干预的主要困境是自杀的主动求助率特别低。在我国,仅有7%的自杀者在其生前曾寻求过帮助。很多人认为自杀是个人的事情,是自己的选择。但其实很多人选择自杀是因为他们不知道该向哪些人求助,该怎样求助。

根据上图我们可以看到,约有80%的人是不知道从何获得帮助而自杀的,而只有约20%的人不想取得任何帮助,直接了结了自己的生命。所以,我们希望能够帮助这些人。

刚才提到,在自杀人群中年轻人占首位,而在网络使用人群里年轻人也是主力军,所以自杀的主要人群和网络使用的主要人群有非常大的重合。这个重合提醒我们,或许我们可以利用网络手段主动找到那些有自杀倾向的人,并向他们提供帮助。

我来自中科院,中科院研究生院有时候会发生学生跳楼的事件。给我印象最深的是一个博士二年级的学生,这个学生本已跟导师联系好了开会,结果突然就选择了跳楼自杀,没有任何征兆。

我们觉得很遗憾,但因为各种原因,我们无法知晓他到底经历了怎样的心理变化,经历了什么痛苦,所以我们也不知道该怎么帮他。所以我们希望能主动找到具有自杀倾向的人群,并为他们提供帮助,避免悲剧的发生。

我们每天都上网,通过网络技术我们可以汲取到大量的数据,所以我们希望通过网络的手段,实施对自杀的主动干预,救助更多的人。这是我们做这个研究的初衷,我们希望能够主动找到那些有自杀倾向的人,主动提供帮助。

首要问题:找到他们

人们总是能在网络上把自己装扮得非常好,比如应用很广的美颜软件,我们总是习惯先给照片美颜再上传。所以我们担心有自杀企图的人在网络上没有任何负面表达,比如乔任梁的微博大号里面就没有任何负面的内容。这样我们就无法通过网络找到那些有自杀倾向的人。

因此我们打算做一个极端情况下的研究,观察那些已确认自杀死亡的用户在网络上说的话、表现的行为,是否和一般用户有区别。如果有区别,我们就可以继续之前的计划,如果没有,就说明我们无法通过网络的手段找到他们。

通过对比研究,我们最终发现,自杀死亡的用户的互动更少,更加关注自我,在情绪上有更多负面表达,非常抑郁、焦虑。他们说的内容和死亡、宗教相关的较多,和工作相关的比较少。

所以自杀死亡的用户,在网上说的话和表现的行为与一般用户确实是有区别的。这就为我们做进一步的分析提供了基础。但已经确定自杀死亡的用户和普通用户只是两种极端用户,更多情况下我们面对的应该是一些具有不同风险层级的用户。

我们在网上找了900多个用户,按照他们的自杀可能性分为高风险和低风险两组。通过两组数据对比分析我们也看到了区别。

高风险用户的话语与行为特征

高风险用户的社交活跃度更低,且在夜间更加活跃。这跟我们其他的研究也是相符合的,我们发现夜间更加活跃的人抑郁程度会更高,所以我们建议大家12点以后尽量不要使用手机。此外,高风险用户关注他人更少,使用更多表达死亡的词语,且很少使用表达未来的词语。自杀高风险人群在网上说话的时候,会不由自主地体现出跟其他人的差异,这种差异可以帮助我们利用计算机找到他们。

人工智能可以通过分析用户在网上的话语或行为自动识别出他的自杀可能性。我们通过实验发现建立这样的自杀模型确实是可行的,它有比较好的召回率,但是误报率也比较高。

但通过分析之后我们也发现一个问题,很多有自杀倾向的人在网络上也并不是每句话都要谈到自杀,其中大部分是正常的描述,所以如果用这个模型计算就会带来延时,因为只有用户说到一定程度的时候模型才能识别出自杀可能性。这样一方面可能会耽误我们对他的反应,另一方面我们也没法确定他说的每句话都有自杀意念。

对此的解决办法就是针对单条微博,分析每句话内含的自杀可能性。上图是我们按照自杀的可能性,将不同的网络言论分为了1级、2级、3级。1级指有自杀意念;2级指有自杀意念,同时有自杀计划;3级指不仅有自杀计划,还有计划的实施。

以下是一些具体的例子:

上图里第一句话,“昨晚尝试自杀未果,今早又照常醒来,希望今晚成功,我会有见到你的机会么?”这句话有非常明显的自杀计划,且已经开始实施自杀,是一种比较紧急的情况。

第二句,“哪一天我下定决心了,就喝好多酒,醉得不省人事,然后跳进河里。别人只会说喝酒误事,不会怪我。”这是只有自杀计划,没有实施。

第三句,“从前我只是晚上才会想到死亡,最近就算在有阳光的时候都会觉得要活不下去了,我该怎么办?”这是有自杀意念,紧急程度没有前两种那么高。

我们希望在抓取到一句话后,计算机能够自动识别出自杀风险,因为如果人工看的话,工作量太大,没法保证时效性。我们会通过各种机器学习的算法对这个模型进行调优,使其对一条微博的识别精度可以达到80%。即把一条微博送到计算机系统里,然后计算机得出一个代表自杀倾向的值,这个值的准确率可以达到80%。

但实际分析中我们又会发现另外一个问题,即因为中文的博大精深,使计算机的准确识别变得更加困难。

比如上图中的第一句“整理遗物是我最快乐的时光”,“整理”一词是中性的,“快乐时光”则是积极的,只有“遗物”这个词是负面的。这样就使机器的识别变得十分困难,只有人工去看才可以正确判断出自杀倾向。

而第二句“饭饭,很快就要看到你了”,单看句子内容好像没什么问题,但这句话是有情境的。“饭饭”是大家对微博用户“走饭”的昵称,而“饭饭”是在2012年自杀死亡的一个用户,其最后一条微博下累计有一百多万条的回复,并且一段时间内还在以每个月六千多条的速度增加。

所以在“饭饭”最后一条微博下的评论“饭饭,很快就要看到你了”本身就有非常大的问题,但是计算机可能就会判定这句话没有任何问题。

联系与帮助:保护隐私,专业指导

此外,虽然我们可以利用这个系统发现有自杀企图的用户,那发现之后要怎么办呢?我们该怎么跟他们联系、怎么帮助他们?这其实是一个很大的问题。

前段时间在网上出现过网络暴力,每个人都想做正义的化身帮助别人,但最后却达到了反效果。

英国的慈善机构SamaritansRadar人类协会开发的一个Facebook的应用给了我们很大的启发,这个应用会扫描你关注的所有好友,如果你的好友有自杀意念或者负面表达的话,它就会通知你。

一开始我们觉得这个出发点是好的,我们可以了解朋友的情绪变化,如果他有负面情绪的话,我可以马上帮助他、安慰他。但是这样做侵犯了隐私,所以这个应用上线十天后就被永久关闭了。

不管出于什么样的动机和好心,我们首先要保证别人的隐私,以侵犯别人隐私为代价做的任何事情都没有意义,甚至是对别人的不尊重。

基于保护隐私的考虑,我们决定利用微博中的私信功能,它类似于邮件。邮件的好处就是端对端,它不会公布出来。通过私信的方式,我们可以保证一对一的交流,同时保护用户的隐私。

但这又带来另一个问题。因为我们每天都会收到大量的信息,其中包括很多垃圾短信、广告邮件、广告电话,因此用户很容易把我们的信息当成垃圾短信直接删除或忽略。

那么如何保证我们发的信息不会被有自杀意念的用户当作垃圾信息删掉或者忽略掉,如何让他们愿意打开看,就是我们需要解决的问题。因为如果他们不看的话,我们后面所有的工作都没有意义。

我们在2016年暑假找了两批有自杀意念的用户进行访谈,我们希望通过对这些人群的了解,知道有自杀倾向的人群最需要什么样的信息。

对这两批用户做访谈的时候,我们最后都会提供一个专业的指导,因为虽然有时候这些人在一起会相互鼓励,但有时候也会互相产生负面的影响,我们希望不要出现网络上那种“相约自杀”的事件。

通过访谈后,我们就确定了我们的私信格式。这个私信需要说明以下几个问题,第一,介绍我们自己;第二,说明我们是怎么找到他们的;第三,我们该怎么帮他们;第四,表达我们的同理心。

研究人员最终发送的私信内容

私信生成之后,我们在2016年11月的17日和18日,向4222人发出了私信。因为我们一直过于频繁地使用新浪微博发私信,被新浪认为是不怀好意的广告主,把我们的账号一再限制,所以我们只好分两次发送。

这4222名用户是在2016年3月到9月这半年期间发表过带有自杀意念微博的用户,甚至我们发出的私信有些是家人回复的,说本人已经离世,所以这些人是真正处于危险状态的。

我们在发了私信之后非常紧张,担心大家会认为我们在惹事,因为新浪有一个规定,如果收到三个以上的投诉,这个账号就会被关闭。

但结果很好,我们向4200多人发了私信,有300多人直接给了我们回复,而这300多个回复里面,只有个位数的人是极度负面的表现,绝大多数都是正面的反馈。

部分网友回复的私信

这些回复让我们觉得我们做的事情很有意义,这是我们第一次通过这种技术手段找到这些人,向他们发送帮助信息,并主动地提供帮助。

通过这次的调查,我们觉得也有一些问题需要引起大家的关注,第一个就是自杀人群的低龄化。

如下图所示,在我们调查的具有自杀倾向的人群中,高中、大专和本科人群的比例是最高的。而初中生也开始逐渐出现自杀倾向,并且比例有逐渐上升的趋势。

高中生自杀主要是由于家庭压力。尽管家长对高中生的期盼只是考大学,但高中生也生活在一个小社会里面,他们遇到了问题也需要解决,如果自己解决不了,而家长也不帮他们,他们可能就会走极端。

同时我们也调查了一些有自杀倾向的人,下图中可以看到,有50%的人从来没有寻求过任何的帮助,而在那些会寻求帮助的人里面,家人不是第一选择,选择向家人求助的人数甚至低于向陌生网友求助的人数。

我们一直说,家庭是最重要的精神支持来源,但从我们的调查看来,很多时候家人甚至是他们自杀的主要动因,因为家人对他的期盼和压力使他走上了极端。所以我们希望家庭和学校能够共同努力,一方面为这些学生创造更好的环境,同时也告诉他们该怎么应对遇到的问题。

我们做了这个实验之后,《冰点周刊》给我们的点评:“这个长久在远处注视着树洞的群体,发出了柔和的光芒”。我觉得很贴切,我们希望通过技术手段体现对有自杀倾向人群的关怀和温暖。

应用与推广:干预有效果,呼喊有回应

有了这个调查结果,我们就可以进行主动干预了。我们通过技术自动下载在微博上发表的内容,利用机器模型自动识别出有自杀意念的微博,然后由人工进行最终的确认。

因为如果有误判的话,我们发了私信之后,可能会被贴在网上调侃,大家可能会对我们的工作产生质疑。人工确认之后,我们才会给用户发私信。私信发出后,如果收到回复,我们就会有志愿者跟进。我们的志愿者是经过认证的心理咨询师,因为这种服务是专业服务,不是简单的好心办好事,如果没有专业的知识与技能,有可能会好心办坏事。

经过这样的过程,我们就实现了对自杀的主动干预。如上图所示,这个主动干预系统从2017的7月正式上线,在不到一年的时间里,我们已经对发表在微博上的30多万条评论进行识别,发现大概两万多条是有自杀意念的,这些评论来自于一万多名用户。

我们当时还遇到一个问题,就是有的人会多次在网上表达自己自杀的念头,我们每次都会检测到,那我们应该给他发送几次私信呢?

由于没有以前的研究经验可以借鉴,我们就定为五次。这五次私信想表达的思想就是,我们并没有放弃,希望你也不要放弃。我们通过五次不断地发送信息,希望能给他们提供最好的帮助。

上图是有关有自杀倾向人群相关行为的调查数据,我们可以看到有接近60%的人有自残行为,同时有真正的自杀企图;有接近一半的人不仅有自杀意念,也有自杀计划。这就提醒我们,这些人在网上并不只是说说而已,他们真的有可能实施自杀,结束自己的生命,这是非常重要的事情。

为了知道我们的干预有没有给他们带来帮助,我们通过后台的技术,观察这些人在整个过程中表达的内容有没有发生何种变化。

前面有提到,高自杀风险的人使用表示死亡的词更多,表示未来的词更少。通过我们的干预,我们发现这些用户谈论死亡的次数降低了,谈论未来的次数增加了,对未来抱有了更大的期望,所以我们的干预是起到了一定的效果的。

但我们的干预并不能解决他们现实中的问题,比如有的人自杀是因为高利贷,我们没有办法解决高利贷的问题。我们希望通过这种办法主动找到他们,向他们传递一些社会支持,让他们感受到来自社会的温暖。同时我们也希望通过志愿者的沟通,利用专业的技术帮助他们克服自己心理上的困难。

标签:

最近更新