欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

听你说话 机器学习算法就能检测抑郁症了

程序员文章站 2022-04-02 12:22:20
抑郁症越来越变成一个常见词,很多普通人心情不好时就称自己得了抑郁症。不过即便对医生来说,诊断也不是件容易的事。而南加州大学的研究人员开发出的机器学习工具,或许能让诊断变得更容易也客观。这个工具名为Si...

听你说话 机器学习算法就能检测抑郁症了

抑郁症越来越变成一个常见词,很多普通人心情不好时就称自己得了抑郁症。不过即便对医生来说,诊断也不是件容易的事。而南加州大学的研究人员开发出的机器学习工具,或许能让诊断变得更容易也客观。

这个工具名为SimSensei,它会在访谈中记录患者的声音,检测出元音表达是否减少,因为这是心理及神经紊乱中的常见特征,但对人类来说很难察觉。这种方法虽然不能取代人类诊断,但也提供了一个客观标准。

抑郁症误诊是一个很大的问题,2009年一个综述研究发现,5万名患者中仅一半被正确做出诊断,误报与漏报比更是达到3:1。原因有二:一是误诊比没有诊断更安全,二是确定无疑地排除任何诊断的可能性都需要更多专业知识。

对抑郁症来说,它又是一种异质性疾病,病因多样,表现形式也不同。再加上医生一周可能要见数百名状况不一、描述也不一的患者,那误诊可以说是情有可原了。这也是为什么SimSensei这样的工具能发挥更大作用。

此前的调查发现,抑郁症患者的情感更平淡消极,语音变化会减少,音量和单调更单调,说话也会减少,而且吐字不清,停顿变长。另外,抑郁症患者的声道和声带更紧张。机器学习很适合解决这类问题,能从噪音数据中进行预测,而且语音分析也是这一领域的重要话题。

原理很简单,将患者的语音处理成只剩元音,然后分析元音a/i/u的第一和第二共振峰(谱峰)。最后就是使用k-means算法进行处理,这一算法也挺老了,出现于1967年,原理是围绕一定的平均值将数据集分为不同的类。

聚类的结果是一个三角图,各角分别代表元音的谱峰。三角内的区域代表了元音空间,将它与一个用作对比的标准元音空间进行对比,所得的比例就能用于抑郁诊断。

SimSensei的效果也得到了证明,而且结果表明,在语音数据有限的情况下效果也不错,这表明它具备了一定的实用性。