抑郁癥越來越變成一個常見詞,很多普通人心情不好時就稱自己得了抑郁癥。不過即便對醫生來說,診斷也不是件容易的事。而南加州大學的研究人員開發出的機器學習工具,或許能讓診斷變得更容易也客觀。
這個工具名為SimSensei,它會在訪談中記錄患者的聲音,檢測出元音表達是否減少,因為這是心理及神經紊亂中的常見特征,但對人類來說很難察覺。這種方法雖然不能取代人類診斷,但也提供了一個客觀標準。
抑郁癥誤診是一個很大的問題,2009年一個綜述研究發現,5萬名患者中僅一半被正確做出診斷,誤報與漏報比更是達到3:1。原因有二:一是誤診比沒有診斷更安全,二是確定無疑地排除任何診斷的可能性都需要更多專業知識。
對抑郁癥來說,它又是一種異質性疾病,病因多樣,表現形式也不同。再加上醫生一周可能要見數百名狀況不一、描述也不一的患者,那誤診可以說是情有可原了。這也是為什么SimSensei這樣的工具能發揮更大作用。
此前的調查發現,抑郁癥患者的情感更平淡消極,語音變化會減少,音量和單調更單調,說話也會減少,而且吐字不清,停頓變長。另外,抑郁癥患者的聲道和聲帶更緊張。機器學習很適合解決這類問題,能從噪音數據中進行預測,而且語音分析也是這一領域的重要話題。
原理很簡單,將患者的語音處理成只剩元音,然后分析元音a/i/u的第一和第二共振峰(譜峰)。最后就是使用k-means算法進行處理,這一算法也挺老了,出現于1967年,原理是圍繞一定的平均值將數據集分為不同的類。
聚類的結果是一個三角圖,各角分別代表元音的譜峰。三角內的區域代表了元音空間,將它與一個用作對比的標準元音空間進行對比,所得的比例就能用于抑郁診斷。
SimSensei的效果也得到了證明,而且結果表明,在語音數據有限的情況下效果也不錯,這表明它具備了一定的實用性。