人的听觉过程 Forbrain的听觉处理技术 Forbrain的应用 校企合作研究

巴塞罗那大学联合科学研究项目

2015-05-02

Forbrain®效果所依赖的神经机制:研究计划书

卡里斯伊塞拉,博士,教授
脑、认知和行为研究所(IR3C)所长
巴塞罗那大学精神病学和临床心理学系(信息)

摘要:

(…)

 

当前最先进的技术

      Forbrain®是一种用户容易掌握使用的装置,它实际应用了一个骨传导器和一系列的动态滤波器向使用者反馈其自己的话音,并对听觉话音回路的所有组件进行优化,从而提升对使用者话音的感知程度。我们认为这一产品能够改善言语、流利度、记忆力、精力集中度、协调性和许多其他感觉功能,从而实现心理(认知)/情感领域的一些调整。

      Forbrain®使用了骨传导器,以一种前所未有的方式扩大了刺激控制和呈现的可行性,由此使得声环境的的改进有了新的可能。通过骨传导(骨振动),将行进中的声音波形送至内耳,在基底膜处诱发出一种行进波形,并采取和常规空气传导相同的机制来刺激耳蜗(斯德菲尔特等人,2003年)。耳蜗及其基底膜,以及将传入的声音信号编码成神经脉冲的过程共同构成了一个瓶颈,使得经空气传导和骨传导的声音在其前往中枢听觉系统的途中在此会聚(斯德菲尔特等人,2003年、2005年)。如果对一种特定声音的振幅和相位加以调整,则该声音的耳蜗信号便会被抵消。因此,通过在Forbrain®中采用动态滤波器,可能会在骨传导信号中引入了骨传导信号中非预期的随机变化,这最终可能抵消空气传导信号或让空气传导信号失真并成为很相似的声音,由此使得听觉信号发生非预期的、罕见的或潜在的惊奇变化。

      在使用对于Forbrain®时必须要考虑进的一个关键的、值得强调的因素是,耳蜗及其基底膜以及将传入的声音信号编码成神经脉冲的过程共同构成了一个瓶颈,使得经空气传导和骨传导的声音在前往中枢听觉系统的途中便因此受阻并会聚(斯德菲尔特等人,2003年、2005年)。因此,如果对一种特定声音的振幅和相位加以调整,则其耳蜗信号便会被抵消。通过对人类音调在0.4 kHz的观察,冯贝凯西已经发现了这一有趣的现象,随后也在动物和人类身上(音调在0.115 kHz频率范围内)再次重现了这一现象(维瓦和劳伦斯,1954年;柯汉纳等人,1976年)。这一点之所以重要是在于,通过在Forbrain®中采用动态滤波器,可能会在骨传导信号中引入非预见性随机变化,这最终可能抵消空气传导信号,或者至少对空气传导信号作出实质修改而使之成为非常相似的声音(即,使用者吐出的声音在达空气通路后,以及由骨通路发出的声音在经过Forbrain®滤波器修改后,会引起听觉信号的非预期性、罕见或潜在的惊奇的变化,而最终在耳蜗处对这种信号加以转换并将其传递给中枢听觉系统)。

      在此我们提出,由于使用了两个独立但相关的神经机制,Forbrain®可能的确会引起中枢神经系统的塑性变化:1)使用修改过的的言语信号来刺激音频—话音回路,以改善声环境并改变听觉塑性;以及2)通过强制形成一系列与注意力控制相关的执行机制,应对由不匹配的言语输入触发的无意识注意信号。所有这些过程的最终结果可能是加强注意力控制相关的执行机制、让精力专注度提高、对干扰因素的抵制力更强、工作记忆能力获得提高,还有就是感觉到精力更加集中。

      与其他用于沟通技巧、语言提升和认知度提高的培训和康复方法相比,Forbrain®的好处是,尽管是主动性的——它要求大声说话并遵循一种特定的练习法——但它对使用者的要求很少。的确,在其他方法要求使用者在一系列长达数周且练习难度渐增的练习中达到特定的表现水平时,Forbrain®练习却是按照使用者的动机、投入程度和训练愿望来量身定制的,没有任何其他约束。这明显是一种强大的竞争优势。

      现在,关键的是,如果我们预期的话音是通过空气通路“自然”输入的,而控制这种输入的方式是通过骨通路进行“非自然”(即“额外”的骨传导反馈)因而也是“非预期”的话音输入,所以由传出神经副本诱发的感官预期可能会被破坏,因此需要对感官预期的模式进行调整。这种因非预期输入造成的模板损害必定会导致注意力方面出现困难,因为听觉系统将传入信号识别为偏离少见非预期信号,从而引起不自觉的注意力切换(埃塞拉等人,1998年)。事实上,大量证据表明,新接到的或非预期的听觉刺激会触发注意力不自觉地切换到传入的刺激,从而对正在进行的主要任务产生行为干扰并对潜在神经网络中的大脑活动作出相应的调整(参见评论:埃塞拉等人,2000年;埃塞拉和科洛尔,2007年;还可参见下面注意力的捕获和定向回应一节)。因此,在通过骨传导进行听觉反馈时,人们可能期望通过使用新接到的或非预期的刺激让听觉系统适应这种持续的考验,这加大了对注意力的要求。此外,第二重要的是,由于采用了选通滤波器,从而引入对所发出话音的频率和时间的操纵,使传入信号进一步让传入信号偏离其传出神经副本,由此使得在Forbrain®的驱动下,保持注意力变得更具挑战性。

听觉反馈回路

      通过使用动态滤波器改变使用者的言语信号,并通过一个骨传导器将信号回传,与所计划声音的伴随放电(传出神经副本)失匹配。在听觉语音回路中强制进行联机精细调整,丰富了可引起听觉可塑性的声环境。话音(运动)系统将要生成的声音以传出神经副本或者伴随放电的形式传递出去,从而使在听觉系统中自我生成的声音所产生的听觉输入编码变弱(艾里尤等人,2008年;参见沃尔伯特等人,1995年;克莱普斯和索默,2008年;斯科特,2013年)。

      大家所公认的是,在听到相关声音时,听觉皮层可能经历塑性变化(弗里兹等人,2005年;奈尔肯,2009年),比如那些在动物实验中,相对应表示奖励或惩罚的声音。对于引发这些塑性变化来说,关键在于这些刺激行为的重要性。举一个主要的范例,来表现听觉系统的这一性质的差异,例如音乐家与非音乐家的人士比起来,他们的主要官能和解剖学结构有显著的不同(扎托尔,2013年)。然而,不仅仅是在主动性条件下发现听觉塑性。例如,艾格蒙特和同事们在猫身上得到证实,由于长期被动地暴露于增强的频谱环境下,听觉皮质中音调拓扑图的引起大规模重组(诺瑞那等人,2006年;皮恩科尔斯基和艾格蒙特,2012年)。同样,在人身上,在对中风恢复期病人的研究中发现,被动地听音乐(二个月期间每天听一小时自己选择的音乐材料)也能引发的大脑塑性(Särkämo等人,2008年),这些病人表现出言语记忆恢复、注意力集中以及数项情绪衡量因素获得改善,这些效果甚至在治疗后6个月仍然存在。

      大脑的语言网络包括左大脑额叶中的布罗卡区及其位于颞叶上回后背部的威尼克区的综合对应体。但是,有一块特定的与听觉相关区域位于左脑颞平面后部,这块区域也与言语生成相关,即所谓的隔区(希科克等人,2000年,2003年)。隔区在言语的被动感知期间以及在隐蔽(默读)言语发音期间被激活(布兹巴姆等人,2001年,2005年),而且隔区与岛盖部中的一块区域——布罗卡区的一块解剖区促进部分有极大的关联(布兹巴姆等人,2005年),它通过白质束与这块区域紧密互连(希科克等人,2011年)。由于隔区位居于听觉(颞上沟)和运动(岛盖部)区,它因此被认为是言语和相关声道功能的感觉运动整合中枢(希科克等人,2010年),与言语生成的听觉反馈控制相关。曾有人建议,由于隔区可以起到控制机制的作用,可将其用于当所计划言语正在生成时,对其信号进行动态调整(希科克等人,2010年)。

      这对于Forbrain®来说很重要,因为骨传导器和动态滤波器所提供的感觉反馈的确有损于内部预测,必定会引起内部言语模式的联机重新调整和调适。例如,一项研究表明,在存在保留性声学特征表达的情况下,患有严重发育性口吃患者的表现是,在他们本族语声音(音素)的表达上存在缺陷,这是在被动条件下测量出来的(科勃拉等人,2005年)。此外,这些有缺陷的音素表达与口吃严重程度相关联的例子,支持了上述理论模型。这一模型的一个重要意义,从与Forbrain®相关的一般和特定角度说,在于使用一个人自己的话音便足以产生运动性言语行为的矫正信号,同样,听其他说话者的话音便足以学习并调适新的运动性言语模式。因此,人们可以预期在被动性言语倾听过程中激活了前额叶皮质区中的运动性言语网路,同时在正常言语生成过程中在微妙的程度上联机发生了深刻的系统重新校准。现在,如果一个人自己话音的预期传入信号被严重损害,正如Forbrain®所发生的情况那样,将在听觉话音回路中发生惊人的塑性变化。

注意力控制机制

      其次,当自己所发出声音的模板预测到将受到非预期损害时,触发了一连串非自觉注意力程序,包括注意力不自觉切换到这些变化,对干扰因素进行处理并将注意力重新定向回到主要任务(例如,不间断的讯息),而所有这些都发生在不到一秒以内。的确,上面所解释机制的一个结果就是,在途言语的传出神经副本触发的感官预期被骨传导输入破坏,因此需要对感官预期模板进行必要的调整。这种由于非预期输入而引起模板损害使保持注意力变得更具挑战性,因为听觉系统将传入信号识别为 破坏性信号,从而引起不自觉的注意力切换(埃塞拉等人,1998年)。大量证据表明,新接到的或非预期的听觉刺激会触发注意力不自觉的切换到传入的刺激,从而对正在进行的主要任务产生行为干扰并导致潜在神经网络中的大脑活动作出相应的调整(参见评论:埃塞拉等人,2000年;埃塞拉和科洛尔,2007年)。可通过在头皮记录神经网络的神经标记,即从不间断的脑电波图(EEG)提取对应的事件的相关脑电位,来追踪神经网络的激活情况。已识别出与所谓的干扰电位(DP;参见图1)相对应的一系列波形,它们能反映非自觉注意力链条中的三个连续阶段。失匹配负波(MMN)反映出探测到的不一致(埃塞拉等人,1998年);新奇波(P3),反映出将注意力向诱发声音作有效定向(埃塞拉等人,1998年)以及重新定向负波(RON)(斯科罗格和沃尔夫,1998年;埃塞拉等人,2001年)。而且,干扰电位能揭示注意力自上而下和自下而上的交互,例如在工作记忆负荷(桑米格尔等人,2008年)和情感困扰(Domínguez-Borràs等人,2009年)期间。如上所述,很可能的是,根据其向使用者的话音进行引入性操作,Forbrain®引发了对这个大脑网络在非自觉注意力控制方面的大考验,而对这一非自觉性注意力相关电位的记录为验证其行动原理提供了一个前所未有的框架。

      除了干扰外,听觉系统还能处理干扰因素,很容易在一次短暂的注意力切换后将注意力重新定向回到任务的执行(埃塞拉等人,2001年;斯科罗格和沃尔夫,1998年;参见埃塞拉和科洛尔,2007年)。在倾听由骨传导器操纵的自己话音的过程中,所有对注意力定向和重新定向的往复程序最终可能在总体上提高注意力控制能力,从而更容易防御干扰因素,提高行为的专注度。

1.干扰电位(DP)。(左)在执行视觉任务过程中因标准、异常和新奇波试验而诱发的事件相关性大脑电位(与之同时忽略听觉刺激)。(右)揭示干扰电位的减法波形(异常和新奇波干扰减去标准试验)。

干扰电位看起来像一个三相波形,其揭示失匹配负波、N1增强、P3a/新奇波—P3以及RON的占比。改编自埃塞拉和科洛尔(2007年)。

 

(…)

一个潜在的重要领域:噪音中的言语

      尽管听觉和言语感知乍一看是大多数人自然具备的官能,但即使在通常会充斥着各类背景噪音的正常环境(比如,闹市街道、咖啡吧、同时发生的社会事件以及甚至在教室里)里实施时,听觉系统也会执行所谓“噪音中的言语”感知。孩子们,尤其是那些有学习障碍的孩子,以及年龄较大的成年人,尤其容易受噪音对言语感知的影响(布莱德罗等人,2003年;齐格勒等人,2005年;金姆等人,2006年)。这些困难甚至在听力测定正常的情况下发生,这就表示基础缺陷产生于中枢听觉缺陷机制(安德森和克劳斯,2010年)。因此,有人提出,孩子们的一些学习障碍可能有部分是来自于噪音排除缺陷,这可能会出现于存在噪音的情况下,但不会出现在安静情况下(斯伯林等人,2005年;齐格勒等人,2009年)。

      噪音中言语的感知是一项复杂的任务,它涉及到感觉和认知程序之间的相互作用。为了从背景噪音中识别一名说话者的目标声音,听觉系统首先需要根据频谱时间线索来形成所听声音的听觉目标。例如,通过对关键的声学特征(比如基音频率(F0)和界定话音说话者的音调的刺激因素第二谐波(H2))的听觉分组,来识别说话者的话音(安德林和克劳斯,2010年)。数项研究已表明,针对存在于背景噪音条件下的刺激物,从人头皮记录下来的听觉脑干反应(称为频率跟随反应(FFR))被视为听觉脑干中声音编码的生物标记(斯克尔和克劳斯,2010年;坎德雷斯卡伦和克劳斯,2009年;参见图2)在被获取时会延迟并减弱(卡宁罕姆等人,2001年;安德林和克劳斯,2010年)。此外,数项最新研究已显示,不同的训练课程可能有助于通过听觉脑干中言语相关特征的编码的增强机制来改善噪音中言语的感知(安德林和克劳斯,2013年;克劳斯,2012年)。在此,Forbrain® 看起来是一种很强大的工具,它能引发必要的听觉变化来改善噪音中言语的感知。

 

1. 频率跟随反应(FFR)(A)及其对应的频谱组分(B)该频谱组分是针对以同等机率按此处列出顺序出现的/ba/、/wa/1、/wa/2、/wa/3、/wa/4刺激因素。A)注意在F1和F2的时序迁移期间的二个延迟窗口(18-22毫秒和27-31毫秒)中的反应振幅明显增强,这一时序迁移是针对与/wa/1(´*´,p<0.05)相比较的/ba/音节观察所得。B)很明显,H2谐波的振幅随着共振峰迁移持续时间的增加而增大,因此可将其视为人类听觉脑干这一声音特征编码的生物标记。节选自斯拉布等人(2012年)。

上一篇:  没有了 / 下一篇:  没有了