利用PLL估算器和弱磁技术(FW)实现永磁同步电机(PMSM)的无传感器磁场定向控制
磁场定向控制(Field Oriented Control,FOC)是这样一种方法:将某一磁通量(转子、定子或气隙)作为创建另一磁通量参考坐标系的基准,目的是退去定子电流转矩分量和励磁分量的耦合。去耦可以简化对复杂三相电机的控制,从而能像以单独励磁控制直流电机那样控制三相电机。这意味着电枢电流负责转矩的产生,励磁电流负责磁通的产生。在本应用笔记中,将转子磁通作为定子和气隙磁通的参考坐标系对PMSM进行FOC的特別之处在于:定子的d轴基准根据电机的数学模型进行位置和速度估算。因此,模型电流对应于d轴上的电枢反应磁通)设置为零。越接近真实硬件,佔算器的执行效果就越好。PMSM的转子磁体产生转子磁链Y。这与ACM不同,ACM数学建模取决于其拓扑结杓,主要分为两类:表面贴装需要磁化电流具有恒定的基准电流值,才能产生转圯和内部贴装型永磁休。针对应用的需求,这两个类均子磁链。有其优缺点。围绕表面贴装型永磁同步电札川发了相应气隙磁迸等丁永磁体产生的转」磁链与定子电流产生的的控制方案(图2),与其他类型的PMSM相比,其优电枢反应磁链的和,对于FOC的恒定转矩模式,d轴气点是转矩纹波低、价柊低。表面贴裝型PMSM的气隙磁隙磁通仅与平相等,d轴电枢反应磁通为零通比较平滑,因此定子的电感值非凸极PMSM〕,且反电动势( Back Electromagnetic Force,与此相对,在恒定功率运行时,定子电流的励憾分量BEMF)呈正弦波。用于削弱气隙磁场,从而提高转速。由于此类PMSM的气隙(包含置丁定子齿和转子铁芯在无需位置或速度传感器的无传感器控制中,主要的困难是实现一个稳健的遮度估算器,能够抵御温度、电磁之间的表面贴装磁体)较大,此类PMSM相对于具有同样尺寸和标称功率值的其他类电机,具有更小的感应系噪声等干扰。对于成本非常敏感或不允许有诸如位置传数。电机的这些特性在一定程度上简化了速度和位置估感器等移动部件的应用或者电机在电气条件非常恶劣的算器使用的数学模型,同时使得FOC更有效。环境下运行时,通常需要釆用无传感器控制。然而,不应将对精确控制的要求,特别是低速时的要求,当作就持续保持电杌转子的磁链滞后电枢磁链90度可以获得给定应用选择控制方案的关键因素。每安培的FOC转矩最大(见图3)。图永磁体表面贴装型的横截面电机的横截面1.转子转轴是252.转子铁芯3.电枢(定子4.带电枢线圈的电枢槽5转子永磁体6.气隙C 2010 Microchip Technology IncDS01292ACN第3页图相位矢量图(基本转速警告:在对磁体表面贴装型PMSM进行弱磁q时,稍不注意或未遵照电机制造厂商的规范槳作,就有可能使转」遭受机械损坏,永憾体被退憾。通常使用环氧树脂粘贴或者使用不锈钢或碳素纤维环米固定永磁体。若转速超出制造厂商指定的最大转速,永磁伓就可能脱落或损坏,从而导致转子以及其他附着在电机转轴上的机械部件遭到破坏。若气隙憾通密度超过了磁通密度曲线的拐点,就会屮PW导致退磁,如图5所示图永磁体的迟滞曲线(理论上)在FOC恒定功率模式下,无法有效实现PMSM的弱磁,原因是较大的气隙室间会导致减弱的电枢反应磁通对转子永憾体的磁链产生丨扰。基于这个原因,所能获得的最大转速无法高于待测电机基本转速的两倍。图4给出了恒定功率—弱磁模式下的相位矢量方向。图相位矢量图(高速迟滞由线1.水磁体的固有特性。2.永磁体的一般特性。其中磁场密度=磁场感应永磁体感应磁通值ld矫顽磁性=固有矫顽磁性DS01292ACN第4页c 2010 Microchip Technology Inc类估算器公式本应用笔记屮使用的估算器就是AN1162《交流感应电a cos(p Bsin(p机(ACIM)的无传感器磁场定向控制(FOC)》(见参考文献)中采用的估算器,只是在本文中用于sin(pPMSM电机而已。估算器来用PLL结构。其工作原理基于反电动势采用固定的定子坐标系,公式4代表定子电路公式。(BEMF)的d分量在稳态运行模式中必须等于零。图6给出了佔算器的框图。公式如图6中的闭环控制回路所示,对转」的估算转速()进行积分,以获取估算角度,如公式1所示C公式阝阝阝在公式4中,包含-β的项通过经 Clarke变换的相将BEMF的q分量除以电压常量Kd得到估算转速系统的对应测量倌得到。以Y型(星犁)连接的定子相如公式2所示:为例,和分别代表每个相的定子电感和电阻。若电机采用△连接,则应计算等效的Y型连接相电阻和电公式并在上述公式中使用佟7表小估算器的参考电路模型。电机的A、B和C端n()·)连接到逆变器的输出端。电压、和代表施加给电机定子绕组的相电压。代表逆变器桥臂间的线电压,相电流为和考虑公式2中给出的最初估算假设(BEMF的d轴值在稳态下为零),根据 BEMF q轴值的符号,使用BEMF d轴值对BEMq轴值让行校正。经过公式3显示的Park变换后,使用一阶滤波器对 BEMF d-q分量值进行滤波。图:估算器的原理框图LPFa BLPFqC 2010 Microchip Technology IncDS01292ACN第5页图估算器的电路模型公式ARsVAB其中=Y犁连接的电机相电感=采样时间等于PWM周期BC为遊变器的直流链路电压BLS为每相的最大峰值电流B2·汇代表其中将控制系统中实现的公式做进一步的演化,估算器公式=Y型连接的电机相电阻4中的电压a和∨B是在FOC的前一训算环节中得到的结果,它们不仅在控制的前一步骤中馈送给空间向量调制( Space Vector Modulation,SVM)电路,而且在公式4的最后一项中,电流对时间的导数会对软件造成当前步骤屮馈送给估算器电路。la和lB是相电流经扰。因此,估算器的每次执行周期中都引入了电流变Clarke变换后得到的,在估算器的每个工作环节中都将化的极值,该值必须小于估算器每次执行周期的最大被读取电流变化值,每当发生PwM屮断都将执行该周期。公式4中定子电感()和电阻()经过了归一化根据公式3,将得到的 BEMF和B值通过Park变以便简化计算并满足软件表小要求,如公式5所小。換转换到转子磁通的旋转参考坐标系,得到和值。在Pak变换中使用的角度p,是估算器前一执行环节中计算得到的。基于等丁零,優用一阶滤波器对BEMF的dq值进行滤波,并将滤波后的值代入估算器的主程序。公式2给出了的计算,即如何得到电气转遼。对电气转达进行积分得到转子磁通与c-B固定定子坐标系之间的角度(p)。在公式2,K表示表1给出的电压常量。公式6给出了电气转速计算中使用的归化公式代表1000其中=极对数,以及前面指出的其他输入DS01292ACN第6页c 2010 Microchip Technology Inc使用与BEMF中所用的相同一阶滤波器对转速反馈进行确定这样的特性参数是个耗时的过稈,和预期一样,这滤波。该滤波器的一般形式见公式7些特性参数的线性度极差。公式:调整和实验结果(()-(-1)当转速低于基本抟速时,进行算法调整非常简单,此时用最大转矩模式。通常,由电机制造厂商测量或给出其中的参数添加到攴持文件中,该=当前滤波器的输出文件随本应用笔记一起提供(见附录:源代码),(-1)=上一次滤波器的输出从而得到归一化的参数供估算器使用。得到的值随后被()=当前滤波器的输入添加到项目文件中,准备运行。=滤波器常量要测量的参数包括转子电阻、转子电感以及电压常量Kd。滤波器输出的直流值应该不含有由ADC采集引起的噪声或软件计算引入的高频变化。滤波器的调整取决于要可在电机的接线端测量定子电阻和电感,然后将测得的滤波的值( beMF d-q分量和电气转速)的变化速度值除以2,得到和值。对于Δ型连接的电机,若调整的结果是要保证足够的带宽,降低冇用信号损失的电机制造厂商提供了相电阻和电感,则应将它们除以3得到星型连接的等效相电阻和电感可能性。对于BEMd-q分量,有两种情形:(1)高速,在弱嵫模式中,由于缺乏转矩瞬变或髙加速斜率,变化所有电机的制造厂商均会给出电压常量K其实,您缓慢:(2)低速,速度变化取决于电机的机械常量(以也可以采取非常简单的步骤来测量这个参数,即以恒定及电机转轴上的负载)和基准速度升高或下降的斜的速度旋转转子转轴,同时测量电机线端的输出电(取较快的那个值)压。如果在转速为1000RPM的情况下读数,测得的电瓜为典型的RMS值。将读到的数值乘以2的川平方即可得到以KRPM为单位表示的值。弱磁()对于测试的电机参数,表1中的数据就是米取上述步骤PMSM的弱磁意味着绘旋转坐标系d轴方向的定子电流测得的。施加一个负值,作用是削弱气磁链逆变器的电压输出在定子电阻和感应电阻上产生压降表剩下的电压用于消除BEMF。BEMF与电机的转速和电压常量K成正比。考虑到逆变器的最大输出电压限值电机类型电机单位通过降低与气隙磁链呈正比的电机电压常量Kb即可提高转速。气隙磁链的降低自然会导致转矩降低。连接类犁由丁控制气隙弱磁所涉及的电机特性参数之间的关系错L-L电阻1922综复杂,因此情况有些复杂。LL电感-1kHz2.672H电枢d轴电流对气隙弱磁的影响取决于从电枢齿到转子电压常量Ka7.24铁芯的磁烙的形状和磁性。如前所述,磁体表面贴装的KRPM类型对有效弱磁并无益处,因此设计电机磁路时很可能环温度22.7C仅针对电机以基本转速运行的情况,一旦超过基入转速就会出现饱和现象。饱和效应会导致电气参数发生变化其中之一就是定子的磁链电感,该值会在磁模式下减小。C 2010 Microchip Technology IncDS01292ACN第7页在 dS PICDEM MCLV开发板的两条并联攴路上分别读取要调整的开环参数包括锁定时间、最终加速度以及基准必需的相电流,在ADC采集之后,将读到的值缩放至电流值。锁定时闫代表转子对齐所必需的时间,它取决合适的范围。电流的总缩放因子取决于读取并联支路的于负载初始转矩和转动惯量(这两个值越大,锁定时间差分运放的增益和流经电机的电流的最大值。例如,在就越长)。起动时上升到的最终转速(以RPM表小)并联支路电阻为0.005Ω的情况卜,44A的峰值相电流应没置得足够高,以使估算器计算的BEMF具有足够的和75的增益会导致ADC输入端的电压为33V。对电精度,达到最终转速的时间取决于连接到电机转轴上的流使用缩放因子1,经过例1的转换,得到的电流值将阻性负载:负载越人,达到最终基准转遮所需的时间就为Q15格式,釆用软件实现方案时,必须使用该格式越长。例采用开环控制替代闭环控制起到简化的目的,其中转子磁通和圊定参考坐标系之间的估算角由开环増速控制中使用的强制角替换。强制角不关心转子的位置,而是使抟了位置增加一个角度,从而使转子的位置成为一个不断增加的量。图1给出了控制环的另一种简化形式,即在支持文件屮,电流缩放因子缺少速度控制器,并且q轴的基准电流是硬编码的是通过实验确定的,而并非使用上述步骤,因此消除了q轴基准电流用于提供在转速开环上升阶段流终电机的可能由电气元件公差导致的训算误差。公式8中显小的电流;初始负载越高,所需的电流就越人,负载决定基缩放常量与內部软件变量相乘得到实际电流值。准转短。公式:例2给出了基准电流设置的宏定义,将实际的电流值输入参数归一化至软件要求的范围,其算依赖于电流缩放常量(),最初是通过计算0确定的。作为输入的实际电流值的单位应为安培,并且处于[,]范围内。反之,要获取缩放常量,可以将实际电流值除以软件表示的十进制数。在稳态工作条件下,使用电流探针和例MPLAB③IDE的数据监视和捕捉接凵( Data monitorand capture Interface,DMc)功能,在示波器上测量峰值电流,并将测得的值除以DMCI给出的对应值即可完成上述操作。欲知有关DMC|用法的细节,请查询MPLAB IDE帮助文件。要使算法在开环系统中工作,从而禁止初始调节时的闭公式4显小在阻抗和感抗电压降计算中包含采集的电环控制环节,则应启用例3中给出的特定宏代码定义。流。由于采集过程中叫能存在噪声,需要对感抗电瓜降计算中包含的导数项进行限制以获得有效值。对于待测例电机来说,最人转速为5500PRM,峰-峰值电流为5A的情况下,最大电流变化为每50us025A就最初校准而言,电机起动时应带有负载,此时需要调整开环斜率参数。这对于在激活闭环控制之前,潜在P控制器的重新校准,甚全是一些初始过渡阶段的校验(比如强制角和估算角之间的角误差以及实验确定电流缩放常量),以及最初开环上升参数的精调非常有用。DS01292ACN第8页c 2010 Microchip Technology Inc对于采用弱磁后电机转速超过标称转速的情祝,由于系把这些考虑个内,并考虑公式6,当BEMF保持恒定时统参数呈现非线性,因而调节将更为复杂转速和1/a之间就呈玩比例关系,如公式9所示。从这点开始调整的目的,是要在无负载的条件下,实现测试电机标称转速的倍增。公式:警告:通常,电机制造厂商指出了不损坏电机时能够达到的最大转速(可能比额定电流时的制动点速度要大);如果未指出,电机的运行速度可能更高,但只能作一小段时间(断断续续地),还要承担前一节中于是对于转速倍增而言,为了弥衤感电压降,考虑每所述的退磁或机械损坏风殓电压常数1/d的上升超过一半(125%)的情沉。在查找衣中给出了1/d随转速的变化关系,查找索引在弱磁模式中,如果转速超过标称值而造成FOC失效,随时可能损坏逆变器。其原取决于转速。在开始韶分,查找表将表示1/φ随因在于,BEMF值将大于标称转速时产生转速ω的线性变化关系,不过稍后根据负载情况可对线性变化进行微调以便获得最佳能效。查找索引的获的BEMF值,从而超出DC母线电压值而这是逆变器的功率半导体和DC链路电容得,是把转了实际转速减去弱磁策略开始旄行之后的转速,再除以一个缩放因子。索引缩放因子给出了查找表不得不予以支持的电压。由于打算进行的调整意味着反复的系数校正,直至达到最的精细稈度度量,所以,对于相同的转速范围,缩放因优运行状况,为了防止在高速时电机停子越人,在查找表中得到的点就越少,而点代表的是加转,应确保使用相应电路对逆变器进行保以老虑的转速域。对于我们考虑的电机,最大转速是27500单位,其中5000单位表示1000RPM。考虑缩放因子为1024,弱磁开始转速是13000单位,结果是对调整原理的解释始于图4中的矢量图。考虑在(逆变(27500-13000)/1024=141。作表中有大致15项就器能够提供的)最大电压时生成每安培最大转矩所需的足以覆盖期望的转速范围。反过来计算,假如查找表中电流,低于标称转速时,它表示的只是q分量,这是转有17项,可能的最大转速将是17·1024+13000=矩生成所必需的。口前,等于;但是,弱磁策略开30408单位,约为6000RPM。由于估算的电流速度总始之后,定子电流将等丁d、q分量的矢量和。假设是存在某种程度的噪声,而且在速度值改变时索引的计定子电流及输入电压(绝对值)不变,定子电阻算可能不稳定,因此在软件屮计算索引时,使用的不是上的电压降也将不变,而感抗电压降将随转速成比例增(估算的)电流速度,而是基准速度。可以考虑基准速加。但是,由于表面贴装PM的感应系数值很小,在与度的变化斜率足够慢,从而估算速度能够很接近它。其他隐含指出的测量值进行比较时,可以忽略感抗的增考虑基准和最人遮度之间的线性变化关系,查找表值将加。把这一前提考虑在内,在对电机进行加速时,可以看上去类似于例4,且将使用实验获得的结果更新查找认为弱磁时BEMF是忸定的,由于感抗电压降的增加,BEMF的稍许下降是可以接受的。表值。表中的第一个值表示电机基时的1/d值,如同使用支持文件()所计算的那样。C 2010 Microchip Technology IncDS01292ACN第9页例:电压常数倒数初始化查找表电流的负d分量作用是减小电压常数Φ,在理想情况下是成比例的,如前所述,这为提升转速留下更人空另一方面是弱磁模式屮定子磁链电感的变化,它也是非线性的。为了消除它的影响,意味着要使用另一个査找表,其査找索引如前所述相同。表中的项表示的是转速①时的电感变化率(o),具体值是其索引除以基速时的两倍。表中第一项始终应该是,因为是基速电感除以两倍白身。此时,表中其余各项填充的值都好像其电慼是基速时的一半(例6)。例:电感变化初始化查找表使用标称电流运行电机,将不会导致磁铁的永久消磁。所以,强制d分量(亡负责气弥净磁通密度下降)为标称电流将不会有破坏性影响。在稳态时,由于缓慢的加速斜率以及没有阻抗转矩(除了轴承摩擦和风扇之外),无负载工作吋所需的q分量将非常小。实践中,d轴电流分量的设定通过查找表来进行,其索引与用来查找电压常数耷找表的索引相同。最初,表中填充的值将是电流与转速Q呈线性关系的值(表中的第一项表小的基速值,最后一项表小标称的电流值),如例5所示。例:轴基准电流初始化查找表出于测试目的,在软件中使用缓慢的斜率作为基准速度,使用如下的定义进行激活,如例7所示。例DS01292ACN第10页c 2010 Microchip Technology Inc
- 2020-12-12下载
- 积分:1
多核学习综述
特征融合,多核学习,核方法是机器学习的一种重要思想8期汪洪桥等:多核学习方法10391.2容许核的构造数据的基因功能分类问题,其中就讨论了前期、中期利用核函数可以大大简化计算,但如何针对具和后期三种集成方式.早期集成是指数据的集成,后体的问题设计出最适当的核函数却是一个难点实期集成是指分类器结果的集成,而中期集成就是核际上,经常采用的方法是直接定义核函数,从而隐矩库的组合,它通过对多个基本核矩阵进行合成得含地定义了特征空间. Mercer条件是检验核函数到,基于这种多核矩阵直接求和方式,可以实现异构是否定义了一个特征空间的充分条件,我们称满足数据源的融合,用来训练分类器此后,在蛋白质功能预测56与定位,蛋白质容许楼满是一些闭包性质或条件6,这使得我分子间的交互预测2,蛋白质折叠识别和远端同源们可以从些简单的核函数设计出复杂的核函数性检测2等方向,由于涉及到多特征空间或有效属性质1.容许核的正系数线性组合是容许核性的集合( roups of attributes available)问题,来性质2.容许核的乘积是容许核自异构源的数据具有不同特性,如全局特性、局部特性质3.函数乘积的积分是容许核.性等,这就需要核矩阵在集成时可以评佔这些潜在设s(x,)是一个定义在X×X上的函数,使的异构目标描述子各自的贡献.因此出现了一些加得k(x,x)=/5x,x)(2,x)dx存在则ka,2)板图多核合成方法,这类多核方法都无追过多个核是一个容许核数的线性组合得到的,图1所示的就是其构成的性质4.平移不变核是容许核的充要条件示意图个平移不变核k(x,2)=k(-x)是容许核,类别标号或预测值结果输出)且仅当其傅里叶变换F(u)-(2x)-号xk(x)i(ur)dx是非负的分类或回归(分类器或回归R效性质5.内积型核是容诈核的必要条件.合成核空闫合成核若一个内积型核k(x,2)=k(x·z)是容许核,则它必满足v≥0.k(5)≥0.0k()≥0且k(5)Kernel sKernel h5k()>0核空间(kemC性质6.内积型核是容许核的充要条件.一个内积型核k(x,z)=k(x·z)是容许核,当征空间(C且仅当其幂级数展开式k(t)=∑0ant中所有系数an≥0.对于有限维的空间,条件可以稍微减弱输入数据图1多核函数线性组合合成示意图当前已经仔在较多的满足 Mercer条件的核函rig. 1 Sketch map of composition using multiple kernel数,常见核函数通常可分为两类:局部核和全局核6ar而局部核选择不同的核参数,又可分为大尺度核与小尺度核.在一些复杂情形下.同时考虑核机器分下面呆用公式的形式对上述线性组合合成核进类、回归性能和泛化能力,将不同核组合使用,将是行描述.假定k(x,2)是已知核函数,k(x,2)是它的更合理的选择归一化形式,例如核函数k(x,z)可以采用如下方法进行归一化:√k(x,x)k(z,x).采用以引入的符2基本多核学习:合成核方法号,可以定义以下几种合成核:将不同特性的核函数进行组合,获得多类核函a)直接求和核( Direct summation kernel)数的优点,可以得到更优的映射性能.并且,典型的学习问题经常涉及到多种或者异构的数据,多核方k(,2)=∑k(x,2)法可以提供更佳的灵活性.此外,它可以作为一种巧妙的方法来解释学习结果、使得应用问题可以得到b)加求和核( Weighted summation kernel)更深入的理解.这就是多核学习的一类基本方法,即合成核方法k(x,2)=∑(,2,≥0,∑月=1(6)2.1合成核的构造1)多核线性组合合成方法c)加权多项式扩展核( Weighted polynomial多核学习最早从生物信息学领域得到应用和认extended kernel同.如 Pavlidis等20在2001年就研究了基于异构k(x,z)=ak1(x,2)+(1-a)k2(x,2)(7)1010自动化学报36卷其中.k(x,2)是k(x,x)的多项式扩展是,该合成核矩阵的大小为(s×n)×(s×n),而原近来,这类合成核法又得到一些改进,在图始核矩阵的大小都是n×n,由于合成核矩阵是原始像目标的识别领域得到广泛应用.如在金字塔框架核矩阵规模的§倍,因此样本特征必须被复制,使运对日标形状进行多核表示阿,或釆用多核方法,算量成倍增加自动获得基」决策的一种相应目标类别的稀疏依赖3)其他改进合成核方法图,实现了多类目标联合检测③2].提高了目标的识近年来,针对多核学习中核函数的选取以及杖别率.通过同时考虑多核线性组合的稀疏性和分类值系数的改进,又出现了一些新的多核合成方法,器的强判别力,将多核学习问题转化为不同的优化如:问题58.63,或通过多对象描述子、多特征空间的整a)非平稳多核学习合,并进行快速求解64.此外,合成核方法在特征提前述的多核线性组合方法都是对核函数的平稳取、处理及应用7、分类972-4、图像分割、组合,即对所有输入样本,不同的核对应的权值是系统辨识等方面又得到了一些成功应用不变的.无形中对样本进行了一种平均处理. Lewis2)多核扩展合成方法等吲提出了一种多核的非平稳组合方法,对每个输述合成核方法都是试图通过一种求和“平均入样本配以不同的权值系数.如常规SVM判别函化”的思想42来实现不同核矩阵融合.然而,这里数为存在个丢失原始核矩阵信息的风险.比如,如果数据集的局部分布是多变的.不同的核处理不同的区f(c)=∑0r,m)+b(1域会得到更好的结果,对不同核函数采用平均的方法将丢失刻画这些局部分布的性能.为了实现核矩引入不同的加权系数,典型的合成核SVM的阵的组合而不丢失任何原始信息,可以考虑将多核判别函数可以改写为矩阵进行扩展合成42],新的核矩阵由原核矩阵和其他不同的核矩阵共同构成.在这个更大的核矩阵中原核矩阵仍然存在.因此,原始核函数的性质得以保∫(x)-∑m∑k(x,x)+b(1留.该合成核矩阵的形式为而对于非平稳的合成核SVM,其判别函数改进11K1,2K为2.2K∑a:∑()k(c;,m)(12)K1 K可以看出,原始核矩阵位于新矩阵的对角线上在最大熵判别( Maximum entropy discrimination,其他所有元素是定义为(Kn)3=Fn(m,)的MED)框架下,通过使用一种大间隔隐变量生成两个不同核矩阵的混合,可由如下公式求得(以两个模型,使得隐参数估计问题可以通过变化边界和高斯核为例)一个内点优化过程来表示,并且相应的参数估计可以通过快速的序列最小优化( Sequential minimaloptimization,SMO)算法实现.通过多种数据集的4:4+(9)实验验证,非平稳的多核学习方法具有更好的通用性.很明显,当p=p时,Kp=knb)局部多核学习实验结果显示,当数据集具有变化的局部数据此后,仍旧是针对多核学习在整个输入空间中分布时,这种合成核方法将是更好的选择此外,通对某个核都是分配相同权值的问题,G6nen等0常核组合方法在很大程度上依靠训练数据,并且必利用一种选通模型( Galing nodel)部地选择合须道过学习获取一些权系数,以标识每个核的重要适核函数,提出了一种局部多核学习算法在SVM性.而在护展合成核方法中,这些核函数的重要性可框架下,其判别函数形如以直接从支持向量机的训练过程中导出.由此,分别对应不同核的权系数可以通过一个单独的分类尜优化过程整体得到.并且该优化过程不会像其他加权∑q∑(x)k1(x;xm/r)+b(13)核方法那样,由于在优化权系数和训练分类器过程中两次仗用训练数据而产生训练数据的过拟合.但其中,7z(x)是选通函数,其定义形式为8期汪洪桥等:多核学习方法10117(c)exp((vm, )+Umo)(14)详细阐述了应用于合成核的列生成 Boosting方法并成功推广到分类和回归问题∑ep(,x)+"l2)二次约束型二次规划从数学形式上看,二次约束型二次规划是一类这里的tm和tm是选通模型参数,可以在多核学习目标函数和约束同为二次函数的优化问题过程中通过梯度下降法获得.将局部选通模型和基于核的分类器相结合,优化问题可以用一种联合的方式加以解决.局部多核学习方法获得了与多核学习近似的精度,但只需要存储更少的支持向量.基于st.Px+qx+r;≤0,i=1,2,…,m此, Christoudias等又提出了一种基于 BayesianAr=b的局部权值求取方法,以使学习过稈能适应人规模(1的数据集这里,P,B1,…,Pn是n×n矩阵,优化变量x∈c)非稀疏多核学习R;如果P1,…,Pmn均为0矩阵,则约束变为线性大部分合成核方法都有式(6)的形式,即对多核的,该问题实际变为一个二次规划问题系数的约束是一种1范数的形式,以提高核组合的Bach等针对多核矩阵和分类器系数锥组合稀疏性.稀疏性的提高在一些情况下可以减少冗余,问题的联合优化,提出了Q(QP的-种新对偶肜提高运算效率.但当某个问题多个特征编码间具有式,把它作为一个二阶锥规划,可以利用 Moreau-正交性,稀性可能导致有用信息的丢失和泛化性 Yosida正则化来生成SMO方法的适用形式.实能变弱.Klof等通过对系数引入一种l2范数约验结果显示这种基于SMO的算法比常用工具箱中束,即‖2=1,提出了非稀疏的多核学习方法.虽应用的内点法更有效,广泛应用于支持向量回归问然在此约束下,名核组合形式是非凸的,但通过使用题1二范数‖|2=1边界上的值,可以得到一个紧致的3)半定规划凸近似,这就保证了核矩阵的严格正定性.通过在大通过在一个核矩阵中综合考虑训练数据和测试规模数据集下与C1范数和常用多核学习( Multiple数据, Lanckrict等田通过半定规划技术实现了核kernel learning,MKT)方法进行对比实验,仿真实矩阵的学习问题,也为合成核模型提供了一种功能验结果显示2-MKL在抗噪声和特征集冗余方面具强大的渐进直推式算法,该算法被成功应用并推广有较强的鲁棒性.此后,Klo等刚又将O2范数约到蛋白质功能预测0.其考虑的核矩阵具有如下形束推广到任意C范数,p>1,进步增强了核机器式的通用性和鲁棒性Ktr Ktrt2,2合成核机器的学习方法Kr Kt为了求取合成核的参数,通常是将合戊核与支其中,K一(x)重(x;),1-1,…,mu,m+持向量机方法相结合,然后将目标函数转化成不同1,…,m1+nt:这里nt和m是有标号的训练样的优化问题,如不同的正则化形式或对训练样本本个数和无标号的测试样本个数.我们的目标是的一些约束,通过不同的优化方法进行求解.基于通过优化关于训练数据块Kt的损失函数,学习得此,出现了多种合成核机器的学方法到最优的混合数据块矩阵Kr和测试数据块矩阵1) Boosting方法K1即利用有标号的训练样本米预测测试样本的类早期受集成思想和 Boosting方法的启发,别,也就是说,作者认为在训练的过程中同时考虑训Bennett提出了一种多自适应国归核( Multiple练样本和测试样本,可以找出最佳的核矩阵.但这additive regression kernels,MARK)算法.MARK样产生的问题是,求解核矩阵的搜索空间也相对变定义了一种异构核模型,并考虑一个大规模核知阵大,为了避免过学丬( Overfilling), Lanckriet利用库( Library),这个库由不同的核函数和其参数构成.限制核矩阵的迹为一常数米控制,于是有了约束式通过使用一种梯度 Boosting列生成方法, MARK tr(K)=C构建出异构核矩阵的每一列,然后将其添加到合成半定规划是一种凸优化问题( Convex opti-核中.算法的目标就是在这个核矩阵库的基础上,找 mization problem)∞o,它有一个线性的目标函数到一种构建推广模型的方法.这种方法推广性强,不( Alline objectives lunction)、有限个线性矩阵不等需要存储大量的数据米应对后续的预测,提高了预式约束( Linear matrix inequality constraints)以及测的效率在此基础上,通过与SVM结合,Bi等17有限个线性矩阵等式约束( Affine matrix equality1042自动化学报36卷constraints),其标准形式如下如回归问题、一类分类(奇异检测)问题等.实验结果显示该算法可以有效增强模型的自动选择能力min c u并能提高学习结果的解释性.同时能有效应用于数S.t.Fy()-Fd+uFi+,.+ugFg20十万个样本和数百个核的大规模组合优化问题.这7=1,…,种半无限线性规划相比其他方法明显提高了学习速度,适宜于解决大规模问题.特别是当SVMs与·些Au= b已出现的字符串核( String kernel)相结合, String(17)kernel也是一种有效的核方法,它根据两个字符串其中向量t是最优化目标,FF是n×n的的所有公共子串计算它们的相似度,利用这些核对对称矩阵.F(a)是一个半正定阵,上标j表示特征的稀疏映射,使得我们可以训练一种字符串核可能有1全1个约束式:满足此约束式的所构成sVM,并应用于计算生物学中的千万级样本的数据的集合是一个凸集合.A是一个行数与长度相同,片段24在此基础上,7iem等提出了一种应用于列数与b长度相同的矩阵表示有限个等式约束式联含特征映射的多核学习方法,为多兴分类问题的因此,半定规划是在对称且半正定矩阵的凸子集合多核学习提供了一种史方便和原理化的途径.通过( Convex subsct)卜:求解凸函数的最优化问题针对多核支持向量分类问题,通过定义一种对一种凸Q(QP以及两种 SILPs在数据集上进行比较,实验结果显示 SILPS比QCQP在速度上更能指标( Performance iudex)u(K),基于原始一对有优势终可以转化为一个标准的半定规划形式5)超核( Hypcrkcrncls)对基于核方法的支持向量机而言、如何选择一个合适的核函数实现自动的机器学习是一个很大的min t,t,入,υ,6挑战Ong等3通过定义一种核空间上的再生核t.tr|∑FHilbert空间,即超再生核 Hilbert空间,并引入超核的概念及构造方法,在更广义的层面上实现了这,K;≥0目标定义1(超再生核 Hilbert空间, Hyper reproducing kernel Hilbert space).改Ⅹ为非3.tre-tU8+ xy空集合,Ⅹ:ⅩxX是复合指标集,H为函数f:X→R的 Hilbert空间,该函数可表示为该空间中两(e+-6+入y)1t-26Ce个向量的内积,且其范数f=√f,f,则被0>0称为超雨生 Hilbert空间,如果存在一个超核k:x6>0X→R具有如下性质:(18再生性:对所有∫∈丑,有(k,),/)其中,t是引入的一个替代变量( Auxiliary vari-f(x),特殊地,(k(x),k(,x2)-k(xxablc),v,6,A是引入的 Lagrangian乘子,至此,可b)k张成整个空间H,即H以通过标准的半定规划求解方法得到B及相应的span()(XLagrangian乘子,半定规划具有很高的泛化能力c)对仟一固定的(X,超核k是关于其第线性规划( Linear programming,LP)以及QCQP二个输入的核函数,即对任一固定的x∈X,函数问题都可以转换推广成半定规划门题然后可以很k(x,x)-kx,(x,x),x,x′∈是一个核函数容易地使用内点法( Interior-point method)加以解在超再生核 Hilbert空间上,可以用类似于止则决化品质函数的方法.得到一个从训练数据对核进行4)半无限线性规划学习的推理框架.对超核的学习,可以通过定义Sonnenburg等B7在多核矩阵锥组合的基础上,个被称为品质函数( Quality functional)的量(类似提出了一种通用而更有效的多核学习算法.该方法于风险函数)来实现,这个量可以衡量核函数“非良将Bach等的QCQP对偶形式改写为一种半无限( Badness”的程度线性规划(Semi- infinitite linear program,SILP)形定义2(正则化品质函数, Regularized qual-式,新的规划形式可以在标准的SVM应用问题中, ity functionality).设X,Y分别是训练测试样本利用成熟的线性规划方法进行求解.并且,通过将组合和样本标签,对X的一个半正定核矩阵K,此形式进行推广,算法能有效解决更多类型的问题,其正则化的质函数定义为如下形式:8期汪洪桥等:多核学习方法1013g(,x,Y)=9mp(k,X,Y)+2‖(17)分组LasoLasso回归是目前处理多重共线性的主要方法这里,≥0是一个正则化常数,h表示空间之一,相刘于其他方法,更容易产生稀疏解:在参H中的范数,Qm(k,X,Y)是一种经验品质函数,数估计的同时实现变量选择,因而可以用来解决检它表示核函数k与某一特定数据集X,Y的匹配程验中的多重共线性问题,以提高检验的效率.Laso度,该函数的值常用来调整k以使得gm最优(如:可以推广为分组Laso( Group lasso),从而使得最优核目标度量)模型的解可以保持组稀疏性和层次性.Bach26·关引理1(再生核 Hilbert空间的表示定理,注于分块1范数正则化的最小二乘回归,即分组Representer theorem for hyper-RKHS).设Las0o题,研究了其渐进模型一致性,推导出了分X为非空集合,Qmp是任意经验品质函数,X,Y组Laso-致性在一些实际假设下的充要条件,如分别是训练测试样木组合和样木标签,则每一个最模型误定.当线性预测器和欧氏范数(2范数)用函小化正则化品质函数g(k,X,Y)的k∈Ⅱ具有数和再生核 Hilbert,范数代替,这就是常说的多核学以下的一种表示形式习问题.通过使用函数分析工具和特定的协方差算,将上述一致性结果推广到无限维情形,同时提出k(x)=∑月12(m,m),(m,m1),,x∈x种自适应方法来获得一致性模型的估计,即使2,7在非适应方法必要性条件不满足的情况下也能适用(20)为多核学习间题提供了一条新的途径对每一个1≤i,≤M,这里B;∈R2.3其他合成核参数学习方法根据超再牛核 Hilbert空间的表示理论可知,由超核构造的决策函数不仅由某一个单核构成,而且从最简单的多个核直接求和到上述的各种改进还由多核之间的一个线性组合构成,因此具有更优合成核构造方法,多核学习经历了从经验性选择的性能在分类、回归以及奇异检测等方面的实验证运用多和优化方法求解的过程但针对一些具体间实了该方法的有效性B.8,拓展了多核模型选择与题,对核参数的选取,多核权系数的设定,目前还没合成的研究途径有形成一个合理统一的模式.常用的方法只能是凭6)简单MKL借经验、实验对比、大范围的搜索或通过交叉验证从Bach等的多核学习框架36出发, Sonnen-等进行寻优.在这种情况下,也出现了其他的些方bug等提出了种通用而更有效的多核学习算法,实现了多核学习问题,典型的有法37,该方法通过迭代使用现有的支持向量机代1)基于智能优化方法的多核学习码,从一个新的角度解决了人规模问题的多核学习这类方法主要通过一些比较成熟的智能优化然而,这种迭代算法在收敛到一个合理解之前,需要方法,建立目标函数,寻找该函数极值的过程就是过多的迭代运算. Rakotomanonyy等27用一种自合成核参数寻优的过程如采用多项式核与径向适应的C2范数正则化方法米考虑多核学习问题,每基核的合成核2作为支持向量机的核函数k个核矩阵的权系数被包含在标准SVM的经验风险2-(1-p)km,将其用SVM进行预测过程中最小化问题中,并采用(2约束以提高解的稀疏,的参数向量(d,o,,p)作为粒子,其中d为多项式然后采用了一种基于分块1范数正则化的算法来解核参数,为径向基核尺度参数,y为SVM调整参决这一问题,为多核问题提供了一个新的视角,并且数,p为合成核的权重参数,利用粒了群算法对该合证明了该方法与Bach等的方法是等效的.从上运成核的参数进行优化,最终找到最优的预测结果描述可以看出,除了学习合成核外,该与法解决的是2)基于核目标度量的多核学习个标准的SVM优化问题,这里核的定义形式为核度量434是两个核函数之间或核函数与目多个核的线性组合. Rakotomamonjyl称之为简标函数间的一个相似性度量,在多核矩阵信息融合单多核学习( Simple MKL)在加权的2范数正则方面得到了应用,其概念最早由 Cristianini等提出化形式下,同时对多核权系数进行一个额外的1范考虑一个两类分类数据集S={(x,1)}=1,其中非数约束,为多核学习提供了一种基于混合范数正则∈{+1,-1},则在数据集S下,两个核矩阵之间的化的新思路.简单多核学习可以从两类分类问题向核度量定义为其他方向扩展,如回归、类、一类分类(奇异检测)A(S,K1,K2)(K1,K2)以及多类分类问题,具有很强的通用性,并且与其他(21√k1,K1)F(K2,k2)F多核学习算法相比,该算法收敛速度更快且效率更这里,(K,Ka)F=>1-1Fn(x2:)(x,T)通1044自动化学报36卷过上式,对应于S的核矩阵K的性能可以通过A;-2,t-0,1,2,值米量度,如:A(5,K,G),这里的G是基于特定任务的理想核G=y,其中y=m12…,.基另一种典型多尺度核为小波核函数( Waveletkernel function) 831于对目标核的度量原珥,通过使用不同的核函数,或定理1.令h(m)是一个小波母函数,a和c分者调节不同的参数值,可以产生一组核矩阵.然后,别表示仲缩和转移因子,a,∈R如果x,z∈R对该度量值的最大化执行半定规划或其他学习方法,则内积型小波核函数可表示为以得到一个对不同核矩阵加权组合的最优核3多个尺度的多核学习:多尺度核方法k(2)=江4(合成核方法虽然有了一些成功应用,但都是根据简单核函数的线性组合,生成满足 Mercer条件的转移不变小波核函数为新核函数;核函数参数的选择与组合没有依据可循,对样木的不平坦分布仍无法圆满解决,限制了决策k(a, z)=(函数的表示能力.在此情况下,山现了多核学习的种特殊化情形,即将多个尺度的核进行融合.这种定理2.考虑具有一般性的小波函数方法更具灵活性,并且能比合成核方法提供更完备的尺度选择.此外,随着小波理论、多尺度分析理论h(x)=cos(1.75x)252间使其其有了很好的且论录这类方法目箭也如果x2(R",则小波核函数为得到了很好的利用,烘型的如 Kingsbury等③2将多个尺度大小的核进行分光heng等B到、 Yang k(a,2)=h(x二等834提出了多尺度支持向量回归.分别用于非平坦i=1数的估计和时序列预测.此外,通过进一步将多∏1c015(n-2)C一之尺度核与支持向量机结合.多尺度核方法在基于回归的热点检测48和图像压缩49等方面均得到了应(26用.近来,结合多尺度分析方法,基于 Hilbert空间通过仲缩因子a的变化,即可得到不同尺度的小波中的再生核进行函数重构得到了重视并进行了相关的应用研究;此外,多尺度核方法又逐步推广到核函数了高斯过程的健模与处里-27,这对基于核方法3.2多尺度核的学习方法的机器学习又是一次大的扩展1)多尺度核序列学习方法3.1具有多尺度表示能力的核函数对多尺度核的学习,很直观的思路就是进行多尺度核的序列学习.多尺度核序列合成方法32简单度表示能力的核函数.在被广泛使用的核函数中,高理解就是先用大尺度核拟合对应决策函数平滑区域的样木,然后用小尺度核拟合决策函数变化相对剧斯径向基核烈区域的样本,后面的步骤利用前面步骤的结果,进k(a, a )=cxp(22行逐级优化,最终得到更优的分类结果考虑一个两尺度核k1和k2合成的分类问题是最受欢迎的,因为它们具有通用普遍的近似能力,我们要得到合成的决策函数同时它也是一种典型的可多尺度化核.以此核为例f(x)=f1(x)+f2(x)将其多尺度化(假设其只有半移不变性):k(-22这里22af()=∑ak1(xn,)b2其中.σ1
- 2020-12-07下载
- 积分:1