EM算法详细例子及推导
EM算法详细例子及推导数θ),那么对于上面的实验,我们可以计算出他们出现我们观察到的结果即0=(5,9,.8,4,7,20=(B,A,A,B,4)的概率函数P(X=x10),2z)⑨)就叫做θ的似然函数。我们将它对θ求偏导并令偏导数为0,就可以得到如的结果P(X=x0,=20))=(;P(z=A)3(1-P(z=A)2C10(1-64)10A(1-6C104(1-0(1-6B)C106n(1-6我们将这个问题稍微改变一下,我们将我们所观察到的结果修改一…下我们现在只知道每次试验有几次投掷出正面,但是不知道每次试验投掷的是哪个硬币,也就是说我们只知道表中第一列和第三列。这个时候我们就称Z为隐藏变量( Hidden variable),X称为观察变量( Observed variable)。这个时候再来估计参数θ4和θB,就没有那么多数据可供使用了,这个时侯的估计叫做不完整数据的参数估计。如果我们这个时候冇某种方法(比如,正确的猜到每次投掷硬币是A还是B),这样的话我们就可以将这个不完整的数据估计变为完整数据估计当然我们如果没有方法来获得更多的数据的话,那么下面提供了一种在这种不完整数据的情况下来估计参数θ的方法。我们用迭代的方式来进行:(1)我们先赋给θ一个初始值,这个值不管是经验也好猜的也好,反正我们给它一个初始值。在实际使用中往往这个初始值是有其他算法的结果给岀的,当然随机给他分配一个符合定义域的值也可以。这里我们就给定64=0.7,6B=0.4(2)然后我们根据这个来判断或者猜测每次投掷更像是哪枚硬币投掷的结果。比如对于试验1,如果投掷的是Δ,那么出现5个止面的概率为C10×0.75×(1-07)5≈0.1029:;如果投掷的是B,出现5个正面的概率为C105×0.43×(1-0.4)5≈0.2007;基于试验1的试验结果,可以判断这个试验投掷的是使币A的概率为0.10290.10290.2007)-0.389是B的概率为02007(0.1029+0.2007)06611。因此这个结果更可能是投掷B出现的结果(3)假设上一步猜测的结果为B,A,A,B,A,那么恨据这个猜测,可以像完整数据的参数仙计一样(公式2重新计算的值这样一次一次的迭代2-3步骤直到收敛,我们就得到了θ的估计。现在你可能有疑问,这个方法靠谱么?事实证明,它确实是靠谱的。期望最大化算法就是在这个想法上改进的。它在估计每次投掷的硬币的吋候,并不要确定住这次就是硬币A或者B,它计算岀来这次投掷的硬币是A的概率和是B的概率;然后在用这个概率(或者叫做Z的分布)来计算似然函数。期望最大化算法步骤总结如下:F步骤先利用旧的参数值〃计算隐藏变量Z的(条件)分布P(万=2|Xn2),然后计算logP(,X=m)的期望B(o(2,X=x)=∑∑P(Z=别X=)P(Z=X=x)其中θ是当前的值,而θ是上一次迭代得到的值。公式中已经只剩下θ一个变量了,θ是一个确定的值,这个公式或者函数常常叫做Q函数,用Q(6,6)来表示。M步骤极大化Q,往往这一步是求导,得到由旧的θ值′米计算新的θ值的公式aQ总结一下,期望最大化算法就是先根据参数初值估计隐藏变量的分布,然后根据隐藏变量的分布来计算观察变量的似然函数,估计参数的值。前者通常称为E步骤,后者称为M步骤3数学基础首先来明确一下我们的目标:我们的目标是在观察变量X和给定观察样本:1,x2,…,rn的情況下,极大化对数似然函数(=>nP(X2=x;)(5)其中只包含观察变量的概率密度函数P(X2=2)=∑P(X=n,=)这里因为参数θ的写法与条件概率的写法相同,因此将参数θ写到下标以更明确的表述其中Z为隐藏随机变量,{}是Z的所有可能的取值。那么6)=∑h∑P(X=x,z=2)∑h∑。Px=x这里我们引入了一组参数(不要怕多,我们后面会处理掉它的)a,它满足可能的;,0;∈(0,1和∑;a=1到这里,先介绍一个凸函数的性质,或者叫做凸函数的定义。∫(x)为凸函数,=1,2,…,m,A∈[0,1∑1A对∫(x)定义域中的任意n个m1,x2,…,xn有f(∑Aa)≤∑mf(xr)i=1对于严格凸函数,上面的等号只有在x1=2xn的时候成立。关于凸函数的其他性质不再赘述。对数函数是一个严格凸数。因而我们可以有下面这个结果0)=∑hn∑≥∑∑ah(X=2n,2=C现在我们根据等号成立的条件来确定a;即P(X=x,Z=2)C(10)其中c是一个与j无关的常数。因为∑,=1,稍作变换就可以得到P(X;=x;)现在来解释下我们得到了什么。c;就是Z=2;在X=x;下的条件概率戌者后验概率。求α就是求隐藏随机变量Z的条件分布。总结一下目前得到的公式就是)-∑∑P(Xi=i,Z(12)直接就极大值比较难求,EM算法就是按照下面这个过程来的。它就是大名鼎鼎的琴生( Jensen)不等式(1)根据上一步的θ来计算α,即隐藏变量的条件分布(2)极大化似然函数来得到当前的的估计3.1极大似然估计好吧,我觉得还是再说说极大似然估计吧。给定一个概率分布D,假设其概率密度函数为f,其中f带有一组参数6。为了估计这组参数6,我们可以从这个分布中抽出一个具有n个采样值的X1,X2,…,Yn,那么这个就是n个(假设独立)同分布随机变量,他们分别有取值x1,x2…,xn,那么我们就可以计算出出现这样一组观察值的概率密度为lI f(ai)(13)对于f是离散的情况,就计算出现这组观察值的概率10)注意,这个函数中是含有参数0的。0的极大似然估计就是求让上面似然函数取极大值的时候的参数O值。般来说,会将上面那个似然函数取自然对数,这样往往可以简化计算。记住,这样仅仅是为了简化计算。取了自然对数之后的函数叫做对数似然函数。ln()=∑lnf(n)因为对数是一个严格单调递增的凹函数,所以对似然函数取极人值与对对数似然函数取极大值是等价的。3取了对数之后还可以跟信息熵等概念联系起来4关于凸函数有很多种说法,上凸函数和下凸函数,凸函数和凹函数等等,这里指的是二阶导数大」(等」)0的一类函数,而凹函数是其相反数为凸数的一类函数32期望最大化算法收敛性如何保证算法收敛呢?我们只用证明l(04+1)≥1(00)就可以了l(0(t11)∑∑(+1)1PX=x;2=2)(+(t+1∑∑nf(X=x;,z=z;)(+1)(t)o(tn /(r=i,Z=2(t)≥∑∑ahn(t)7(0其中第一个人于等于号是因为只有当a取值合适(琴生不等式等号成立条件)的时候才有等号成立,第二个人于等于号正是M步骤的操作所致。这样我们就知道l(θ)是随着迭代次数的增加越来越人的,收敛条件是值不再变化或者变化幅度很小。4应用举例4.1参数估计很直接的应用就是参数估计,上面举的例子就是参数估计42聚类但是如果估计的参数可以表明类别的话,比如某个参数表示某个样本是否属于某个集合。这样的话其实聚类问题也就可以归结为参数估计问题。References[]最大似然估计[oNline].Availablehttp://zh.wikipediaorg/wiki.%E6%9c%80%E5%A4%A7%E4%BC%BC%E7%84%B6%E4%BC%B0%E8%AE%A1[2] Ceppellini, r, Siniscalco, M.& Smith, C.A. Ann. Hum. Genet. 20, 97-115(1955)3 Hartley, H. Biometrics 14, 174-194(1958)4 Baum, L.E., Petric, T, Soulcs, G.& Weiss, N. Ann. Math. Stat 41, 164-171(1970)[ 5] Dempster, A P, Laird, N.M., Rubin, D B.(1977). "Maximum Likelihoodfrom Incomplete Data via the em algorithm. Journal of the royal statis-tical Society Series B(Methodological)39(1): 1-38. JSTOR 2984875 MR0501537[6]Whatistheexpectationmaximizationalgorithm[oNline].Avaiable:http//ai. stanford. edu/-chuongdo/papers/em tutorial pdf[7TheEmAlgorithmOnline.Availablehttp://www.cnblogs.com,jerrylead/ archive/2011/04/06/2006936html
- 2020-12-07下载
- 积分:1
Observers in Control Systems
详细介绍了状态观测器及其在控制系统中的应用。Observers inControl SystemsA Practical guideGeorge ellisDanaher corporation4ACADEMIC PRESSAn imprint of elsevier ScienceAmsterdam Boston London New York Oxford ParisSan Diego San Francisco Singapore Sydney TokyoThis book is printed on acid-free paper ooCopyright 2002, Elsevier Science (USA)All rightsNo part of this publication may be reproduced or transmitted in any form or by anymeans, electronic or mechanical, including photocopy, recording, or any informationstorage and retrieval system, without permission in writing from the publisher. Requestsfor permission to make copies of any part of the work should be mailed to thefollowing address: Permissions Department, Harcourt, Inc, 6277 Sea Harbor DriveOrlando. Florida. 32887-6777.ACADEMIC PRESSAn imprint of Elsevier Science525 B Street, Suite 1900, San Diego, CA 92101-4495, USAhttp://www.academicpress.comAcademic pr84 Theobalds Road. London WCIX 8RR. UKhttp://www.academicpress.comLibrary of congress control Number: 2002104256International Standard book Number: 0-12-237472-XPrinted in the United States of america020304050607MB987654321TO Lee Ann, my loving wife, and our daughter Gretchen, who makes us both proud.Observers in Control Systems■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■Acknowledgments■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■Safety■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■1 Control Systems and the role of observers■■■■■■■■■■■■■■■■1.1 Overviewaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa1.2 Preview of observers21.3 Summary of the book2 Control-System Background52.1 Control-System Structures52.2 Goals of control systems132.3 Visual Model Simulation Environment2. 4 Software Experiments: Introduction to Visual ModelQ182.5 Exercises393 Review of the Frequency Domain.■■■■■■■■■■■■■■■■■■■■■■■■■■■■■3. 1 Overview of the s-domain413.2 Overview of the z-Domain543.3 The Open-Loop Method593.4 A Zone-Based Tuning Procedure623.5 Exercises664 The Luenberger observer: Correcting SensorProblems674. 1 What Is a luenberger observer?674.2 Experiments 4A-4C: Enhancing Stability with an Observer724.3 Predictor-Corrector Form of the Luenberger Observer774. 4 Filter Form of the luenberger observer. ..................................784.5 Designing a Luenberger observer824.6 Introduction to Tuning an observer compensator9047 Exercises955 The Luenberger Observer and Model Inaccuracy... 975.1 Model Inaccuracy.........….……,975.2 Effects of Model Inaccuracy .............................................1005.3 Experimental Evaluation1025.4 Exercises1146 The Luenberger observer and disturbances1156.1 Disturbances1156.2 Disturbance Response1236.3 Disturbance DecouplingIB..-.81296.4 Exercises1387 Noise in the Luenberger Observer…,,,…,,…,…,1417.1 Noise in Control Systems1417.2 Sensor noise and the luenberger observer1457.3 Noise Sensitivity when Using Disturbance Decoupling1567. 4 Reducing Noise Susceptibility in Observer-Based Systems1617.5 Exercises1708 Using the Luenberger Observer in Motion Control1738.1 The Luenberger observers in motion Systems1738.2 Observing Velocity to Reduce Phase Lag1858.3 Using observers to Improve Disturbance Response..... 2028.4 Exercises212Referencesn213A Observer-Based resolver conversion in industrialServo Systems1■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■■217B Cures for mechanical resonance in IndustrialServo Systems227Introductionaaa日aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa日aaaaa.aaaaaaaaaaaaaaa日aa227TWo-Part Transfer function228LOW-Frequency Resonance229Velocity Control Law…...8....230Methods of Correction Applied to Low-Frequency Resonance231Conc| usion.…235Acknowledgments235References235C European Symbols for Block Diagrams237Part Linear functions237Part l: nonlinear functions238D Development of the bilinear transformation241Bilinear Transformation241Prewarning242Factoring polynomials243Phase Advancing………………………,243Solutions toChapter 2245Chapter 3245Chapter 4246Chapter 5重口m口m246Chapter 6247Chapter7.….B..8..8..8...248Chapter 8249Index251AcknowledgmentsWriting a book is a large task and requires support from numerous people, and thosepeople deserve thanks. First, I thank LeeAnn, my devoted wife of more than 20 yearsShe has been an unflagging fan, a counselor, and a demanding editor. She taught memuch of what I have managed to learn about how to express a thought in ink. Thanksto my mother who was sure I would grow into someone in whom she would be proudwhen facts should have dissuaded her Thanks also to my father for his insistence thatI obtain a college education; that privilege was denied to him, an intelligent man borninto a family of modest meansI am grateful for the education provided by Virginia Tech Go Hokies. The basicsof electrical engineering imparted to me over my years at school allowed me to graspthe concepts I apply regularly today. I am grateful to Mr. Emory Pace, a toughprofessor who led me through numerous calculus courses and, in doing so, gaveme the confidence on which I would rely throughout my college career and beyondI am especially grateful to Dr Charles Nunnally; having arrived at university froma successful career in industry, he provided my earliest exposure to the practicalapplication of the material I strove to learn. I also thank Dr robert lorenz of theUniversity of Wisconsin at Madison, who introduced me to observers some years agoHis instruction has been enlightening and practical. Several of his university coursesare available in video format and are recommended for those who would like toextend their knowledge of controls. In particular, readers should consider ME 746which presents observers and numerous other subjectsI thank those who reviewed the manuscript for this book. Special thanks goes toDan Carlson for his contributions to almost every chapter contained herein Thanksalso to Eric Berg for his numerous insights. Thanks to the people of KollmorgenCorporation(now, Danaher Corporation), my long-time employer, for their continuing support in writing this book. Finally, thanks to Academic Press, especially to JoelClaypool, my editor, for the opportunity to write this edition and for editing, printing, distributing, and performing the myriad other tasks required to publish a bookX1
- 2020-12-11下载
- 积分:1