登录
首页 » Others » 基于视频的三维重建研究

基于视频的三维重建研究

于 2020-12-11 发布
0 359
下载积分: 1 下载次数: 4

代码说明:

这是一篇华中科技大学的硕士毕业论文,里面对三维重建技术的讲解很详细,适合作为综述来看独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他个人或集休已经发表或撰写过的研究成果。对木文的研究做出贡献的个人和集休,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。学位论文作者签名:日期:年月日学位论文版权使用授权书本学位论文作者完全了解学校有关侏留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权华屮科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以釆用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密口,在年解密后适用本授权书本论文属于不保密口。(请在以上方框内打“√”)学位论文作者签名指导教师签名:日期:年月日日期:年月日万方数据华中科技大学硕士学位论文摘要基于视频的重建技术在计算杋视觉领域中扮演着非常重要的角色,而如何恢复场景的三维模型是目前研究的热点与难点问题。本文围绕基于视频的场景重建技术展开讨论,包括棊于单目视频的三维场景重建和于双目视频的视差图和场景流获取。由于单目包含的深度信息比较少,如何基于单目视频恢复相机的运动参数以及目标的深度信息是研究的重与难点。双目视频虽然包含了非常显著的深度信息,但是考虑到视频中场景的迕续性问题,如何使得恢复岀的深度图保持前后帧的连续性以及场景中运动日标的一致性,也是比较困难的问题。因此,针对上述所提到的问题进行了深入的研究,具体的研究工作如下第一,对三维重建研究进行了详细的介绍,介绍了对于特征点匹配的理解以及我们提出的基于特征引导偏向性高斯混合模型( Feature Guided Biased GaussianMixture model,FGBG);详细介绍立体视觉中立体匹配算法的原理、分类及评测标准,并在4个典型的数据集上对有代表性的局部、全局、半全局算法进行对比实验。此外,详细介绍运动恢复结构(SFM)的基本原理,并进行了实验分析。第二,提岀一种基于双目视频的视差图和场景流获取技术。基于双目视频,首先获得初始的视差图和2D特征点轨迹;在此基础上获得初始的3D稀疏运动轨迹,利用本文提出的 Object Motion Hypothesis(OMH)算法获得运动物体的致性假设采用 slanted-plane model以及参考图像与前后时间点图像对的约束关系,构建超像素和运动物体之间的能量模型,通过优化获得视差和场景流的估计结果。第三,提出一种棊于单目视频的动态场景重建系统。在获取特征点轨迹的基础上,基于运动信息获得特征点轨迹的聚类结果;提出一种基于超像素的多标记Graph-cut算法,得到每一个日标的精确边界;为每一个运动日标分配一个虚拟相机通过标准的SFM方法分别单独估计每个运动目标对应的虚拟相机的参数和稀疏三维点云,通过PMVS和泊松表面重建获得目标的稠密重建结果。关键词:三维重建、单∏视频、双目视频、视差、场景流万方数据华中科技大学硕士学位论文Abstract3D reconstruction based on video has play an important role in computer vision, andhow to recover 3D scene model has been paid much attention and is a difficult problemBased on the importance of 3D reconstruction, in this paper, the 3D reconstruction basedon video has been studied, including 3D scene reconstruction based on monocular videoand depth map and scene flow estimating based on binocular video. Since the monocularcontains much less depth information, how to recover the camera motion and depth maphas been a difficult problem. Besides, although binocular view contains significant depthinformation, it is difficult to keep the consistency of depth map and moving objectsTherefore, in view of the problems mentioned above the specific research works are asFirst. we introduce two directions of 3D reconstruction in computer vision: based onstereo vision method and based on structure from motion. The stereo matching method hasbcen introduced in detail, including algorithm principle, classification, and evaluationmethod. And, we compare the global, local and semi-global algorithm on four typicaldataset. In addition, we have made a detail introduction of structure from motion(SFM)and the experiment has been carried out to get 3D point cloudSecond, a method for depth map and scene flow estimation is proposed. First, inputbinocular video, initial disparity map is got by SGM, 2 point trajectories are got byoptical flow. Then the 3D tracks are got by disparity map and 2D point trajectories, get theobject motion hypothesis. Considering constraint between the reference image and theforward-backward images, the energy model based on super-pixel and object isconstructed using slanted plane model. Finally, the depth map and scene flow will be gotThird, a method for reconstructing monocular dynamic scene with multiple movingrigid objects captured by a single moving camera is proposed. First of all, feature pointsare matched through the video sequence via the optical flow method and the tracks "aregot based on these matches. Then the tracks are divided into several groups according totheir motion differences. An improved graph cuts based multi-label auto imagesegmentation method is used to acquire the accurate boundary of each moving object and万方数据华中科技大学硕士学位论文the static background. Then we assume a virtual camera for each moving object and thestatic background. The pose of these virtual cameras are estimated via the standardStructure from Motion(SFM) pipeline. Finally a dense point set and textured model isreturned for each virtual camera. We evaluate our approach on real-world video sequenceand demonstrate its robustness and effectivenessKey words: 3D reconstruction, monocular video, binocular video, disparity, scenefleOw万方数据华中科技大学硕士学位论文目录摘要Abstract绪论1研究的背景及意义2国内外研究现状1.3论文的主要工作及结构···································:··········.················4·2三维重建基本方法研究2.1引言.………8)2.,2线性摄像机模型(8)23基于特征点的图像匹配24运动恢复结构方法(12)2.5立体匹配与三维重建···.·.·······.·················:····.····················(15)26本章小结(22)基于双目视频的视差图与场景流估计3.1引言(23)3.2运动目标的提取(25)3.3双向约束场景流模型..31)34实验分析.333.5本章小结(444基于单目视频的三维重建研究(45)4.2目标分割(464.3三维场景估计(51)万方数据华中科技大学硕士学位论文4.4实验分析(52)4.5本章小结(55)5全文总结与展望5.1木文的主要页献与创新点(56)5.2工作展望…7)致谢S8)参考文献非D·非非··非。非(59)附录万方数据华中科技大学硕士学位论文绪论11研究的背景及意义视觉是人类的基本功能。通过视觉,人们能够感知外部世界中物体的大小,以及辨别物体之间的相对位置,并且了解它们之间的相互关系。人类把这种功能称为视觉功能。随着科学技术的不断创新,新兴的电子产品不断涌现,数码设备的成熟和计算机理论的涌现让人们越来越关注计算机视觉。人们开始利用摄像机采集视频或者图像,并将其转化为人类可理解的信号。即利用计算机实现模仿人类视觉的功能,计算机视觉也就随之六生。计算机视觉是个涵盖多种学科知识的新兴学科。其理论研究的最终目的是通过对采集到的视频或者图像进行处理,将二维图像或视频转化为三维信息,从而感知场景或物体的形状及运动。因此,计算机视觉吸引了越来越多的研究人员参与其中,包括图像处理与模式识别,应用数学,计算札科学与技术等等。三维场景重建作为计算札视觉中一个重要的研究方向,受到许多研究者的青睐。最近,获取三维场景信息的方式主要有以下三种:第一种,利川常见的建模软件3DMax、CAD等进行重建;第二种,利用深度扫描仪、红外或者激光测距仪器等设备进行三维重建;第三种,利用计算机视觉原理,基于视频或者图像获取场景的三位模型。在上述方法中,第一种是最为成熟的,但是第一种方法的操作步骤十分复杂,并且建模周期长。第二种方式能够获得物伓的髙精度几何模型,但是这些仪器价格昂贵,费时费力,并且对于重建大型场景非常局限。因此,第三种方式受到了普遍的关注,它可以重建复杂的室外大型场景,真实感强,价格低廉且方便携带。利用图像或者视频对场景进行重建,即从图像或视频中恢复场景或者物体的三维几何信息,构建三维模型,给人以视觉亨受。三维重建的用途十分广泛,它可以用于机器人导航,无人驾驶,医学图像分析,游戏等众多方向在众多的三维场景重建方法中,于视频的重建方法一直是一个研究热点。其中,从单目视觉的角度出发,基于单目视频的三维重建技术就是利用单个摄像札对万方数据华中科技大学硕士学位论文场景进行拍摄,研宄如何利用图像序列光流估计运动物体或场景的三维运动来重建三维模型。从双日视觉的角度出发,基于双∏视频的三维重建技术就是利用两个摄像机,从两个不同的角度对同一个场景进行拍摄,研究如何利用左右两个图像序列各自的运动信息,以及左右视图之间的视差信息,完成场景的三维重建。本文的基于视频的三维重建技术具有十分重要的研究价值。针对双目视频,提出了一种基于双目视频的视差图和场景流获取技术,目的是同时获得视差图和场景流信息、。针对单目视频,提出个完整的基于包含多个刚体运动目标的单目动态场景视频的重建系统。12国内外研究现状121基于单目视觉的三维重建研究现状近年来,3D静态场景的重建己经取得了显著性的突破。其中,大多数的研究都是遵循一个特定的步骤:首先从一组多视角的图像中提取特征点,然后对多视图中的特征点进行匹配,构建基础矩阵,恢复相机参数,从而得到玚景的三维结构凹。其中, Snavely N主要通过SFM( (structure from motion)从无序图像序列中恢复相机的位置以及获得场景的三维稀疏点云倒。除∫稀疏点云的重建之外,很多学者也集中研究场景的三维稠密重建四。其中, Seitz s m对多种立体匹配算法进行比较,并且是第一个提供已标定的多视图数据集。 Kolev K在前者的基础之上提出了一个全局能量模型,融合了轮廪信息和立体信息。值得一提的是,深度信息也是一种非常有前景的3D重建方法,主要思想是通过恢复图像的深度信息,融合多幅深度图逃行稠密重建η。此外,很多研究集屮于基于单个视频的稠密表面重建,主要包括基于场景流( scene flow)s, mesh- based稠密表面重建例, patch-base稠密表面重。但是,大多数捕获的视频中,动态场景视频比铰常见。而上述的研究只能用于处理静态场景,它们在应对多目标运动场景方面是十分有限的。最近, Tron r提出了一个包含动态运动目标的场景分割标准山,它是·个重要的3D运动估计和重建的预处埋过程视频重建主要有于两个视图12和基于多个视图314其中,HanM和万方数据

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • 风电场风速和发电功率预测研究.pdf
    风速预测对风电场和电力系统的运行都具有重要意义。对风速进行比较准确的预测,可以有效地减轻或避免风电场对电力系统的不利影响,同时提高风电场在电力市场中的竞争能力。基于时间序列法和神经网络法,该文对风速预测进行了研究,提出了预测风速的时序神经网络法。该方法用时间序列法建模,得到风速特性的基本参数,并用这些参数选择神经网络的输入变量;为了提高预测精度,提出了滚动式权值调整手段。该方法有效地提高了风速预测的精度。
    2020-04-02下载
    积分:1
  • 基于stm32的示波器
    包含全部程序工程,测试成功的,程序全部是自己敲出来的,测量的频率范围最大500Khz,再高就不稳定
    2020-12-04下载
    积分:1
  • 基于Simulink的汽车动力性能模型
    分别对几种轿车的发动机特性与最高车速、加速能力等汽车动力性指标进行了仿真. 仿真结果表明,相关仿真数据与厂家提供的参考数据相吻合. 所建立的仿真模型是实用的,具有车型适应性强、模型参数量少且易获取等特点.
    2020-12-01下载
    积分:1
  • scratch3.课件+源码.rar
    Scratch3.0课件ppt有学习目标、有内容,适合自学,或者机构开课用
    2020-12-10下载
    积分:1
  • LAMP兄弟连李明老师Linux讲义笔记PPT下载
    [LAMP兄弟连李明老师讲Linux].课件01_第1讲.Linux应用与发展课件.pdf[LAMP兄弟连李明老师讲Linux].课件02_第2讲.Linux系统安装.pdf[LAMP兄弟连李明老师讲Linux].课件03_第3讲.Linux常用命令课件.pdf[LAMP兄弟连李明老师讲Linux].课件04_第4讲.文本编辑器Vim.pdf[LAMP兄弟连李明老师讲Linux].课件05_第5讲.Linux引导流程解析.pdf[LAMP兄弟连李明老师讲Linux].课件06_第6讲.Linux软件包管理课件.pdf[LAMP兄弟连李明老师讲Linux].课件07_第7
    2020-12-08下载
    积分:1
  • AODV代码详细注释
    AODV源代码的底层C++协议的详细注释,对掌握理解AODV协议有很大的帮助。
    2020-12-03下载
    积分:1
  • 欠定盲源分离经典
    Bofill的经典欠定盲源分离英文文章,对应的程序!
    2020-12-06下载
    积分:1
  • 开源喷墨打印机改单片机CNC
    喷墨打印机单片机驱动,写字机,激光雕刻机,点胶机,绘画机,笔式打印机
    2020-07-02下载
    积分:1
  • Guns技术文档及完整视频百度云盘地址.rar
    Guns技术文档和完整视频百度云盘地址和PDF文档 花钱购买的分享给大家
    2021-05-07下载
    积分:1
  • Gabor小波+PCA+LDA特征提取方法的人脸表情识别
    基于Gabor小波+PCA+LDA特征提取方法的人脸表情识别 论文机电技术2011年12月(k)(×()4eXp|-0.5(0(4)-2×3.1415926)×U第四步:初始模型确定下来以后,采用则将该待识别人脸表情判别为第讠类表情Baum- Welch算法对参数进行重估计,选代调整模人脸表情实验及分析型参数以达最优化。这样就完成了训练建模工作,获得了在粗分本文在JAFE( Japanese Female Facial Expre-类层次下代表7种人睑表情的IMM模型sion)表情数据库中进行实验。 JAFFE人脸表情库a1=(A,B,)(=1,2,…,7)10个人,共213幅图像组成,每人都包含愤怒、23HMM人脸表情分类厌恶、恐惧、髙兴、悲伤、惊讶和中性7种表情,对待识别的人脸表情图像,按本节22中模型每人每种表情2~4幅,每和表情共有27幅本文实验与 Mihcac等的测试方法相似,把数训练步骤的第一步获得观察向量O,然后计算观据库中的210图像分成3个部分,每个部分包含察向量O与已训练好的HMM模型A1=(A,B,z)10个人,且每个人包含7幅不同表情图像,每次使的似然概率P(O|λ)(=,2,…,7)。通过用其中的一个部分训练各个表情的HMM模型,剩Forward-Backward算法来计算似然概率,如果下的两个部分用来测试。循环操作3次,然后对这P(O|A1),i∈(1.2,…,)在P(OA)(=1,2,…,7)3次取平均值,得出表情识别率。本方法获取的表中最人,即情识别率见表1P(Ol, )=max p(ola)表1人脸表情识别结果愤怒厌恶恐惧高兴中性悲伤惊讶识别率/愤怒厌恶恐惧5591高兴中性悲伤0201100095.00020惊讶05693.33整体识别率92.14从表1中可以看出,本方法可以获得较好的表高的问题,提出了一种新的人脸表情识别方法。情识别率,但是,从实验中也可发现,不管是有本方法通过更加有效的 Gabor小波+PCA+LDA表没有减少分类类别数,实验中始终存在误识别。情特征提取方法,然后结合IMM模型建立7个对从实验数据斥中发现,悴中杲些人的种表情变化应基本表情+中性表情的模型,进行识别分类,并不明显,即使人眼也无法确定其表情类别,以并且取得了92.14%的整体识别率。同时,在实验致算法在识别时出现错误。中发现,由于人脸实验数据库中某些人的7种表情4结论变化并不明显,即使人眼也无法确定其表情类别,以致算法在识别时出现错误。本文针对目前人脸衣情的整体识别卒普遍不(下转第35页)21994-2015ChinaacAdemicJOurnalElcctronicPublishingHousc.Allrightsrcscrved.http://www.cnki.nct第6期林彩邴等:磁流变阻尼器减振系统的分数阶微分方程硏究35[2] DROZDOVAD Mechanicsofviscoelasticsolids[M]. New York: John Wiley &Sons Ltd, 1998: 21-65B3 LAKES RS. Viscoelastic solids[M]. London: CRC Press, 1998: 63-1104 Stanway R, Sproston, J L, Stevens N (i. Non-liner modeling of an electrorheological vibration damper.J. Electrostatics,1987,20[S]周强,瞿伟廉.磁流变阻尼器的两种力学模型和试验验证[.地震工程与工程振动,2002,22(40.[6] Gamoto DR, Filisko F E. Dynamic mechanical studies of electrorheological materials moderate frequencies. J. Rheology,991,35(3).[刀]汪建晓,孟光.磁流变阻尼器用于振动搾制的理论及实验研究J.振动与冲击,2001,20(2)[8 Wen Y K. Method of random vibration of hysteretic systems[J. Journal of Engineering Mechanics Division, ASCE102(EM2),19769SpencerJr. BF, Dyke SJ, Sain M K, Carlson, J.D. Phenomenological model of a magnetorheological damper. JEngrg. MechASCE.1997,123[10]薛定宇陈阳泉高等应用数学问题的 MATLAB解[M清华大学出版社,2010[l]l云,谭半.磁流变阻尼控制理论与技术[M科学出版社2007[1】]王振滨曹广义分数微积分的两种系统建模方汏系统仿真学报,2004,6(4:810-81上h与比比比比匙比比知5印(上接第20页)参考文献[1] ZHAO Quan-you, PAN Bao-chang, PAN Jian-jia, et al. Facial expression recognition based on fusion of Gabor and LBPfeaturesLA] In: Proceedings of the 2008 International Conference on Wavelet Analysis and Pattern Recognition[C), HongKong,IEEE,2008(8):362-367[2] Tang Fang-qi, Deng Ben-zai. Facial Expression Recognition using AAM and Local Facial Features [A]. In: Proceedings ofthe Third International Conference on Natural Computation[C], Haikou, China, IEEE, 2007(8): 632-635[3]陈培俊基于静态图像的人脸表情识别研咒[M成都:西南交通大学,2007[4] Lades M, Vorbruggen JC, Buhmann J. Distortion invariant object recognition in the dynamic linkarchitecture[J].IEEE Transactions on Computers, IEEE, 1993, 42(3): 300-311[5]彭辉张长水荣钢等基于KL变换的人脸自动识别方法清华大学学报(自然科学版),2007,37(6):6770[6]Duda RO, Hart PE, Stork DG Pattern Classification(second edition). New York: Wiley, 20017]李云霞,李治柱,吴亚栋基于HMM的关键词识别系统计算机工程,2004,30(7):130-132谨致作者敬请本刊作者允诺:稿件中没有侵犯他人著作权或其它杈利的内容并且文责自负:投寄给本刊的槁件(论文、图表、照片等)自发表之日起,其专有出版权和网络传播权即授于本刊,并许可本刊在本刊网站或本刊授权的网站上传播及屮国核心期刊(遴选)数据库、屮国学术期刊综合评价数据库、屮文科技期刊数据库、屮国台湾华艺数据库全文收录。对上述合作若有异议者,烦请来时向本刊申明,未作申明者,本刊将视为同意,谢谢合作。并致诚挚敬意。《机电技术》编辑韶21994-2015ChinaacAdemicJOurnalElcctronicPublishingHousc.Allrightsrcscrved.http://www.cnki.nct
    2020-12-06下载
    积分:1
  • 696518资源总数
  • 105714会员总数
  • 27今日下载