登录
首页 » Others » 晶圆缺陷检测与分类的卷积神经网络

晶圆缺陷检测与分类的卷积神经网络

于 2021-05-06 发布
0 339
下载积分: 1 下载次数: 6

代码说明:

晶圆缺陷检测与分类的卷积神经网络;针对晶圆检验时扫描电镜图像的缺陷检测和缺陷分类两问题,采用了“ ZFNet”的卷积神经网络来分类晶圆缺陷,并基于该分类器实现了一种“基于块的卷积神经网络”缺陷检测算法。为了提高准确率和加快速度,又改动“更快的区域卷积神经网络”实现了另一种检测算法。第卷第期邡鑫,史峥:晶圆缺陌检测与分类的卷积神经网络ZENet classifierDarker ImIn.ril” HumpBitel检测算法示意图在训练检测器时,数据集是检测器原始尺寸的图像,且包含标记好的缺陷区域和类型。我们结构通过·系列数据扩张操作,得到组数据,随机选取相比于检测算法主作为训练集,作为测试集。要从以下三方面进行了针对性的改进算法中需要优化的参数有滑动窗口尺寸滑()针对重复计算卷积的缺点,采用先动步幅、概率阙值、面积阙值,由于无法求出统一计算特征图,再按)进行映射各参数与检测结果的明确关系式,所以采用遍历法优化参截取的办法。如图,先通过卷积网络(数。因为检测到的缺陷尽量正确和尽量检测到所有缺陷是)对输入图像计算得到其特征图,因为在输入图像矛盾的,故以精确率和召回率的调和平均值作为优上的都能映射到特征图上,所以从输入图像上按化目标,也可根据实际需要调整两者权重满足不同侧重。割取图像进行卷积运算可以替代为直接从特征图上按测试结果映射后的范围割取,从而避免多次重复计算卷积。由于用训练好的检测模型对测试集检的大小形状不·,而全连接层的神经元连接数是固定的,测,计算模式下每张图大概耗时如果检测到的缺所以对割取得到的子特征图,通过层次采样到统陷与标准答案的且类型相同,则判为正确,否尺寸以连接到全连接层。则判为错误。得到结果如表,计算得:laut Image精确率Feature Map召回率ROI其屮正确缺陷的平均表检测器测试结果数量正确错误network有缺陷(正类)图映射示意图从检测结果来看该算法基本实现∫对图像上晶圆()针对滑动窗口尺寸单·的缺点,增缺陷的检测和分类,但是值较低,缺陷检测位置不加了滑动窗口的尺寸类型,并且增加由一个全卷积网络准确,检测耗时较长,分析其原囚如下)组成的()检测出错的数据中,缺陷较大的类型易判断错,)来预判断是否有缺陷。本文采用面积缺陷较小的容易被漏掉,说明只使用一种尺寸的滑动框很分别为,长宽比分别为、共难适应尺寸变化范围较大的缺陷种尺寸的滑动窗口,依次计算其中有缺陷的概率,再从中)滑动框步幅减小则算法耗时平方倍增加,而步幅筛选出一定数量最有可能有缺陷的区域,进行非极大值抑过长造成缺陷概率分布图分辨率较差,从而检测到缺陷位制(),最后得到一定数置准确度较差量的候选区域。()相邻滑动框都有大量重叠,所以每个区域都被多()针对缺陷检测位置准确度差的缺点,次重复送入计算卷积,导致算法耗吋较长。在全连接层后连接一个边界回归层在与上述检测算法相似的图像目标检测领域,近来出用来修正缺陷位置,该回归层与分类层并列。现的很好的克服了以上缺点并取得了很好的针对本文的缺陷检测问题,直接套用标准效果,所以下面介绍如何通过改动实现品圆并不能解决问题。因为判断晶圆的缺陷类型通常需缺陷的检测与分类。要结合缺陷区域周围的图形信息,而在预判断是否有C1994-2017ChinaAcademicJournalElcctronicPublishinghOusc.Allrightsrescrved.http://www.cnki.nct计算机工程年月日缺陷吋还进行了边界回归。虽然更加准确的给出缺陷的位()将原尺寸为的图像调整为置,但送入检测网络的特征儿乎不包含缺陷周围图肜信息,使得滑动窗口尺寸能够适应缺陷大小的变化范围,也可以导致缺陷分类不准。故木文对标准徹了一些根据实际情况来具体调整。改动:得到缺陷检测算法如图,卷积网络(()将改为只判断滑动窗口内是否有缺陷,而,)将输入图僚转换成多种特征图;根据不进行边界回归,也就是只计算所有滑动窗口有缺陷的概特征图从滑动窗口中选出最有可能存在缺陷的率,选取可能性最大的个,做非极大值抑制,再选出层根据特征图中抽取出对应特征组成特可能性最大的个进行检测。征向量;检测网络()根据特征向()将卷积层的尺寸加大为,加大感受野量判断缺陷类型,并进行边界回归;最后通过和概率),从而在判断滑动框內是否有缺陷吋能参阈值对候选缺陷进行过滤即可得到最终缺陷。考更多的周围信息。Detection NetworkonFolutionnl actorSoftmaxRuI Puling liver,e Prop卟 edMS+PrubilitessionInput Image 1024*1024Fully 10 dyercrectCcrvchrionalLaver size 747图检测算法示意图模型训练和平均值作为优化目标,并且使用相同的训练集和图中的检测算法也是基于架构实现,因为卷测试集积网络提取的特征类型对相似普遍有效,故其卷积网络的测试结果参数是直接迁移第章分类器的卷积层参数。但是用训练好的检测模型对测试集检测,和的参数则需要通过方法进行训练,标准计算模式下每张图大概耗时,采用相同判定标准,提供了分开和联合两种训练方式。为了节约得到检测结果如表(其中负类总数与表中总数不同是因时间,本文采用联合训练方式,并结合缺陷检测问题的实为同一张图屮可能检测到多个缺陷),计算得际情况调整超参数精确率在训练时,对每张输入图像,要计算的滑动窗口召回率数量庞大(种尺寸的滑动窗口,滑动步幅)。所以从中随机抽取个作为训练集,其中正例其中正确缺陷的平均负例,且正例占比不超过。分类器采用表检测器测试结果损失函数数量正确错误在训练时,设置提供个,从中随有缺陷(正类)机选取个作为训练集,其屮正例无缺陷(负类)负例,且正例占比不超过。另外设置学从结果来看该算法各方面都优于检测算习率分类器采用损失函数,而边界回法和值更高说明检测检测缺陷类型正确归采用函数。且位置准确,而且速度也大大提高(检测一张图像耗时从为了与检测算法对比,在最后通过遍历法缩小到)。如图为检测缺陷示例,共中标注了缺陷优化和概率阈值时,同样以精确率和召回率的调位置、类型和对应概率C1994-2017ChinaAcademicJournalElcctronicPublishinghOusc.Allrightsrescrved.http://www.cnki.nct邡鑫,史峥:晶圆缺陷检测与分类的卷积神经网络I I图检测结果示例图结束语而对图像上的缺陷检测和缺陷分类这两个问题,本文提出的改动后的检测算法能够精准、快速地从图像中检测出缺陷并同吋进行分类。得益于卷积神经网络良好的特征学习能力,该检测算法能够根据标记好缺陷位置和类型的数据自动学习特征,从而尽量避免人工千预,使算法具有较强的适应能力。参考文献徐姗姗刘应安徐昇基于卷积神经网络的木材缺陷识别山东大学学报工学版刘云杨建滨王传旭基于卷积神经网络的苹果缺陷检测算法电子测量技术江帆刘辉王彬等基于模型的图像识别计算机工程C1994-2017ChinaAcademicJournalElcctronicPublishinghOusc.Allrightsrescrved.http://www.cnki.nct

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • 工作易高端人才招聘系统100%商业最新版(带源码)
    系统功能:1.新闻系统:添加、修改、删除文章、文章置顶、Flash文章系统。2.投票系统:添加、修改、删除投票。3.求职系统:个人会员注册后可以修改自己的基本资料、添加、修改、删除、管理求职信息信息、投递简历、收藏企业、接收企业的招聘信息等……。4.招聘系统:企业注册后可修改基本资料、添加、修改、删除、管理企业招聘信息、接收个人的求职简历、收藏个人信息、财务明细、点卡充值、发布管理猎头信息等……。5.广告系统:支持矩形横幅 、弹出窗口 、随屏移动、固定位置、漂浮移动、文字代码,同时支持JPG、SWF、GIF、文本、代码和页面,并自动生成JS代码文件。6.后台系统:管理企
    2020-11-30下载
    积分:1
  • 多目标moead优化方法
    基于种群分解,使用主元分析进行聚类分析和种群生成,种群进化使用NSGA-II选择机制,
    2020-12-11下载
    积分:1
  • 东北大学——现代控制理论——课件
    现代控制理论课件,详细的介绍了现代控制理论的相关知识点§1.1现代控制理论的形成和发展、经典控制理论的形成与发展18世纪初19世纪20世纪40年代萌芽发展形成阶段阶段体系Northeastern University球止又于1、萌芽阶段随着科学技术与工业生产的发展,到十八世纪,自动控制技术逐渐应用到现代工业中。其中最卓越的代表是瓦特( J. Watt)发明的蒸汽机离心调速器,加速了第一次工业革命的步伐瓦特Northeastern University球止又于2、发展阶段1868年马克斯韦尔(J.C. Maxwel1)解决了蒸汽索机调速系统中出现的剧烈振荡的不稳定问题,提出了简单的稳定性代数判据马克斯韦尔(JC. Maxwe11)Northeastern University球止又于3、形成体系阶段1895年劳斯( Routh)与赫尔维茨( Hurwitz)把与克斯韦尔的思想扩展到高阶微分方程描述的更复杂的系统中,各自提出了两个著名的稳定性判据一劳斯判据和赫尔维茨判据。基本上满足了二十世纪初期控制赫尔维茨( Hurwitz)工程师的雷要Northeastern University由于第二次世界大战需要控制系统具有准确跟踪与补偿能力,1932年奈奎斯特(H. Nyquist)提出了频域内研究系统的频率响应法,为具有高质量的动态品质和静态准确度的军用控制系统提供了所需的分析⊥具。奈奎斯特Northeastern University4、经典控制理论的特点和局限性(1)以SIS0线性定常系统为研究对象(2)以拉氏变换为工具,以传递函数为基础在频率城中分析与设计(3)难以有效地应用于时变系统、多变量系统(4)难以有效地应用于非线性系统Northeastern University二、现代控制理论的形成与发展20世纪50年代60~80年代80年代后萌芽发展形成阶段阶段体系Northeastern University1.五十年代后期,贝尔曼( Bellman)等人提出了状态分析法;在1957年提出了动态规划。2.1959年卡尔曼( Kalman)和布西创建了卡尔曼滤波理论;1960年在控制系统的研究中成功地应用了状态空间法,并提出了可控性和可观测性的新概卡Northeastern University
    2021-05-06下载
    积分:1
  • 基于BP神经网络的手写数字识别matlab实现
    本ZIP文件包含了经典的手写数字的bmp数据,共{0,1,2,……,9}10个类,每个类包含500个数据;然后对图片进行二值化处理,采用patch来对每张image提出特征,最后设计神经网络对特征进行训练,并用得到的net来测试TestingSet,经过调解参数,测试精度可以达到95%左右。整个实现过程是基于matlab语言的,code清晰,明了,简单易懂,绝对值得算法爱好者探究。
    2020-12-05下载
    积分:1
  • 最优控制_数学理论与智能方法
    最优控制_数学理论与智能方法,张杰。
    2020-12-05下载
    积分:1
  • 注水算法集合
    功率分配的注水算法的集合,包括OFDM和MIMO系统模型下的功率分配,
    2020-11-05下载
    积分:1
  • 标定板20图.zip
    相机标定板图片(tif格式20张),可以直接拿来进行相机的内外参计算和相机标定。
    2021-05-06下载
    积分:1
  • DSP设计FIR带通滤波器(报告&源代码)
    代码经过调试有效,实验报告详细清晰易懂,格式正确。① 滤波器的阶数≥5,截止频率自行选定,滤波系数用MATLAB确定。② 编制C54XDSP实现FIR滤波器的汇编源程序。③ 用软件仿真器完成上述程序的模拟调试。④ 以数据文件形式自行设定滤波器输入数据,以数据文件形式输出滤波结果,并与输入数据进行比较分析。用软件仿真器有关工具显示FIR滤波器的输入输出波形,以证明滤波器滤波性能。
    2020-12-04下载
    积分:1
  • 基于Xgboost的商业销售预测
    基于Xgboost的商业销售预测,以德国Rossmann商场的数据为例,通过对数据的探索性分析,以相关背景业务知识体系为基础,通过可视化分析,提取隐含在数据里的特征,使用性能较优的Xgboost方法进行规则挖掘,取得较好效果。第3期饶泓等:基于 Boost的商业销售预测277·(3)eta:收缩步长,即学习速率,取值范围是,3.1数据来源默认为0.3。在更新叶子节点的时候,权重乘以本文所有数据均来自 Haggle中的 Rossmanneta,以避免在更新过程中的过拟合。商店销售额数据集。 Rossmann是商人 Dirk ross(4) max _ depth:每棵树的最大深度,取值范围mann创立的德国首家平价日用品商店,现在的是,默认为6。树越深,越容易过拟合。Rossmann公司逼布欧洲7个国家,分店达100多(5) subsample:训练的实例样本占整体实例样家。论文通过位于德国的1115所 Rossmann连锁本的比例取值范围是(0.1],默认为1。值为0.5商店的历史数据预测未来48天商店的销售额时意味着 Boost随机抽取一半的数据实例来生成Haggle给出了三个数据集: train、test、 store,分树模型,这样能防止过拟合别是训练集测试集和商店基本信息的数据集,对训(6) colsample bytree:在构建每棵树时,列(特练集建模训练,对测试集进行预测。征)的子样本比,参数值的范围是(0,1]数据集基本信息如下(7) objective:默认为reg: linear;(1)训练集 train.csv:时间范围为2013年01月(8)sccd:随机数种子,为确保数据的可重现01日到2015年07月31日,共942天,1017209条性,默认为0。数据。2.2K折交叉验证方法(K一CV(2)测试集test.csv:时间范围为2015年08月论文采用K折交叉验证方法。将原始数据0日到2015年09月17日,共48天,41088条数分为K个子集,每个子集分别验证一次,剩余的K据组子集作为训练数据,这样可得到K组训练集(3)商店基本信息数据集 store.csv:1115条数和测试集以最终的分类平均精度作为性能指标。据,共1115家商店的信息。在实际应用中,K值一般大于或等于2,需要建立K3.2数据的可视化分析及原始特征提取个模型来进行K折交叉验证的实验,并计算K次为了获取影响销售额的基本数据特征,论文对测试集的平均辨识率Gaggle提供的 Rossmann数据集进行了可视化分K折交叉验证的结果能较好说明模型效果,有析,提取原始特征集。效地避免欠拟合与过拟合。在 Boost中,通过(1)顾客数和销售额之间的关系xgb.cv函数来做交叉验证。从图1中可以看出,顾客数和销售额之间存在2.3独热编码(One- hot encoding紧密的正相关关系。由于 Boost仅适用于处理数值型向量,因此处理训练集和测试集时需要将所有其它形式的数10.0据转换为数值型向量,本文采用独热编码将特征值转专换为数值。50独热编码也称一位有效编码,即对于任意时间任意给定的状态,状态向量中只有一位为1,其余6各位为0,将n类特征值转化成n位二进制数串,将顾客数特征的每个对应类设置为1。独热编码将每一个特图1顾客数与销售额的关系曲线征的个取值通过独热编码后转换成了n个二元特(2)促销对销售的影响的可视化分析征,通过该方法将特征转变成稀疏矩阵6。独热编图2和图3中 Promo取1表示当天有促销活码能够解决分类器不好处理属性数据的问题并在动取0表示没有促销活动。从图中可以看出促销一定程度上扩充了特征活动对顾客数并没有太大影响,但销售量却明显提3数据预处理高了,即促销活动并没有吸引更多的顾客,但提高了顾客的购买力,从而提高了销售额。通过查询原始为了获取数据中的有效特征,论文采用探索性数据发现没有促销的情况下顾客平均消费8.94欧数据分析方法对数据进行可视化分析获得数据分元,有促销活动的情况下平均消费10.18欧元布特征,理解原始数据的基本特征,发现数据之间的(3)星期( DayOf Week)对销售影响的可视化分潜在模式.找出数据中的有效特征析21994-2017ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net278南昌大学学报(理科版)2017年40000表2商店薮据基本特征集30000特征名称含义值批20000ore商店号取值:1到1115商店类型10000商店类别分类:逢础类met最近的党争对手的距薮卷:桊商店0离里有761个商店有PromoCompetition-图2促销对销售额的影响Open SinceMonth竞争对手开张的月份月份Open since year竞争对手开张的年份年份数据6000P持续性的促销活动0:无,1:有的4000Prom2 Since Week开始参加Pomo2促销日历上的第几周数的日历周值2000Pomo2 Sincerer开始参加Pm2i年份数据PromoPromoInterval参加Pomn2促销开始Jan,Apr,Jo)e的月份列表Feb, May, Aug, Nov".图3促销对顾客数的影响Mar, Jun, Sept, Dec从图中可以看出,星期日的销售额中位数和上不同的分类特征在训练集和测试集中的比例见四分位数远远高出正常营业日,但是下四分位数却表3~6低于正常营业日,即有些商店星期日营业额高于平表3Open特征取值比例时,但也有一部分商店的销售额低于正常营业日。从图中也可以看出,从周一到周六,周一的销售额偏16.99高一些,星期六的销售额偏低一些test/yo14.5585,4440000表4Prom特征取值比例30000Pramo0凝train61.8538,15批2000test/%50.4239.5810000表5 Stateholiday特征取值比例y星期几1.990.660.40图4销售额在星期1~7中的分布情况test/%99.560.44由于篇幅的关系,对数据的可视化分析不表6 Schoolholiday特征取值比例列岀。根据这些数据的可视化化析,我们提取出如Schoclholiday表1所示和表2所示的训练数据和测试数据原始特test/%55.6544.35征集以及商店数据基本特征集。表1数据原始特征集3.3数据预处理持征名称含义3.3.1数据清洗为获得可训练用数据,我们对原tcre有店号取值:1到1115始数据进行清洗,具体过程如下:DayOfWeek星期几取值:1到7(1)标记异常数据。如商店是开门的,但是销Date时间如2013-01-01Sales销售额数值售额为零的数据为异常数据Customers顾客数数值(2)对训练集的 Sales销售额字段取对数,设置是否开店关店,1:开店为 Saleslog字段;P当天是否有促销0:无促销,1:促销0:非假日,a:公共假日;b:(3)缺失值用一1填充;State Holiday假日复活节,c:圣诞节(4)合并训练集和测试集,添加Set字段,用以SchoclHoliday学校假日0非假日,1:假日分训练集和测试集,值1为训练集,0为测试集;(3)数值化分类特征值。原始数据集中, State21994-2017ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net第3期饶泓等:基于 Boost的商业销售预测holiday分类特征取值为0、a、b、c,无法代入模型计算因此重新编码为0、1、2、3; Store Type分类特4实验结果及分析值为a、b、c、d, Assortment分类特征值为a、b、c,采4.1实验条件用同样方法用整型数据重新编码(1)软件环境(6)分解特征。将原始数据集中Date特征分(a)操作系统: Windows7x64解为 DatcDay、 Datc Wcck、 DatcMonth、 Datc ycar(b)开发平台: Python2.7+R3.4.2DateDay OfYear5个特征(c)第三方库: Python: numpy+ pandas+(7)增加字段 PateNt,即Date转换为整型的 atplotlib I xgboost;R3.4.2库: data table|gg形式lot2tlubridate-zoo-dplyr+scales+xgboost+(8)规范化特征表达。对 Competition- forecast glmnetpen sinceRer和 CompetitionOpenSinceMonth字(2)硬件环境段合并成普通年月的表达,并转化为整型;将Pro处理器:Iner(R)Core(TM)i3-4160CPUcmoZsincc ycar和 Promo2 Since wcck字段合并成普3.60GHz通年月的表达,并转化为整型,增加字段内存:8GBPromo2 SinccInt4.2单 Boost模型()删除偏差大于2.5的异常数据。对特征工程后的所有特征用 Boost模型进行(10)删除存在异常的数据点,如图5所示的异训练,参数如表7所示。常数据。表7单 Boost模型参数25000参数值参数值15000thread500M4M小人Activereg: linear subsamplegrounds20000colsample bytearly stop. round250004.3组合模型0%时你以根据模型的作用将模型分为三类:商店模式模型、数据合并模型、混合模型。商店模式模型:下面采用单个模型是对每个商图5异常数据店进行单独拟合。这类模型关注商店各自的特性,3.3.2特征处理论文根据相关信息背景对数据但是它也错过了可在其他相似商店的模式中获取的进行特征处理:信息(1)增加字段 Competition OpenInt(1)线性模型lm拟合趋势,不带特征交互的(2)添加一些额外的特征,如商店的位置特征 Boost模型拟合残差StoreState发薪日效应特征 PayDay(在一个月的第(2)线性模型lm拟合趋势,带特征交互的Ⅹg个工作日设置特征值为3在随后的两天设置为 boost模型拟合残差2、1)(3)线性模型lm拟合趋势,不同参数值的(3)增加商店平均每天的销售额 Sales PerDay、 glmnet模型拟合残差平均每天的顾客数 CustomersPerDay、平均每天每(4)tslm模型拟合趋势丨季节性,Ⅹ gboost模位顾客的销售额 SalesPerCustomers Per Day作为新型拟合残差。的特征。(5)tslm模型拟合趋势十季节性, glmnet模型(4)增加特征组合,如: store; DayofWeek,拟合残差store: Dayofweek: Promo等等。(6)tslm模型拟合趋势十季节性,Ⅹ gboost模型+ gemnet模型拟合残差。(7)每个商店直接用Ⅹ gboost模型拟合残差。21994-2017ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net·280·南昌大学学报(理科版)2017年这些模型中,含有 Boost模型的模型参数设1.5- A. train-rmspe- B. train-rmspe置如表8,其中模型7中参数 rounds值设为500。1.0-A.validation-rmspe-B validation表8组合 Boost的模型参数0.5参数值0150030004500600075009000参数值RMSPEreg: linear eta0.013C0max _ depth图6在训练集 train和验证集 validation上的 RMSPE值colsamplc bytrcc0.8subsample3.95图7给出了 Boost模型中非组合特征的重要数据合并模型:下列模型使用合并有 store数度得分,从图中可以看出时间类特征和有关竞争对据集和trai训练集的数据集。各个模型的参数设手的特征得分非常髙,这意味着这些特征对模型具置如表9-11有非常大的影响。表9没有特征工程的 Boost模型DateWeek参数参数CompetitionopenIntreg: lineareta0.01SalesperDayPromorounds3000max _depthcolsample bytreesubsampleAssortment 152100000020000003000000F score特征重要度表10有特征工程的 Boost模型图?特征重要度得分参数参数值bjectivereg: linear eta为了对比各模型的泛化效果,我们给出了单类模型(线性模型LM、时间序列线性模型TSLM、基4000subsoIl0.9于 Lasso和 Elastic net正则广义线性模型 glmnet、early stop. round100cclsample bytree极端梯度上升模型ⅹ gboost)和它们之间的组合模型在测试集上 RMSPE值,从而评价模型在测试集表11153个特征十特征交互的 Xgboost模型上的泛化能力。如表13所示参数值参数表13各模型 RMSPE值比较objectivereg: linear etaC.015max depth18模型RMSPE值.20657300CLM一简单的特征处理rounds. 1l.7TSLM+筒单的特征处理cCanvTree0.12751early stop. round100random forest-简单的特征处理glmnet+简单的特征工程3.11974组合模型:通过组合数据合并模型来获取跨多个商Boost十简单的特征工程0.11839店之间共同的特质。模型的残差用商店模式模型中Boost+特征工程Boost+ glmnet+特征工程0.11262的模型来拟合,从而获得每个商店的特质。用Igloos+ glmnet+tslm+lm+特征工程0.1114Gprcomp函数从数据中提取50个主成分,并用Xg从表中可以看出,Ⅹ ghost单模型的能力就优bost模型来拟合、计算残差。模型说明如下:于其它模型,在进行了简单特征工程后, Boost(1)使用线性模型lm拟合趋势,带特征交互的和 gemnet模型相比, Boost模型依然效果更好。glmnet模型+ Boost模型拟合残差,最后我们结合TSLM|LM在处理趋势和季节性上(2)使用tslm拟合趋势和季节性,带特征交互的优势,采用集成方法对 Xgboost+ glmnet进行组的 Boost模型拟合残差。合得出优化模型Ⅹ gboost+ glmnet+tslm+lm+特图6给出模型在训练集和验证集上的 RMSPE征工程, RMSPE值得到较大提升,泛化性能最优的变化过程,横坐标是次数,纵坐标是 RMSPE的值A是人工删除了异常点的数据中的异常数据5结论并没有删除。可以发现在训练集上训练的前500次本论文研究基于 Boost方法对实体零售业销RMSPE的值就迅速的降低到0.2,然后在1750次售额进行预测。论文以德国零售业 Rossmann公就在0.1左右了,可以看出在训练集上效果很好。司1115家实体门店的商场信息和销售数据为薮据21994-2017ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net第3期饶泓等:基于 Boost的商业销售预测281·源,采用 Boost方法对公司销售额进行预测。参考文献通过在特征工程中对原始数据进行特征提取、L1」赵啸彬.基于数据挖掘的零售业销售预测LD.上海:选择和构建,筛选岀用于训练的特征属性;对比Xα上海交通大学.2010boost、随机森林、 GLMNET以及IM、TSIM模型2 CHEN T,HET. Higgs Boson Discovery with boosted等不同方法对销售额的预测结果,表明 Xgboosτ方TreesLCI.JMLR: Workshop and Conference Proceed法无论是训练速度还是在 RMSPE评价标准上都具2015.42:6980有明显的优势。3 ROBERT E. Banfield, Lawrence (. Hall. Kevin WBowyer. W. P. Kegelmeyer, A Comparison of Decision为了进一步提高 Boost预测模型的精度和泛Tree Ensemble Creation Techniques LI]. IEEE Trans-化能力,本文通过大量的特征工程,尝试多种模型的actions on Pattcrn Analysis and machinc intelligence集成学习方法和参数调优,利用 GLMNET和Xg2007,29(1):173-180boost模型拟合残差,并结合IM、TSLM在趋势和[]李航.统计学习方法[M]北京:清华大学出版社,李节性预测的优点,获得组合优化模型。实验表明2012该组合模型在性能上优于单一 Boost预测模型。[5]闻玲·移动平均季节模型在商品销售收入预测中的应这种基于Xⅹ gboost的组合模型不仅适用于对德AJ. Market Modernization, 2010(28):43-45国零售业销售额的预测还可以将此方法应用于国6黄伟陶俊才.一种基于k- means聚类和关监督学习内零售实体业甚至电商平台的销售额预测,对于提的医学图像分割算法[J].南吕大学学报(理科版),2(14,33(1):31-35高商店的运营生产模式、日常管理、价格管理、配送[7 RICE J Mathematical Statics and Data Analysis[M]方式及精准营销具有重要的意义cand Edition, Plymouth: Duxbury Press, 2006: 221-21994-2017ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
    2021-05-06下载
    积分:1
  • DSP srio测试
    C6000系列DSP SRIO口测试程序。 可以完成互联,自环在内的SRIO口测试,并支持多个型号的C6000系列DSP。程序注释中把不同的测试方法和配置一一注释,可以完成不同种类的SRIO通信测试。
    2020-12-03下载
    积分:1
  • 696516资源总数
  • 106409会员总数
  • 8今日下载