登录
首页 » Others » 个人整合编写的测试报告.doc

个人整合编写的测试报告.doc

于 2020-12-10 发布
0 210
下载积分: 1 下载次数: 1

代码说明:

测试报告是指把测试的过程和结果写成文档,对发现的问题和缺陷进行分析,为纠正软件的存在的质量问题提供依据,同时为软件验收和交付打下基础。

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • abaqus子序 umeshmotion
    参照abaqus帮助文章中的案例,修改了一下,适用于有方向要求的磨损
    2020-12-05下载
    积分:1
  • barnyard2-1.9.tar.gz
    barnyard2-1.9.tar.gz
    2020-12-08下载
    积分:1
  • 系统辨识大牛Ljung写的MATLAB系统辨识使用手册
    系统辨识大牛Ljung编写的MATLAB系统辨识使用手册,这本书详细地介绍了在MATLAB已经所属simulink环境下,系统辨识工具箱的一些使用办法,是一本非常经典的教材!Revision Historypril 1988First printingJuly 1991Second printingMay1995Third printingNovember 2000 Fourth printingRevised for Version 5.0(Release 12)pril 2001Fifth printingJuly 2002Online onlyRevised for Version 5.0.2 Release 13)June 2004Sixth printingRevised for Version 6.0.1(Release 14)March 2005Online onlyRevised for Version 6.1.1Release 14SP2)September 2005 Seventh printingRevised for Version 6.1.2(Release 14SP3)March 2006Online onlyRevised for Version 6.1.3(Release 2006a)September 2006 Online onlyRevised for Version 6.2 Release 2006b)March 2007Online onlyRevised for Version 7.0 ( Release 2007a)September 2007 Online onlyRevised for Version 7.1 (Release 2007bMarch 2008Online onlyRevised for Version 7.2(Release 2008a)October 2008Online onlyRevised for Version 7.2.1 Release 2008b)March 2009Online onlyRevised for Version 7.3(Release 2009a)September 2009 Online onlyRevised for Version 7.3.1(Release 2009b)March 2010Online onlyRevised for Version 7. 4 (Release 2010a)eptember2010 Online onlyRevised for Version 7.4.1(Release 2010b)pril 2011Online onlRevised for Version 7.4.2(Release 2011a)September 2011 Online onlyRevised for Version 7.4.3(Release 2011b)March 2012Online onlyRevised for Version 8.0( Release 2012aabout the DevelopersAbout the Developersystem Identification Toolbox software is developed in association with thefollowing leading researchers in the system identification fieldLennart Ljung. Professor Lennart Ljung is with the department ofElectrical Engineering at Linkoping University in Sweden. He is a recognizedleader in system identification and has published numerous papers and booksin this areaQinghua Zhang. Dr. Qinghua Zhang is a researcher at Institut Nationalde recherche en Informatique et en Automatique(INria) and at Institut deRecherche en Informatique et systemes Aleatoires (Irisa), both in rennesFrance. He conducts research in the areas of nonlinear system identificationfault diagnosis, and signal processing with applications in the fields of energyautomotive, and biomedical systemsPeter Lindskog. Dr. Peter Lindskog is employed by nira dynamiAB, Sweden. He conducts research in the areas of system identificationsignal processing, and automatic control with a focus on vehicle industryapplicationsAnatoli Juditsky. Professor Anatoli Juditsky is with the laboratoire JeanKuntzmann at the Universite Joseph Fourier, Grenoble, france. He conductsresearch in the areas of nonparametric statistics, system identification, andstochastic optimizationAbout the developersContentsChoosing Your System Identification ApproachLinear model structures1-2What Are Model objects?Model objects represent linear systemsAbout model data1-5Types of Model objectsDynamic System Models1-9Numeric Models1-11umeric Linear Time Invariant (LTD Models1-11Identified LTI modelsIdentified Nonlinear models1-12Nonlinear model structures1-13Recommended Model Estimation Sequence1-14Supported Models for Time- and Frequency-DomainData,,,,,,,1-16Supported Models for Time-Domain Data1-16Supported Models for Frequency-Domain Data1-17See also1-18Supported Continuous-and Discrete-Time Models1-19Model estimation commands1-21Creating Model Structures at the command Line ... 1-22about system Identification Toolbox Model Objects ... 1-22When to Construct a Model Structure Independently ofEstimation1-23Commands for Constructing Model Structures1-24Model Properties1-25See als1-27Modeling Multiple-Output Systems ......... 1-28About Modeling multiple-Output Systems1-28Modeling Multiple Outputs Directly1-29Modeling multiple outputs as a Combination ofSingle-Output Models.......1-29Improving Multiple-Output Estimation Results byWeighing Outputs During Estimation ....... 1-30Identified linear Time-Invariant models1-32IDLTI Models1-32Configuration of the Structure of Measured and Noise oRepresentation of the Measured and noise Components foVarious model Types1-33Components ....1-35Imposing Constraints on the Values of ModeParameters1-37Estimation of Linear models1-8Data Import and Processing2「Supported Data ...2-3Ways to Obtain Identification DataWays to Prepare Data for System Identification ... 2-6Requirements on Data SamplingRepresenting Data in MATLAB Workspace·····Time-Domain Data Representation2-9Time-Series Data Representation2-10ContentsFrequency-Domain Data Representation ....... 2-11Importing Data into the Gui2-17Types of Data You Can import into the GUi2-17Importing time-Domain Data into the GUI2-18Importing Frequency-Domain Data into the GUI2-22Importing Data Objects into the GUI ......... 2-30Specifying the data sampling interval2-34Specifying estimation and validation Data2-35Preping data Using Quick StartCreating Data Sets from a Subset of Signal Channelo2-362-37Creating multiexperiment Data Sets in the gUi2-39Managing data in the gui ............. 2-46Representing Time- and Frequency-Domain Data Usingiddata object2-55iddata constructor2-55iddata Properties.........2-58Creating Multiexperiment Data at the Command Line .. 2-61Select Data Channels, I/O Data and Experiments in iddataObjects2-63Increasing Number of Channels or Data Points of iddataObjects2-67Managing iddata Objects2-69Representing Frequency-Response Data Using idfrdObiec2-76idfrd Constructor2-76idfrd Properties2-77Select I/o Channels and Data in idfrd Objects ..... 2-79Adding Input or Output Channels in idfrd Objects2-80Managing idfrd Objects2-83Operations That Create idfrd Objects2-83Analyzing Data quality2-85Is your data ready for modeling?2-85Plotting Data in the guI Versus at the command line2-86How to plot data in the gui2-86How to plot data at the command line2-92How to Analyze Data Using the advice Command2-94Selecting Subsets of Data2-96IXWhy Select Subsets of Data?2-96Extract Subsets of Data Using the GUI2-97Extract Subsets of data at the Command Line2-99Handling Missing Data and outliers2-100Handling missing data2-100Handling outliers2-101Extract and Model Specific Data Segments2-102See also2-103Handling offsets and Trends in Data2-104When to detrend data2-104Alternatives for Detrending Data in GUi or at theCommand-Line2-105Next Steps After detrending2-107How to Detrend Data Using the Gui2-108How to detrend data at the Command line2-109Detrending Steady-State Dat109cending transient Dat2-109See also2-110Resampling Data2-111What Is resampling?...,,.,,,,,,,,,,,.2-111Resampling data without Aliasing Effects2-112See also2-116Resampling data Using the GUi.,,,,2-117Resampling Data at the Command line2-118Filtering Data2-120Supported Filters2-120Choosing to Prefilter Your Data2-120See also2-121How to Filter Data Using the gui2-122Filtering Time-Domain Data in the GuI........ 2-122Content
    2020-12-11下载
    积分:1
  • 风控建模等奖
    使用拍拍贷数据,建模全过程,从数据预处理开始到最后的模型比较。仅用于交流学习。队伍介绍队名“不得仰视本王”,队伍由五个小伙伴组成,我们是在一个类以的比赛(微额借款用户人品预测大赛)认识的,对数据挖掘竹热爱让我们走到了一起,以下是成员简介:姓名学校、学历比赛经历匚陈靖」中国科学技术大学研二天泡科学家总分第三,微额借贷用户人品预测大赛季军朱治亮浙江大学研二淘宝穿衣搭配比赛李军,微额借贷用户人品预测大赛李军质耀重庆邮电大学研二微额借贷用户人品预测大赛冠军匚赵蕊」重庆邮电大学研微额借贷用户人品预测大赛亚军黄伟鹏北京大学研一微额借贷用户人品预测大赛冠军解决方案概述2.1项目介绍与问题分析拍拍贷“魔镜风控系统”从平均400个数据维度评估厍户当前的信用状态,给每个告款人打出当前状态的信用分,在此基础上再结合新发标的信息,打出对于每个标约6个月内逾期率的预沨,为没资人提供关键的决策依据。本次竞赛目标是根据用户历史行为数据来颈测用户在六来6个月内是否会逾期还款的概率。问题转换成2分类问题,评估指标为AUC,从 Master, LogInfo, Update Info表中构建恃征,考虑评估指标为AUC,其本质是排序优化问题,所以我们在模型顶层融合也使用基于排序优化的 RANK AVG融合方法。2.2项目总体思路本文首先从数据清洗开始,介绍我们对缺失值的多维度处、对离群点的剔除方法以及对字符、空格等的处理;其次进行特征工程,包括对地理位置信息的特征构建、成交玉间特征、类别特征编码、组合特征构建、 Lpdatelnfo和 Log Info表的特征提取等;再次进行特征选择,我们采用了 boost, boost的训练过栏即对特征重要性的排序过程;然后处理类别的不平衡度,由于赛题数据出现了类不平衡的情况,我们采用了代价敏感学习和过采样两和方法,重点介绍我们所使用的过采样方法;最后一部分是模型设计与分析,我们采用了二业界广泛应用的逻辑回归模型、数据挖掘比赛大杀器 ghost.,创新性地揆索了large- scale sⅧm的方法在本赛题二的应用,玟得了不错的效果,此外还介绍了模型融合方、数据清洗3.1缺失值的多维度处理在征信领域,用户信总的完善程度可能会影响该层户的信用评级。一个信息完苦程度为100%的户比起完善程度为50%的用户,会更加容易官核通过并得到借款。从这一点亡发,我们对缺失值进行了多维度的分析和处理按列(属性)统计缺失值个数,进一步得到各列的缺失比率,下图(图1)显示了含有缺失值的属性和相应的缺失比率sing rate of Attributes图1.属性缺失比枣WeblogInfo_1和 WeblogInfo3的缺失值比率为97%,这两列属性基本不携带有用的信息,直接剔除。 Uscr Info_11、 Userinfo_12和 Uscr info_13的缺失值比率为63%,这三列属性是类别型的,可以将缺失值用-1垣充,相当于“是否缺失”当成另一种类别。其他缺失值比卒较小的数值型属性用中值填充按行统计每个样本的属性缺矢值个数,将缺失值个数从小到大排序,以序号为横坐标,缺失值个数为纵坐标,画出如下散点图(图2)test set16016014014C12012Cw9mczE100400060008000Order Numbe(sort ircreasinglyOrde Nt mber(sort increasing ly)图2.样本属性缺失个数对比 trainset和 testset上的样本的属性缺失值个数,可以发现其分有基本一致,但是trainset上出了几个缺失值个数特别多的样本(红框区域内),这几个样本可以认为是离群点,将其剔除另外,缺矢值个数可以作为一个特征,衡量用户信息的完善程度。3.2剔除常变量原始数据宁有190维数值型特征,通过计算每个数值型特征的标准差,剔除部分变亿很小的特征,下表(表1)列出的15个特征是标准差接近于0的,我们剔了这15维特征表1.剔除数值特征标准差属性标准差属性标准差属忾标准差Webloglnfo_10 0.0707 WeblogInfo_41 0.0212 Webloglnfo_490.0071Webloglnfo_23.0939 WeblogInfo_43 0.0372 Webloglnfo_5200512Webloglnfo_31.0828 Webloglnfo_44.0166 Webloglnfo_5400946Webloglnfo_32 0.0834 Webloglnfo_46.0290 WeblogInfo_5500331Webloglnfo_40.0666 Webloglnfo_47 0.0401 WeblogInfo_58006093.3高群点剔除在样本空间中与其他样本点的一般行为或特征不一致的点称为离群点,考虑到离群点的异常特征可能是多维度的组合,我们通过分析样本属性的缺矢值个数,剔除了极少量的离群点(见3.1节)此外,我们还采用了另外一种简单有效的方法:在原始数捶上训练ⅹ gboost,用得到的xgb模型输出特征的重要性,取最重要的前20个特征(如图3所示),统计每个栏本在这20个特征上的缺失值个数,将缺矢值个数大于10的样本作为离群点。ThrciParty Ifn PeriodIntrAparty nto HerodThrcPorty hfo Penod3ardiParty hfo Period?ThirdParty Info Penod图3.Xgb特征重要性通过这个方法,易除了400多个样水。这些样在重要特征上的取值是缺失的,会使得模型学习变得因难,从这个角度妖说,它们可以看成是离群点,应剔除掉。3.4其他处理(1)字符大小写转换Userupdate Info表宁的 Userupdate Info1字段,属性取值为英文字符,包含了大小写,如Q"和”qQ",很玥显是同一和取值,我们将所有字符统一转换为小写(2)空格符处理Mastor表中 UserInfo9字段的取值包含了空格字符,如“中国移动”和“中国移动”它们是同一种取值,需要将空格符去除。(3)城市名处理Userinfo_8包含有“重庆”、“重庆市”等取僬,它们实际上是同一个城市,需要把字符中的“市”全部去掉。去掉“市”之后,城市数由600多下降到400多。四、特征工程4.1地理位置的处理对地理位置信(类别型变量)最简单的处理方式是独热编码(one- hot encoding),但是这样会得到很高维的稀疏特征,影响糢型的学习,我们在独热编码旳基础上,做了特征选择。下面介绍具体的方法。赛题数据提供了用户的地挛位置信息,包括7个字段: Userinfo2、 Userinfo4、UserInfo7、 UserInfo8、 UserInfo I9、 UserInfo20,其中 UserInfo_7和 UserInfo19是省份信息,其余为城市信息。我们统计了每个省份和城市的违约率,下图以 Userinfo_7为例图1.省分违约率可视化图5可视化了每个省份的违约率,颜色越深代表违约率越大,其中违约率最大的几个省份或直辖市为四川、湖南、湖北、吉林、天津、山东,如下图所示:图5.违约深突出省份可视化因此我们可以构建6个二值特征:“是否为四川省”、“是否为湖南省”...“是否为山东省”,其取值为或1。其实这相当于对地理位置信息做了独热编码,然后保留其中有判别性的菜些列。这里 UserInfo_7何含32和取值,编码后可以得到32维的稀疏特征,而我们只保留其宇的6维以上我们是通过人工的分析方法去构延二值特征,在处理省份信息时还是匕较直观的,但是处理城市信息,比如 Userinfo2,包含了33个减市,就没有那么直观了。为了得到有判别性的二值特征,我们首先对 Userinfo2进行独热编码,得到333维的二值特征,然后在这333维稀疏特征上训练ⅹgb模型,再根据xgb输出的特征重要性刷选二值痔征,以下是选取到的部分二值特征(对应的城市):“淮纺市”、“九江市”、“三门峡市”、“汕头市”、“长春市”、“铁岭市”、“济菊市”、“成都市”、“淄博市”、“牡丹江市”。按城市等级合并类别型特征取值个数太多时,独热编码后得到太高维的稀疏特征,除了采用上面提到的特征选择方法外,我们还使用了合并变量的方法。按照城市等级,将类别变量合并,例如线城市北京、上海、广州、深圳合并,赋值为1,同样地,二线城市合并为2,三线城市合并为3>经纬度特征的引入以上对地理位置信息的处理,都是基于类别型的,我们另外收集了各个城市的经纬度,将城市名用经纬度替换,这样就可以将类别型的变量转化为数值型的变量,比如北京市,用经纬度(39.92,116.46)替换,得到北纬和东经两个数值型特征。加入经纬度后,线下的cross validation有千分位的提升。城市特征向量化我们将城可特征里的城市计数,并取Log,然后等值离散化到610个区间内。以下图为例,将 serino2这个特征里面的325个城市离散为一个6维向量。向量“100000”表示该城位于第一个区间。线下的 cross validation有千分位的提升。Loglui2 num)6.城市特征离散化地理位置差异特征如图8所示,1,2,1,6列郗是城市。那么我们构建一个城市差异的特征,比妇diff_12表示1,2列的城市是否相同。如此构建 diff l2,diff_14,diff_l6,diff_24,diff26,diff46这6个城市差异的特征。线下的 cross validation有千分位的提升。⊥aJse⊥nfa2 userinfo4 Userinfo7 Userinfo8 Userinfo19uer⊥nf。201C013郴州1C020惠州1C033零1c035深圳东东东东建东福建省10038济104连云港远言港带1C042德州1c043青岛聊拔东自聊城市46深圳汕广东广东省汕尾市105所多工新乡图7.地理位置差异样例4.2成交时间特征按日统计训练集中每天借贷的成交量,正负样本分别统计,得到如下的曲线图8,横坐标是日期(20131101至20141109),纵坐标是每天的借贷量。蓝色由线是违约的样本每天的数量(为了对比明显,将数量乘上了2),绿色曲线对应不违约的样本train set1200count o10008004002广外从20030350Date20131101~20141109图8.每日借贷量统计可以发现拍拍贷的业务量总体是在埤长的,而违约数量一开始也是缓慢增长,后面基本保持不变,总体上违约率是平稳甚至下降的。在横坐标300~350对应的日期区间,出现了些借贷量非鸴大的时间苄点,这些可能隐减着苿些信息,我们尚未挖掘出来。考虑到违约率跟时间线有关,我们将戒交时间的字段 Listinginfc傲了几种处理,一和是直接将其当做连续值特征,也就是上图对应的横坐标,另一和是离散化夂理,每10天作为一个区间,乜就是将日期0`10离散化为1,日期1120离散化为2.4.3类别特征的处理除了上面提到的对菜些类别特征进行特殊处理外,其他类别特征都做独热编码。44组合特征Xgboost的训练完成后可以输出特征的重要性,我们发现第三方数据特征ThirdParty Info Period XX”的 feature score比较大(见图3),即判别性比较高,于是用这部分特征构建了ξ合特征:将特征两两相除得到7000个特征,然后使用 boost对这7000多个特征单独训练模型,训练完成后得到特征重要性的排序,取其中top500个特征线下cv能达到0.73+的AUC值。将这500个特征添加到原始特征体系中,线下cv的AC值从0.777捉高到0.7833。另外,也组合了乘法特征(取对数):10g(x*y),刷选出其中的270多维,加入到原始特征休系中,单模型cv又提高到、0.785左右。4.5 Upadte Info表特征根据提供的修改信息表,我们从中抽取了用户的修改信息特征,比如:修改信息次数,修改信息时间到成交时间的跨度,每和信息的修改次数等等特征。46 LogInfo表特征类似地,我们从登录信息表里提取了用户的登录信息特征,比如登录天数,平均登录间隔以及每种操作代码的次数等47排序特征对原始特征中190维数值型特征接数值从小到大进行排序,得到190维排序特征。排序特征对异常数据有更强的鲁棒性,使得模型更加稳定,降低过拟合的风险。五、特征选择在特征工程部分,我们构建了一系列位置信息相关的特征、组合特征、成交时间特征、排序特征、类别稀疏侍征、 updateinfo和1 oginfo相关的特征等,所有特征加起来将近1500维,这么多维特征一方面可能会导致维数灾难,另一方面很容易导致过拟合,需要做降维处理,降维方法赏用的有如PCA,tSNE等,这类方法的计算复杂度比较高。并且根据以往经验,在数据挖掘类的匕赛中,PCA或t-SNE效果仨往不好。除了釆用降维算法之外,也可以通过特征选择来降低特征维度。特征选择的方法很多:最大信息系数(MIC)、皮尔森相关系数(衡量变量间的线性相关性)、正则化方法(L1,L2)、基于模型的特征排序方法。比较高效的是最后一种,即基于学习模型的特征排序方法,这种方法有一个好处:模型学习的过程和特征选择的过程是同时进行的,医此我们采用这和方法,基于 boost来做特征选择, xgboost模型洲练完成后可以输岀特征的重要性(见3.3图),据此我们可以保留TopN个特征,从而达到特在选择的目的。
    2020-06-23下载
    积分:1
  • rake接收机序.rar
    【实例简介】针对异地通信网络的3G最佳接收机matlab程序。设计的三种RAKE接收机程序。非常实用。
    2021-12-05 00:35:37下载
    积分:1
  • 曲柄连杆的运动分析(MATLAB源代码)
    只需改函数的原始参数就可以分析各种曲柄连杆机构的运动,包括角位移,角速度,角加速度,和运动仿真
    2020-12-09下载
    积分:1
  • TIA博途软件与S7-12001500+PLC应用详解.iso
    TIA博途软件与S7-12001500+PLC应用详解.iso
    2020-11-30下载
    积分:1
  • MATLAB实现V-BLAST系统及其检测算法
    本程序是对V-BLAST系统及其检测算法的仿真,可采用BPSK,QPSK,16QAM,64QAM调制。检测算法为ML,MMSE,ZF,以及采用迫零的连续干扰消除检测算法。
    2020-12-02下载
    积分:1
  • MATLAB实现图像质量评价(峰值信噪比)
    用MATLAB实现图像质量评价方法——峰值信噪比。
    2021-05-06下载
    积分:1
  • 基于高斯过分类和回归的最新代码
    基于高斯过程分类和回归的最新代码,物超所值
    2020-12-06下载
    积分:1
  • 696518资源总数
  • 105732会员总数
  • 0今日下载