登录
首页 » Others » 台湾大学机器学习基石手写笔记

台湾大学机器学习基石手写笔记

于 2020-06-19 发布
0 239
下载积分: 1 下载次数: 2

代码说明:

大家好,我是Mac Jiang,今天和搭建分享的是台湾大学机器学习基石(Machine Learning Foundations)的个人笔记。个人觉得这门课是一门非常好的机器学习入门课程,值得初学者学习!这份笔记是本人一笔一划手写,扫描后上传了,也算是一个月的心血,希望我的工作能够给大家带来一些学习上的帮助。Week 1: The leaming ProblemDateP1. What is Machine Learning?m:画过观架( observation)款悍技能〔)cb→圆>skdem0过数(d枝能(s)t→DML→5m Prove:增进某种表现 Performance measurePer fornoMeasureML: an alternative rute to butt aomplacoded systems- When human connot prinn the system manually (navigating on Mars)-When human nnot define the solution esaily(speech/vgual recgnition)-When needing raBid deasions that huniang cannot do (high freguency trading?When neeling to be user-orrented in a massive sale(Consumer-targetd mopketig)dataim proved①有在其些日术Pattern RcRRMLerformance机购在完不知邮们度珠meusure的隐藏规剧料灿2.Appliaation of Machine learniO food: data Twitter data Wordsspill tell food Poisoning Cike lines of resturant properlye clothig. data: scale fiqures +client surveysskill: give good fashion recommendation to Clients3 Hosing, data, characteristic of buidings and their energy loadkill:predict energy lad of other buiding closely9 Trans potation: data: Some traffic sign images and meaningsShill= recognize troffic Sions acuratelyO Education: data. Studerts, records onizes ona math tutoring systemskilL: Predict whether a stdert can give a Comet answer to anther question⑥ ntertainment:da: ho w many users have hated some movies象社解料系子荐你统stiu Predict how a user Would rate an uNatPagc3. Com Ponent of Machine lemn输入:x∈x出:y∈Y睛数(9Mrtm)tf:y→丫〔想下的)抛规律台道数据如 raining examples:D=,,()…(xmhyes分sk:9x→y〔学到的程制的孤)辆一M→9Algur+nH( hy Pothesis Set)色色妇的成坏的Pt8,9∈H,从种中最的即9Leaming model= A and He hypothesis set4.Machine learning and other FiMachine (earring, B do值到约练于B数于的设3CMLatMn鸡:eg如 to find property that15e西不哦啥CDM)若立越西的为9R西事无大大区刷若栖与9关,PM可帮助MLArdt9g让电座有很瞰明的表视(下开)CA工)机学展现A工铝能的方法statistics(计利用瓷料爆到推龙,从数学角出发纯计晨钯机罟孑的方法第2讲: Learn to Answera人阳0 n Hypothesis set(假设集)Xxx)「y=(,许答 Wii threshold飞岁=+,讲卷Wx∠thr

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • DSP实验报告DSP实验报告
    DSP实验报告DSP实验报告DSP实验报告DSP实验报告DSP实验报告DSP实验报告DSP实验报告DSP实验报告DSP实验报告DSP实验报告DSP实验报告DSP实验报告DSP实验报告DSP实验报告DSP实验报告DSP实验报告DSP实验报告DSP实验报告DSP实验报告DSP实验报告DSP实验报告DSP实验报告
    2021-05-06下载
    积分:1
  • vb.net 2010 Access 学籍管理系统源码
    本系统是一个完整的vb2010+access实例,包含类的创建,对access的添加,删除,更新数据等操作。
    2020-12-05下载
    积分:1
  • NCL画站点降水
    NCL画站点降水脚本代码,需要的可以看看
    2020-12-11下载
    积分:1
  • 基于傅立叶-梅林变换的图像配准
    基于傅立叶-梅林变换的matlab图像配准程序,可以灵活设置待配准图像的大小及旋转角度等,配准前可以选择多个参数控制配准结果,可以显示配准后的图像及图像间的具体变换参数以及中间结果等。
    2021-05-06下载
    积分:1
  • 哈夫曼树实现文件解压缩
    Huffman构造自适应霍夫曼树实现文件的压缩与解压缩。-Adaptive Huffman tree structure for file compression and decompression.文件列表(点击判断是否您需要的文件,如果是垃圾请在下面评价投诉): EncoderHuffman.h .......Encoder.cpp DecoderHuffman.h .......Decoder.cpp Encoder Decoder
    2021-05-07下载
    积分:1
  • 2012年全国大学生数学建模竞赛A等奖论文
    2012年全国大学生数学建模竞赛A题一等奖论文。高教社杯全国大学生数学建模竞赛编号专用页赛区评侧编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):全国统编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):基于数理分析的葡萄及葡萄酒评价体系摘要葡萄酒的质量评价是硏究葪萄酒的一个重要领域,目前葡萄酒的质量主要由评酒师感官评定。但感官评定存在人为因素,业界一自在尝试用葡萄的理化指标或者葡萄洏的理化指标定量评价葡萄洒的质量。本题要求我们根据葡萄以及葡萄酒的相关数据建模,并研究基」理化指标的葡萄酒评价体系的建立对于问题一,我们首先用配对样品t检验方法研究两组评酒员评价差异的显著性,将红葡萄酒与白葡萄酒进行分类处理,用SPSS软件对两组ⅳ酒员的评分的各个指标以及总评分进行了配对样本t检验。得到的部分结果显示:红葡萄酒外观色调、香气质量的评价存在显著性差异,其他单指标的评价不存在显著差异白葡萄、红葡萄以及整休的评价存在显著性差异接着我们建立了数掂可信度评价模型比较两组数据的可信性,将数据的可信度评价转化成对两组评酒员评分的稳定性评价。首先我们对单个评酒员评分与该组所有评酒员评分的均值的偏差进行了分析,偏差不稳定的点就成为噪声点,表明此次评分不稳定。然后我们用两组评酒员评分的偏差的方差衡量评酒员的稳定性。得到第2组的方差明显小于第1组的从而得出了第2组评价数据的可信度更高的结论。对于问题二,我们根据酿酒葡萄的理化指标和葡萄酒质量对葡萄进行了分级。方面,我们对酿酒葡萄的级理化指标的数据进行标准化,基于主成分分析法对其进行了因子分析,并且得到了27种葡萄理化指标的综合得分及其排序(见正文表5)。另一方面,我们又对附录给出的各单指标百分制评分的权重进行评价,并用信息熵法重新确定了权重,用新的权重计算出27种葡萄酒质量的综合得分并排序(见正文表6)。最后我们对两个排名次序用基于模糊数学评价方法将葡萄的等级划分为1-5级(见正文表8)。对于问一,首先我们将众多的葡萄理化指标用主成分分析法综合成6个主因子,并将葡萄等级也列为主因子之一。对葡萄的6个主因子,以及葡萄酒的10个指标用SPSS软件进行偏相关分析,得到酒黃酮与葡萄的等级正相关性较强等结论。之后对相关性较强的主因子和指标作多元线性回归。得到了葡萄酒10个单指标与主因了之间的多元回归方程,该回归方程定量表示两者之间的联系对于问题四,我们首先将葡萄酒的理化指标标准化处理,对葡萄酒的质量与荀萄的6个主因子和葡萄酒的10个单指标作偏相关分析,并求出多元线性回归方程。该方程就表示了葡萄和葡萄酒理化指标对葡萄酒质量的影响。之后,我们通过通径分析方法中的逐步回归分析得到葡萄与葡萄酒的理化指标只确定了葡萄酒质量信息的47%。从而得出了不能用葡萄和葡萄酒的理化指标评价葡萄酒的质量的结论。接着我们还采用通径分析屮的间接通径系数分析求出各自变量之间通过传递作用对应变量的影响,得到单宁与总酚传递性影响较强等结论最后,我们对模型的改进方向以及优缺点进行了讨论。关键词:配对样本t检验数据可信度评价主成分分析模糊数学评价综合评分信息熵偏相关分析多元线性回归1问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒荀萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件中给岀∫某年份一些葡萄酒的评价结果,并分別给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。我们需要建立数学模型并且讨论下列问题:1.分析附件1中两组评洒员的评价结果有无显著性差异,并确定哪一组的评价结果更可信。2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用荀萄和葡萄酒的理化指标来评价葡萄酒的质量2模型的假设与符号的约定2.1模型的假设与说明(1)评酒员的打分是按照加分制(不采用扣分制);(2)假设20名评酒员的评价八度在同一区间(数据合理,不需要标准化)(3)每位评酒员的系统误差较小,在本问题屮可以忽略不计(4)假设附件中给出的葡萄和荀萄酒理化指标都准确可靠。2.2符号的约定与说明符号符号的意义原假设显著性概率第1组评酒员对第号品种葡萄酒评分的平均值,第2组评洒员对第号品种葡萄酒评分的平均值第一组评酒员对指标评分的偏差的方差,第二组评酒员对指标评分的偏差的方差,=…,第1组10位评酒员对号酒样品第项指标评分的平均分第组第号评酒员对号酒样品第项指标评分与平均值的偏第1组第号评酒员对其项指标评分与平均值的偏差的平均第2组第个评酒员的总体指标偏差的方差重新确立的第项指标的权重第2组10个评酒员的总体指标偏差的方差评酒员指标的平均评分,=葡萄的第项指标,葡萄的第项因子,=葡萄酒的第项理化指标3问题一的分析与求解3.1问题一的分析题冂要求我们根据两组评酒员对27种红葡萄洒和28种白葡萄泙的10个指标相应的打分情况进行分析,并确定两组评酒员对葡萄酒的评价结果是否有显著性差异,然后判断哪组评酒员的评价结果更可信初步分析可知:由于评酒员对颜色、气味等感官指标的衡量人度不同,因此两组评酒员评价结果是否具有显著性差异应该与评价指标的类型有关,不同的评价指标的显著性差异可能会不同。同时,由于红葡萄酒和白葡萄酒的外观、口味竽指标羔异性较大,处理时需要将白葡萄酒和红葡萄酒的评价结果的显著性差昦分开讨论。基于以上分析,我们可以分别两组品尝同一种类酒样品的评酒员的评价结果进行两两配对,分析配对的数据是否满烂配对样品t检验的前提条件,而且根据常识可知评酒员对同一种酒的同一指标的评价在实际中是符合t检验的条件的。接着我们就可以对数据进行多组配对样品的t检验,从而对两组评洒员评价结果的显著性差异进行检验。由于对同一酒样品的评价数据只有两组,我们只能通过评价结果的稳定性来判定结果的可靠性。而每组结果的可靠性乂最终决定于每个评酒员的稳定性,因此将问题转化为对评酒员稳定性的评价。3.2配对样品的t检验简介统计知识指出:配对样本是指对冋一样本进行两次测试所获得的两组数据,或对两个完全相同的样本在不同条件下进行测试所得的两组数据。在本问中我们可以把配对样品理解为有27组两个完全相同的酒样品在两组不同评酒员的检测下得到的两组数据,两组屮各个指标的数据为每组评酒员对该指标打分的平均值配对样品的t检验可检测配对双方的结果是否具有显著性差异,因此就可以检验出配对的双方(第一组与第二组)对葡萄酒的评价结果是否冇差异性型对样品t检验具有的前提条件为:(1)两样品必须配对(2)两样品来源的总体应该满足正态性分布。配对样品t检验基本原理是:求出每对的差值如果两种处理实际上没有差异,则差值的总体均数应当为0,从该总体中抽出的样本其均数也应当在0附近波动;反之,如果两种处理有差异,差值的总体均数就应当远离0,其样本均数也应当远离0。这样,通过检验该差值总体均数是否为0,就可以得知两种处理有无差异。该检验相应的假设为:=,两种处理没有差別,4≠两和处理存在差别3.3葡萄酒配对样品的t检验问题一中配对样品为27组两个完全相同的酒样品在两组不同评酒员的检测下得到的两组数据,其中两组中各个指标的数据为各组10个评酒员对该指标打分的平均值。该问题中的10个指标分别为:外观澄清度、外观色调、香气纯正度、香气浓度、香气质量、口感纯正度、口感浓度、口感持久性、口感质量、平衡/总休评价。根据t检验的原理,对荀萄酒配对样品进行t检验之前我们要对样品进行正态性检验。首先我们根据附件一并处理表格中的数据,得到配对样品的两组数据,绘制红葡萄酒配对样品表格部分数据如表1表1红葡萄酒配对样品数据表澄清度澄清度平衡/整平衡/整(1组均值)(2组均值)体评价(1组体评价(2组均值)均值)2.3.18.4红29.6红263.63.78.8红273.73.78.8白葡萄酒配对样品表格部分数据如表2:表2白葡萄酒配对样品数据表澄清度澄清度平衡/整平衡/整(1组均值)(2组均值)体评价(1组体评价(2组均值)均值)白17.78.4白22.93.19.1日26白273.778.8从上表中我们能看出,将白葡萄酒和红葡萄酒中的每个指标分别进行样品的配对后,每一个指标的配对结果有27对,每一对的双方分别是1组和2组的评酒员对该指标的评分的平均值。3.3.1样本总体的K-S正态性检验配对样品的t检验要求两对应样品的总体满足正态分布,则总体中的样品应该满足正态性或者近似正态性,样本的正态性检验如卜以红葡萄酒的澄清度的27组数据为例分析:利用SPSS软作绘制两样品的直方图和趋势图如图1所示:图1红葡萄酒澄清度两组数据自方图我们假设两组总体数据都服从态分布,利用SPSS软件进行KS忙态性检验的具体结果见附录2.3。两组数据的近似相伴概率值P分别为0.239和0.329,大于我们一般的显著水平0.05则接受原来假设,即两组红葡萄酒的澄清度数据符合近似正态分布同理可用SPSS软件对其他指标的正态性进行检验,得到结果符合实际猜想,都服从近似正态分布。3.3.2葡萄酒配对样品t检验步骤两种葡萄酒的处理过程类似,这里我们以对红葡萄酒谜价结果的差异的显著性分析为例。step1:我们以第一组对葡萄酒的评价结果总体服从正态分布〃σ,以第二组对葡萄酒的评价结果总体服从正态分布μσ。我们已分别从两总体中获得了抽样样本和,并分别进行两样品相互配对。(具体数据见附录2.1)Step2:;引进一个新的随机变量,对应的样本为将配对样本的t检验转化为单样本t检验Step3:建立零假设4=,构造t统计量;Step4:利用SPSS进行配对样品t检验分析,并对结果做出推断3.4显著性差异结果分析3.3.1红葡萄酒各指标差异显著性分析由SPSS软件对红葡萄酒各指标的配对样品讠枍验后,得到各指标的显著性概率分布表。(结果如表3所示)表3红葡萄酒酒各指标显著性概率P指标外观澄清度外观色调香气纯正度香气浓度‖香气质量P0.6140.0020.1510.1000.010指标口感纯正度口感浓度口感持久性口感质量平衡/整体P0.4370.1580.2510.0550.674由统计学知识,如果显著性概率P显著水平α,则不能拒绝零假设,即认为两总体样本的均值不存在显著差异。则根据表3可得:两组评酒员对红葡萄酒各项指标的评价中除外观色调、香气质量存在显著性差异以外,其他8项指标都无显著性差异。3.3.2白葡萄酒各指标差异显著性分析代入白葡萄酒的评价数据,重复以上步骤,得到白荀萄酒各指标的显著性概率分布表。(结果如表4所示)表4白葡萄酒各指标显著性概率P分布表指标外观澄清度外观色调香气纯正度香气浓度香气质量P0,2990.0890.930.2380.714指标口感纯正度口感浓度口感持久性口感质量平衡/整体0,0000.0050.8630.0000.00l分析表4可得:两组评酒员对白葡萄酒各项指标的评价中只有凵感纯正度」感浓度、凵感质量、平衡/整体评价存在显著性差异,其他6项指标都无显著性差异3.3.3葡萄酒总体差异显著性分析(1)红葡萄酒总体差异显著性分析该问题的附件中已经给出了10项指标的杈重,因此将10项指标利用加权合并成总体评价。对于红葡萄酒两组评价结果构造两组配对t检验。得到显著性概率P=0.030
    2020-12-04下载
    积分:1
  • 卡尔曼 ,扩展卡尔曼,无迹卡尔曼,粒子,强跟踪等各种滤波方法代码,并配有论文
    卡尔曼 ,扩展卡尔曼,无迹卡尔曼,粒子,强跟踪等各种滤波方法代码,并配有论文
    2020-07-02下载
    积分:1
  • 基于C语言实现的网络爬虫
    完全基于C语言实现的网络爬虫(也就是所谓的网络蜘蛛、搜索引擎),内附详细的设计文档和详细的讲解,想学的同志不容错过吖
    2020-12-03下载
    积分:1
  • 电网数据Gephi数据集
    电网数据Gephi数据集涵盖美洲大部分电网数据,可以直接导入运行
    2020-06-01下载
    积分:1
  • 数字信号处理C语言序集(DSP算法大全C语言版本446页)
    除掉封面,共446页,只有5.39M,但内容是最全面的,质量上也是非常清晰的。是学dsp算法的绝佳书籍,没有华丽的数学推导,简单明了,名曰数字信号处理C语言程序集,民间又称DSP算法大全C语言版本。第六章FIR数字滤波器的设计F■尋■■b■晷↓國■看↓■↓b日↓bb↓●■■22786.1窗函数方法…22?§6.2域最小误差平方设计.……238§6.3切比雪夫逼近方法…………42第三篇随机数字信号处理第一章经典谱佔计……6§11功率谱估计的周期图方法…····““甲早争·道者自自.264§1.2功率谱估计的相关方法T■冒■■■■■『曾■■詈『國昏日■■哥■订d·聊聊b■山如↓h“◆白ψp4q第二章现代谱估计………………………26821求解一般托布利兹方程组的莱文森算法■■■昏■■1冒■■看嚼司聊國司冒D■180§22求解对称正定方程组的乔里斯基算法q■ψ鲁鲁曾◆◆曾自自4鲁唱音昏鲁自■Z83§23求解尤利沃克广程的菜文森德宾算法…°P甲自287§2.4计算ARMA模型的功率谱密度§2.5尤利沃克谱佔计算法………………………………………292A2.6协力差谱估计算法…1亡■曾■■目■鲁會曾罪司罪鲁·命讠咖D■■■■b啁§2.7 Burg谱佔计算法……1■●33§2.8最大似然谱估计算法第三章时频分析·聊·即·D●b·■唱鲁·◆■申曾阜曾q俨俨■■中個◆314§3.1维格纳( Wigner)分布·“314§32离散小波变换r""t31第四章随机信号的数字滤波也“命甲甲即甲330§41维纳( Wiener)数字滤波330§4,2卡尔曼( Kalman)数宇滤波.吾小如山山甲·自甲§43最小均方(LMS)自适应数字滤波"…"…"∵"卜"r""r"s""341§4-4归一化LMS自适应数字滤波…………344§4.5递推最小二乘(RLS)自适应数字濃泼导↓↓晶3L8第四篇数字图像处理第一章图像雄本运算■■↓罪隱b■【b啁山b西血a导即·晶s咱■聊暴,M352§1.1图像读取、存储与显示…第一篇常用数字信号的产生第一章数字信号的产生§1.1均匀分布的随机数功能产生(a,b)区间上均匀分布的随机数。方法简介均匀分布的概率密度函数为f(r)共它2,方差为Qb通常用U(a,b)表示。均匀分布的均值为+b产生均匀分布随机数的方法下首先,由给定的初值x,用混合同余法a=(ai-1+c)(mod M)产生(,1)区间上的随机数y其中:a-2045,c=1,M=22;然后,通过变换x,=a(ba)y;产生{a,b)区间上的随机数z;三、使用说明1.子函数语句double urniform (a, b, seed>2.形参说明a——双精度实型变量。给定区间的下限。b—双糖度实型变量。给定区间的上限。seed-—长整型指针变量。*seed为随机数的种子。四、子函数程序(文件名: uniform.c)Double uniform (a, b, seed)double a, bilong int的sced;QubIc¥seed=2045兴(#seed)+1ccd=.Scd一(;gced/lC48576)两L18576t=(兴seed)/1048576.0;t=+a)苦trefute〔五、例题产生50个0到1之问均匀分布的随机数主函数程序(文件名: uniform.r):# inelude" stdio.h′include furiomaini)doble a,b,x; int i+Jg intdouble unifo r(double, double, long int xa=0.0;h=1.0;=13?9for(i=0
    2020-07-02下载
    积分:1
  • 696516资源总数
  • 106562会员总数
  • 4今日下载