登录
首页 » 算法 » 中科院的概率上下无关文法的句法分析

中科院的概率上下无关文法的句法分析

于 2022-02-04 发布 文件大小:551.93 kB
0 141
下载积分: 2 下载次数: 1

代码说明:

概率句法分析器对于统计自然语言处理的很多高层应用,如统计机器翻译、问答系统、信息抽取、文本挖掘等都是至关重要的,直接决定这些应用系统的最终性能。本系统是一个概率型的Chart分析器。系统的分析算法是采用了多种优化策略。分析结果是概率最大的一棵分析树。在概率模型方面,本系统在一定程度上突破了PCFG的缺点

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • Hash大全
    Hash算法大全,收集于互联网,包含:旋转hash,混合hash算法,输出64位的值,AP算法,DEK算法,DJB算法,Thomas Wang的算法,整数hash,ELF算法,SDBM算法,BKDR算法,等
    2022-05-05 08:28:14下载
    积分:1
  • 常用的C++语言计源代码
    C语言常用算法源代码-C language commonly used calculates the law origin code
    2023-01-08 13:35:03下载
    积分:1
  • 交流永磁同步工程源码
    应用背景 永磁同步交流伺服电机;矢量控制;SVPWM;TMS320F2812 关键技术永磁同步交流电机的矢量控,并根据矢量控制理论运用DSP实现了对永磁同步交流伺服电机的电流、速度和位置的三闭环控制,经测试仿真OK
    2022-03-02 06:57:05下载
    积分:1
  • C++ ItemCF
    UserCF和ItemCF是协同过滤中最为古老的两种算法,在top-N的推荐上被广泛应用。这两个算法之所以重要,是因为他们使用了两个不同的推荐系统基本假设。UserCF认为一个人会喜欢和他有相同爱好的人喜欢的东西,而ItemCF认为一个人会喜欢和他以前喜欢的东西相似的东西。这两个假设都有其合理性。根据我的测试,用UserCF和ItemCF做出的推荐列表中,只有50%是一样的,还有50%完全不同。但是这两个算法确有相似的精度。所以说,这两个算法是很互补的。我一直认为这两个算法是推荐系统的根本,因为无论我们是用矩阵,还是用概率模型,我们都非常的依赖于前面说的两种假设。如果用户的行为不符合那两种假设,推荐系统就没必要存在了。因此我一直希望能够找出这两种算法的本质区别。他们有相似的精度,但是coverage相差很大,ItemCF coverage很大而UserCF很小。我还测试了很多其他指标,不过要从这些表象的指标差异找出这两个算法的本质区别还是非常困难。不过上周我基本发现了这两个算法推荐机理的本质区别。我们做如下假设。每个用户兴趣爱好都是广泛的,他们可能喜欢好几个领域的东西。不过每个用户肯定也有一个主要的领域,对这个领域会比其他领域更加关心。给定一个用户,假设他喜欢3个领域A,B,C,同时A是他喜欢的主要领域。这个时候我们来看UserCF和ItemCF倾向于做出什么推荐。结果如下,如果用UserCF, 它会将A,B,C三个领域中比较热门的东西推荐给用户。而如果用ItemCF,它会基本上只推荐A领域的东西给用户。因为UserCF只推荐热门的,所以UserCF在推荐长尾上能力不足。而ItemCF只推荐A领域给用户,这样他有限的推荐列表中就可能包含了一定数量的不热门item,所以ItemCF推荐长尾的能力比较强。不过ItemCF的推荐对某一个用户而言,显然多样性不足。但是对整个系统而言,因为不同的用户的主要兴趣点不同,所以系统的coverage会很大。显然上面的两种推荐都有其合理性,但都不是最好的选择,因此他们的精度也会有损失。最好的选择是,如果我们给这个用户推荐30个item,我们既不是每个领域挑选10个最热门的给他,也不是推荐30个A领域的给他,而是比如推荐15个A领域的给他,剩下的15个从B,C中选择。认识到这一
    2022-03-26 08:57:57下载
    积分:1
  • Apriori 数据挖掘 源码
    Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。在这里,所有支持度大于最小支持度的项集称为频繁项集,简称频集。 是:首先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小可信度。然后使用第1步找到的频集产生期望的规则,产生只包含集合的项的所有规则,其中每一条规则的右部只有一项,这里采用的是中规则的定义。一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。为了生成所有频集,使用了递归的方法。
    2022-02-06 22:22:07下载
    积分:1
  • 实现一元线性回归分析并进行F,t检验,以便对得出的回归方程进行线性显著性分析...
    实现一元线性回归分析并进行F,t检验,以便对得出的回归方程进行线性显著性分析-achieving a linear regression analysis and F, t test, in order to come to the linear regression equation significantly Analysis
    2022-06-20 17:50:42下载
    积分:1
  • 在COMSOL Multiphysics模拟悬臂
    Cantilever simulations in COMSOL Multiphysics
    2022-04-30 08:46:35下载
    积分:1
  • this document for the simulation of MIMO
    此文件用于仿真MIMO-STBC 系统性能程序,包括了发送,mimo quasi-static channel 和接收部分。用的是8psk调制 -this document for the simulation of MIMO- STBC system performance procedures, including sending, mimo quasi--static channel and receive part. The modulation of eight psk
    2022-03-18 07:05:49下载
    积分:1
  • 构造说明语句的语分析程序
    1.根据PASCAL语言的说明语句形式,用手工及自动方法构造一个对说明语句进行词法分析的程序。该程序能对从键盘输入或从文件读入的形如: “const count=10,sum=81.5,char1=’f’,string1=”hj”, max=169;” 的常量说明串进行处理,分析常量说明串中各常量名、常量类型及常量值,并统计各种类型常量个数。 2.对说明语句经词法分析器分析得到的
    2022-01-26 02:36:15下载
    积分:1
  • DRJ Owen的非线性有限元程序(静力部分)。
    DRJ Owen的非线性有限元程序(静力部分)。
    2022-04-29 00:31:01下载
    积分:1
  • 696516资源总数
  • 106409会员总数
  • 8今日下载