-
jsceg分词器源码
jcseg是使用Java开发的一个开源中文分词器,使用流行的mmseg算法实现,并且提供了最高版本的lucene, solr, elasticsearch(New)的分词接口.1。目前最高版本:jcseg-1.9.5。兼容最高版本lucene-4.x,solr-4.x,elasticsearch2。三种切分模式: (1).简易模式:FMM算法,适合速度要求场合。 (2).复杂模式-MMSEG四种过滤算法,具有较高的岐义去除,分词准确率达到了98.41%。 (3).(!New)检测模式:只返回词库中已有的词条,很适合某些应用场合。(1.9.4版本开始)3。支持自定义词库。在lexicon文件夹下,可以随便添加/删除/更改词库和词库内容,并且对词库进行了分类。参考下面了解如何给jcseg添加词库/新词。4。(!New) 支持词库多目录加载. 配置lexicon.path中使用";"隔开多个词库目录.5。(!New)词库分为简体/繁体/简繁体混合词库: 可以专门适用于简体切分, 繁体切分, 简繁体混合切分, 并且可以利用下面提到的同义词实现,简繁体的相互检索, jcseg同时提供了词库两个简单的词库管理工具来进行简繁体的转换和词库的合并.6。中英文同义词追加/同义词匹配 + 中文词条拼音追加.词库整合了《现代汉语词典》和cc-cedict辞典中的词条,并且依据cc-cedict词典为词条标上了拼音,依据《中华同义词词典》为词条标上了同义词(尚未完成)。更改jcseg.properties配置文档可以在分词的时候加入拼音和同义词到分词结果中。7。中文数字和中文分数识别,例如:"一百五十个人都来了,四十分之一的人。"中的"一百五十"和"四十分之一"。并且jcseg
- 2022-03-07 04:18:17下载
- 积分:1
-
报告
数值分析实验报告-report
- 2022-08-10 07:04:01下载
- 积分:1
-
用于科学计算的Fortran 90算法源程序
用于科学计算的Fortran 90算法源程序-for scientific computation algorithm source Fortran 90
- 2022-07-21 07:38:54下载
- 积分:1
-
南理工硕博上机题经典36题
从历年南理工硕博上机题中选出具有代表性的36题,让你提前熟悉南理工硕博上机。南理工硕博上机占60分,面试40分。所以如果想保硕博的话,上机是很重要的
- 2022-07-23 03:35:57下载
- 积分:1
-
numerical method C Program
数值计算方法C程序-numerical method C Program
- 2022-07-23 08:53:11下载
- 积分:1
-
基于stein算法的GCD
资源描述这是使用stein算法,实现的计算两个32位数的最大公约数的算法,在这里面使用了流水线来提高吞吐量,并且提高了工作速度,初次之外,还有两个串转并和并转串的模块,供大家参考
- 2022-03-07 20:59:26下载
- 积分:1
-
三角分解法,对于数值计算的朋友可能会有一定的帮助
三角分解法,对于数值计算的朋友可能会有一定的帮助-triangular decomposition method for the numerical calculation of a friend may be of some help
- 2023-05-08 10:25:03下载
- 积分:1
-
gjrand.4.2.0 随机数生成
c写的随机数生成程序,很实用,跨平台,可以在Linux下编译,也可以改成在windows下下编译
- 2022-03-15 00:42:44下载
- 积分:1
-
将C语言转换成汇编语言
将C语言转换成汇编语言-C language into assembler language
- 2022-03-07 03:18:38下载
- 积分:1
-
国外以为牛人编的,我也不怎么懂。。可以用来做课程设计,折实作者后来司升级后的软件...
国外以为牛人编的,我也不怎么懂。。可以用来做课程设计,折实作者后来司升级后的软件-abroad who thought that cattle series, I do not understand how. . Can be used for curriculum design, the authors pack it later Secretary upgraded software
- 2022-04-14 16:24:33下载
- 积分:1