-
jsceg分词器源码
jcseg是使用Java开发的一个开源中文分词器,使用流行的mmseg算法实现,并且提供了最高版本的lucene, solr, elasticsearch(New)的分词接口.1。目前最高版本:jcseg-1.9.5。兼容最高版本lucene-4.x,solr-4.x,elasticsearch2。三种切分模式: (1).简易模式:FMM算法,适合速度要求场合。 (2).复杂模式-MMSEG四种过滤算法,具有较高的岐义去除,分词准确率达到了98.41%。 (3).(!New)检测模式:只返回词库中已有的词条,很适合某些应用场合。(1.9.4版本开始)3。支持自定义词库。在lexicon文件夹下,可以随便添加/删除/更改词库和词库内容,并且对词库进行了分类。参考下面了解如何给jcseg添加词库/新词。4。(!New) 支持词库多目录加载. 配置lexicon.path中使用";"隔开多个词库目录.5。(!New)词库分为简体/繁体/简繁体混合词库: 可以专门适用于简体切分, 繁体切分, 简繁体混合切分, 并且可以利用下面提到的同义词实现,简繁体的相互检索, jcseg同时提供了词库两个简单的词库管理工具来进行简繁体的转换和词库的合并.6。中英文同义词追加/同义词匹配 + 中文词条拼音追加.词库整合了《现代汉语词典》和cc-cedict辞典中的词条,并且依据cc-cedict词典为词条标上了拼音,依据《中华同义词词典》为词条标上了同义词(尚未完成)。更改jcseg.properties配置文档可以在分词的时候加入拼音和同义词到分词结果中。7。中文数字和中文分数识别,例如:"一百五十个人都来了,四十分之一的人。"中的"一百五十"和"四十分之一"。并且jcseg
- 2022-03-07 04:18:17下载
- 积分:1
-
公历,阴历转换源代码
公历,阴历转换源代码-calendar, the lunar calendar change source code
- 2022-03-30 21:43:24下载
- 积分:1
-
Ordinary and Partial Differential Equation Routines in C, C++, Fortran, Java, Ma...
Ordinary and Partial Differential Equation Routines in C, C++, Fortran, Java, Maple, and MATLAB
- 2023-06-13 01:20:03下载
- 积分:1
-
信道容量的C实现,附详细注释
资源描述
信道容量计算的C实现,附详细注释。上传的源代码属于个人原创,非抄袭,从来没有上传过,已编译通过,我自己的硕士论文里头已经用过了,绝对真实可信
- 2022-08-16 14:16:09下载
- 积分:1
-
本程序是基因算法的vc实现
本程序是基因算法的vc实现-genetic algorithm to achieve the vc
- 2022-03-19 23:29:50下载
- 积分:1
-
蒙特卡罗算法解集合相等问题
«问题描述:给定2 个集合S和T,试设计一个判定S和T是否相等的蒙特卡罗算法。«编程任务:设计一个算法,对于给定的集合S和T,判定其是否相等。«数据输入:由文件input.txt 给出输入数据。第一行有1 个正整数n,表示集合的大小。接下来的2行,每行有n个正整数,分别表示集合S和T中的元素。«结果输出:将计算结论输出到文件output.txt。集合S和T相等则输出YES,否则输出NO。输入文件示例 输出文件示例input.txt output.txt3 YES2 3 77 2 3
- 2022-02-14 21:38:35下载
- 积分:1
-
基于C/S的复杂的多玩家棋盘游戏
基于C/S的复杂的多玩家棋盘游戏-based on C/S of the complex multi-player board game
- 2022-09-13 23:45:03下载
- 积分:1
-
分形算法和程序设计2章,用的是C语言程序设计
分形算法与程序设计 第2章VC语言程序设计-Fractal Algorithms and Program Design Chapter 2 VC Language Program Design
- 2022-10-04 01:05:03下载
- 积分:1
-
测试分析器
应用背景心电图一个简单的心电移动软件对安卓平台特征用户管理健康数据管理实时心电数据可视化如何使用在您的设备上启用蓝牙功能b)发现心电图数据源和连接它按一次点击开始实时心电数据的可视化作者faywong & lt;philip584521 @ Gmail。COM & gt;版权所有关键技术心电图机的原型为远程新生儿监测和干预项目。依赖Python 2.7Arduino >;= 1.5.6-r2(Arduino由于)流图(来源包括,但streamplot依赖的需要得到满足)-https://github.com/s-gv/stream-plotMATLAB/倍频程如果你想运行模拟TI SmartRF Flash程序员IAR 8051 & gt;= 8.30(如果你想重新编译源代码的CC2540)钛ccdebugger(编程CC2540)如何使用
- 2022-01-26 07:17:13下载
- 积分:1
-
生成最小生成树
最小生成树算法,将节点 构成的图转换为最小生成树。可用于计算某个节点到另外一些节点的最短距离
- 2022-02-06 01:48:41下载
- 积分:1