-
jsceg分词器源码
jcseg是使用Java开发的一个开源中文分词器,使用流行的mmseg算法实现,并且提供了最高版本的lucene, solr, elasticsearch(New)的分词接口.1。目前最高版本:jcseg-1.9.5。兼容最高版本lucene-4.x,solr-4.x,elasticsearch2。三种切分模式: (1).简易模式:FMM算法,适合速度要求场合。 (2).复杂模式-MMSEG四种过滤算法,具有较高的岐义去除,分词准确率达到了98.41%。 (3).(!New)检测模式:只返回词库中已有的词条,很适合某些应用场合。(1.9.4版本开始)3。支持自定义词库。在lexicon文件夹下,可以随便添加/删除/更改词库和词库内容,并且对词库进行了分类。参考下面了解如何给jcseg添加词库/新词。4。(!New) 支持词库多目录加载. 配置lexicon.path中使用";"隔开多个词库目录.5。(!New)词库分为简体/繁体/简繁体混合词库: 可以专门适用于简体切分, 繁体切分, 简繁体混合切分, 并且可以利用下面提到的同义词实现,简繁体的相互检索, jcseg同时提供了词库两个简单的词库管理工具来进行简繁体的转换和词库的合并.6。中英文同义词追加/同义词匹配 + 中文词条拼音追加.词库整合了《现代汉语词典》和cc-cedict辞典中的词条,并且依据cc-cedict词典为词条标上了拼音,依据《中华同义词词典》为词条标上了同义词(尚未完成)。更改jcseg.properties配置文档可以在分词的时候加入拼音和同义词到分词结果中。7。中文数字和中文分数识别,例如:"一百五十个人都来了,四十分之一的人。"中的"一百五十"和"四十分之一"。并且jcseg
- 2022-03-07 04:18:17下载
- 积分:1
-
VC++实现的一个计算器,采用了一个高手写的按钮类,界面友好...
VC++实现的一个计算器,采用了一个高手写的按钮类,界面友好-VC to achieve a calculator, using a button to write a master class, user-friendly
- 2022-06-14 15:07:42下载
- 积分:1
-
signal processing of time
时频富FFT的信号处理
- 2022-11-03 13:25:03下载
- 积分:1
-
是个数学建模源代码
是个数学建模源代码-is a mathematical modeling source code
- 2022-05-24 14:03:17下载
- 积分:1
-
One
一维非稳态扩散问题通用程序(Basic语言)-One-dimensional non-steady-state GM-proliferation program (Basic language)
- 2022-01-26 06:21:26下载
- 积分:1
-
长整数类,数据成员有一个指针,一个整数size,可以存放100位以上整数,可以做加法乘法运算...
长整数类,数据成员有一个指针,一个整数size,可以存放100位以上整数,可以做加法乘法运算-long integer, data members of a pointer, an integer size, can be kept above 100 integer, the additive can do multiplication
- 2023-01-31 02:00:03下载
- 积分:1
-
一维时间序列分行维数,利用计盒法计算得到的分形维数,希望对大家有所帮助!...
一维时间序列分行维数,利用计盒法计算得到的分形维数,希望对大家有所帮助!-Branch of one-dimensional time series dimension, using box method calculated the fractal dimension, and they hope to be helpful to everyone!
- 2022-02-07 12:30:37下载
- 积分:1
-
一个简单的字符冒泡排序例子
一个简单的字符冒泡排序例子-A simple example for bubble chars sorting.
- 2022-05-28 19:57:56下载
- 积分:1
-
图论算法库,包括以下算法:
单源最短路径 Dijkstra 算法
单源最短路径 Bellman...
图论算法库,包括以下算法:
单源最短路径 Dijkstra 算法
单源最短路径 Bellman-Ford 算法
最小生成树 Prim 算法
每对节点间最短路径 Flod-Warshall 算法
程序用C++语言编写,在VisualAge C++ 4.0下调试通过。压缩包内的Graph.h文件包含所有的库函数,其调用接口见程序内注释。其他的文件是用来测试算法的测试程序,在VisualAge C++ 4.0下编译运行。
该算法是为参加ACM/ICPC竞赛而准备的资料,由于竞赛的对编程速度要求较高,所以为了将代码写的短一点,为了便于调试,代码的写的并不是最优的。
该代码在VisualAge C++ 4.0下写成,但是很容易将其移植到MS Visual C++上。
-err
- 2023-01-27 10:10:05下载
- 积分:1
-
编译原理 语法分析
编译原理对语法分析设计的代码 能进行语义的分析,通过设计调试LR语法分析程序,实现根据词法分析的输入TOKEN字,进行文法的语法分析;加深对课堂教学的理解;提高语法分析方法的实践能力。
- 2022-08-17 11:21:50下载
- 积分:1