-
jsceg分词器源码
jcseg是使用Java开发的一个开源中文分词器,使用流行的mmseg算法实现,并且提供了最高版本的lucene, solr, elasticsearch(New)的分词接口.1。目前最高版本:jcseg-1.9.5。兼容最高版本lucene-4.x,solr-4.x,elasticsearch2。三种切分模式: (1).简易模式:FMM算法,适合速度要求场合。 (2).复杂模式-MMSEG四种过滤算法,具有较高的岐义去除,分词准确率达到了98.41%。 (3).(!New)检测模式:只返回词库中已有的词条,很适合某些应用场合。(1.9.4版本开始)3。支持自定义词库。在lexicon文件夹下,可以随便添加/删除/更改词库和词库内容,并且对词库进行了分类。参考下面了解如何给jcseg添加词库/新词。4。(!New) 支持词库多目录加载. 配置lexicon.path中使用";"隔开多个词库目录.5。(!New)词库分为简体/繁体/简繁体混合词库: 可以专门适用于简体切分, 繁体切分, 简繁体混合切分, 并且可以利用下面提到的同义词实现,简繁体的相互检索, jcseg同时提供了词库两个简单的词库管理工具来进行简繁体的转换和词库的合并.6。中英文同义词追加/同义词匹配 + 中文词条拼音追加.词库整合了《现代汉语词典》和cc-cedict辞典中的词条,并且依据cc-cedict词典为词条标上了拼音,依据《中华同义词词典》为词条标上了同义词(尚未完成)。更改jcseg.properties配置文档可以在分词的时候加入拼音和同义词到分词结果中。7。中文数字和中文分数识别,例如:"一百五十个人都来了,四十分之一的人。"中的"一百五十"和"四十分之一"。并且jcseg
- 2022-03-07 04:18:17下载
- 积分:1
-
用托马斯不可压缩Couette流的FORTRAN程序计算
采用Thomas方法计算不可压缩Couette流的fortran程序-Calculated using Thomas incompressible Couette flow fortran program
- 2022-09-07 01:00:02下载
- 积分:1
-
at88sc 的源码,自己写的
at88sc0104ca的源码,自己写的,是基于51单片机的。采用IO模拟I2C,可以做来参考参考。
- 2022-08-19 16:52:17下载
- 积分:1
-
并行关联分析算法
资源描述mahout中fpgrowth算法的实现。fpgrowth算法在主要用于关联分析,相比apriori算法只需要两次读取数据库。而并行的fpgrowth算法就将算法分而治之,改写成MR的形式,可以在hadoop的大数据框架上实现大数据关联分析
- 2022-02-03 12:59:18下载
- 积分:1
-
一维码生成程序C#
资源描述一维码生成程序C#的,一维码的原理,生成。有两个版本,都是C#,可以选择code128 39等
- 2023-01-12 19:30:03下载
- 积分:1
-
This file contains the complete code of six stand
此文件包含用于聚类分析的六个独立Fortran程序的完整代码
- 2022-09-13 12:50:02下载
- 积分:1
-
计算二维TE波的ADI-FDTD方法的程序
这个是用ADI-FDTD的方法计算二维TE波的源代码。
- 2023-08-16 03:25:03下载
- 积分:1
-
蚁群算法源码
用c++实现了蚁群算法;用c++实现了蚁群算法;用c++实现了蚁群算法;用c++实现了蚁群算法;用c++实现了蚁群算法;用c++实现了蚁群算法;用c++实现了蚁群算法;用c++实现了蚁群算法;用c++实现了蚁群算法;用c++实现了蚁群算法;用c++实现了蚁群算法;用c++实现了蚁群算法;用c++实现了蚁群算法;用c++实现了蚁群算法;用c++实现了蚁群算法;用c++实现了蚁群算法;用c++实现了蚁群算法;用c++实现了蚁群算法;用c++实现了蚁群算法;用c++实现了蚁群算法;用c++实现了蚁群算法;用c++实现了蚁群算法;用c++实现了蚁群算法;用c++实现了蚁群算法;用c++实现了蚁群算法;用c++实现了蚁群算法;用c++实现了蚁群算法;用c++实现了蚁群算法;用c++实现了蚁群算法;
- 2023-04-17 17:40:04下载
- 积分:1
-
幻方
在娱乐数学幻方是安排不同的数字 (即每个数字使用一次),通常是整数,在正方形网格中,在那里在每一行和每一列中的数字和中向前和向后主对角线上的数字都加起来到相同的编号。幻方具有相同的行数以及它有根柱子,在常规的数学符号,"n"代表数量的行 (和列),它有。因此,魔术广场总是包含 n2 的数字,和它的大小 (行 [和列],它具有数目) 被形容为"的 n 阶"。[1] 包含从 1 到 n2 整数的魔术方块被称为正常的幻方。("魔方"一词有时也用于指各种类型的单词方块。)有可能构建任何大小除了 2 × 2 正常幻方 (也就是说,其中 n = 2),虽然幻方的解决方案其中 n = 1 是微不足道的因为它只是由单个单元格包含数字 1。小非平凡案例,如下所示,是一个 3 × 3 网格 (也就是说,三阶的魔术广场)。这是解决 nxn 幻方的项目
- 2023-03-28 06:25:04下载
- 积分:1
-
巨指针类型数据的快速排序法
巨指针类型数据的快速排序法-Quick sort for the large pointer type data
- 2022-10-04 15:50:03下载
- 积分:1