登录
首页 » 算法 » jsceg分词器源码

jsceg分词器源码

于 2022-03-07 发布 文件大小:17.41 MB
0 209
下载积分: 2 下载次数: 1

代码说明:

jcseg是使用Java开发的一个开源中文分词器,使用流行的mmseg算法实现,并且提供了最高版本的lucene, solr, elasticsearch(New)的分词接口.1。目前最高版本:jcseg-1.9.5。兼容最高版本lucene-4.x,solr-4.x,elasticsearch2。三种切分模式: (1).简易模式:FMM算法,适合速度要求场合。 (2).复杂模式-MMSEG四种过滤算法,具有较高的岐义去除,分词准确率达到了98.41%。 (3).(!New)检测模式:只返回词库中已有的词条,很适合某些应用场合。(1.9.4版本开始)3。支持自定义词库。在lexicon文件夹下,可以随便添加/删除/更改词库和词库内容,并且对词库进行了分类。参考下面了解如何给jcseg添加词库/新词。4。(!New) 支持词库多目录加载. 配置lexicon.path中使用";"隔开多个词库目录.5。(!New)词库分为简体/繁体/简繁体混合词库: 可以专门适用于简体切分, 繁体切分, 简繁体混合切分, 并且可以利用下面提到的同义词实现,简繁体的相互检索,  jcseg同时提供了词库两个简单的词库管理工具来进行简繁体的转换和词库的合并.6。中英文同义词追加/同义词匹配 + 中文词条拼音追加.词库整合了《现代汉语词典》和cc-cedict辞典中的词条,并且依据cc-cedict词典为词条标上了拼音,依据《中华同义词词典》为词条标上了同义词(尚未完成)。更改jcseg.properties配置文档可以在分词的时候加入拼音和同义词到分词结果中。7。中文数字和中文分数识别,例如:"一百五十个人都来了,四十分之一的人。"中的"一百五十"和"四十分之一"。并且jcseg

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • 约瑟夫环.CPP,一个解约瑟夫环的C++实现
    约瑟夫环.CPP,一个解约瑟夫环的C++实现-Joseph Ring. CPP, a solution of Joseph Central C++ Realize
    2022-11-12 22:20:02下载
    积分:1
  • C++实现语音的特征参数提取
    资源描述语音识别中常用的参数有LPCC(线性预测倒谱系数)和MFCC(梅尔频率倒谱系数)。其中LPCC是基于人的发音模型建立的,是一种基于合成的参数。而MFCC是一种基于人耳的听觉特性提出的。大量研究表明,MFCC能够比LPCC更好的提高系统的识别性能。
    2023-01-24 15:40:09下载
    积分:1
  • 一个魔方图的程序,希望大家给予支持!
    一个魔方图的程序,希望大家给予支持!-a Rubik"s cube map procedures in the hope that we can give support!
    2022-12-14 18:30:03下载
    积分:1
  • 眼中最亮的点
    寻找最亮的点的眼睛的图像中。这是通过人脸检测,然后使用内置的MATLAB函数眼检测完成。 最亮的点是通过转换为实验室发现。
    2022-01-26 06:56:32下载
    积分:1
  • ldpc 码的代码
    我有新代码为编码器。我获得了编码器的新代码。我喜欢新代码的编码器。请下载此代码为感谢你非常
    2022-01-25 18:09:09下载
    积分:1
  • 停车场管理系统
    设停车场内只有一个的停放n辆汽车的狭长通道,且只有一个大门可供汽车进出。汽车在停车场内按车辆到达时间的先后顺序,依次由北向南排列(大门在最南端,最先到达的第一辆车停放在车场的最北端),若车场内已停满n辆汽车,则后来的汽车只能在门外的便道上等候,一旦有车开走,则排在便道上的第一辆车即可开入;当停车场内某辆车要离开时,在她之后开入的车辆必须先退出车场为它让路,待该辆车开出大门外,其它车辆再按原次序进入车场,每辆停放在车场的车在它离开停车场时必须按它停留的时间长短交纳费用。
    2022-02-21 02:44:31下载
    积分:1
  • cuda实现矩阵相乘实例
    CUDA矩阵相乘A*B=C代码,任意输入矩阵A的宽度和矩阵B的宽度(A[wB][wA]*B[wA][wB]),cudaMallocPitch开辟显存空间,cudaMemcpy2D数组复制,Kahan"s Summation Formula提高浮点计算精度。
    2022-06-16 18:04:10下载
    积分:1
  • CRC32 calculation in C++
    CRC32计算算法采用C++语言,可用于嵌入式系统和GUI等应用。
    2022-03-05 00:31:47下载
    积分:1
  • Cualquier mierda
    Codasdasdasdasssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssss
    2023-01-16 14:30:04下载
    积分:1
  • DES应用工具
    提供des,3des算法及mac算法,主要用于加解密及mac计算用于金融领域
    2022-12-14 12:50:04下载
    积分:1
  • 696516资源总数
  • 106627会员总数
  • 16今日下载