登录
首页 » 算法 » jsceg分词器源码

jsceg分词器源码

于 2022-03-07 发布 文件大小:17.41 MB
0 140
下载积分: 2 下载次数: 1

代码说明:

jcseg是使用Java开发的一个开源中文分词器,使用流行的mmseg算法实现,并且提供了最高版本的lucene, solr, elasticsearch(New)的分词接口.1。目前最高版本:jcseg-1.9.5。兼容最高版本lucene-4.x,solr-4.x,elasticsearch2。三种切分模式: (1).简易模式:FMM算法,适合速度要求场合。 (2).复杂模式-MMSEG四种过滤算法,具有较高的岐义去除,分词准确率达到了98.41%。 (3).(!New)检测模式:只返回词库中已有的词条,很适合某些应用场合。(1.9.4版本开始)3。支持自定义词库。在lexicon文件夹下,可以随便添加/删除/更改词库和词库内容,并且对词库进行了分类。参考下面了解如何给jcseg添加词库/新词。4。(!New) 支持词库多目录加载. 配置lexicon.path中使用";"隔开多个词库目录.5。(!New)词库分为简体/繁体/简繁体混合词库: 可以专门适用于简体切分, 繁体切分, 简繁体混合切分, 并且可以利用下面提到的同义词实现,简繁体的相互检索,  jcseg同时提供了词库两个简单的词库管理工具来进行简繁体的转换和词库的合并.6。中英文同义词追加/同义词匹配 + 中文词条拼音追加.词库整合了《现代汉语词典》和cc-cedict辞典中的词条,并且依据cc-cedict词典为词条标上了拼音,依据《中华同义词词典》为词条标上了同义词(尚未完成)。更改jcseg.properties配置文档可以在分词的时候加入拼音和同义词到分词结果中。7。中文数字和中文分数识别,例如:"一百五十个人都来了,四十分之一的人。"中的"一百五十"和"四十分之一"。并且jcseg

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • 此代码是被用于数学仿真大师的MAPLE软件上的。在MAPLE软件上运行此代码后,可清晰的看到傅立叶变换与贝舌尔变换的关系
    此代码是被用于数学仿真大师的MAPLE软件上的。在MAPLE软件上运行此代码后,可清晰的看到傅立叶变换与贝舌尔变换的关系-This code is being used for mathematical simulation of the master of the MAPLE software. In the MAPLE software to run this code, can clearly see the Fourier transform of the tongue and Pui transform the relationship between Seoul
    2022-07-24 04:10:20下载
    积分:1
  • 经典(弦截二分牛顿迭代龙贝格)
    计算方法经典算法(弦截法二分法牛顿迭代法龙贝格算法)-classic calculation algorithm (xianjie Act dichotomy Newton Romberg algorithm)
    2022-04-07 16:00:07下载
    积分:1
  • 约瑟夫环,运用了数据结构中的链结构。具体请详细观察源程序...
    约瑟夫环,运用了数据结构中的链结构。具体请详细观察源程序-Joseph Wan, the use of the data structure in the chain structure. Please observe the specific source code
    2022-03-09 12:41:47下载
    积分:1
  • 车辆路径问题
    带时间窗的车辆路径问题(Vehicle Routing Problem with Time Windows, VRPTW)是对物流配送管理的核心问题——配送车辆调度 的问题抽象,其是在基本VRP基础上添加了时间窗约束衍生而来的, 可以将VRPTW描述为:使车辆从站点出发服务用户,完成用户需求 后仍返回站点,规定每个用户只能被一辆车服务且仅服务一次,且对 用户的服务必须在用户事先指定的时间窗内进行,问题的优化目标是 如何选择适当的路径,使得在满足以上约束条件的情况下,完成全部 请点击左侧文件开始预览 !预览只提供20%的代码片段,完整代码需下载后查看 加载中 侵权举报
    2022-07-12 21:40:20下载
    积分:1
  • MMSE 信道估计分析均衡 ofdm 信道容量分析
    这是真正好的代码的 MMSE 信道估计你可以享受的 ofdm 信道容量分析,这是比别人更好的信道估计技术
    2023-08-15 04:00:03下载
    积分:1
  • PL
    PL
    2022-06-03 08:23:47下载
    积分:1
  • BMP Binare 代码,16 系统
    #include < stdlib.h > #include < stdio.h > int (主要) { //ЭТО БУДЕТ ИМЯ ИСХОДНОГО ФАЙЛА char ima_faila [256] ; //БУФЕРНАЯ ПЕРЕМЕННАЯ int 布费尔 ; char prodolzhit_ili_net = "y"; int; chotchik 文件 * f; 请点击左侧文件开始预览 !预览只提供20%的代码片段,完整代码需下载后查看 加载中 侵权举报
    2023-06-14 04:00:04下载
    积分:1
  • 矩阵乘源代码
    矩阵相乘问题的算法源程序-matrix multiplication, the algorithm source code
    2022-04-15 20:53:47下载
    积分:1
  • 图片tiff计倾斜角度
    图片tiff计算倾斜角度, 图片, vb, 纠偏, skew, deskew, 对图片进行纠偏,倾斜 ,使用VB语言编写
    2022-01-28 18:57:35下载
    积分:1
  • 第33届ACM亚洲区域赛(哈尔滨赛区预选)1002题目源码
    第33届ACM亚洲区域赛(哈尔滨赛区预选)1002题目源码-The 33rd ACM Asia regional tournament (Harbin赛区preselection) 1002 Title Source
    2022-03-23 15:56:39下载
    积分:1
  • 696518资源总数
  • 105964会员总数
  • 17今日下载