登录
首页 » 算法 » jsceg分词器源码

jsceg分词器源码

于 2022-03-07 发布 文件大小:17.41 MB
0 116
下载积分: 2 下载次数: 1

代码说明:

jcseg是使用Java开发的一个开源中文分词器,使用流行的mmseg算法实现,并且提供了最高版本的lucene, solr, elasticsearch(New)的分词接口.1。目前最高版本:jcseg-1.9.5。兼容最高版本lucene-4.x,solr-4.x,elasticsearch2。三种切分模式: (1).简易模式:FMM算法,适合速度要求场合。 (2).复杂模式-MMSEG四种过滤算法,具有较高的岐义去除,分词准确率达到了98.41%。 (3).(!New)检测模式:只返回词库中已有的词条,很适合某些应用场合。(1.9.4版本开始)3。支持自定义词库。在lexicon文件夹下,可以随便添加/删除/更改词库和词库内容,并且对词库进行了分类。参考下面了解如何给jcseg添加词库/新词。4。(!New) 支持词库多目录加载. 配置lexicon.path中使用";"隔开多个词库目录.5。(!New)词库分为简体/繁体/简繁体混合词库: 可以专门适用于简体切分, 繁体切分, 简繁体混合切分, 并且可以利用下面提到的同义词实现,简繁体的相互检索,  jcseg同时提供了词库两个简单的词库管理工具来进行简繁体的转换和词库的合并.6。中英文同义词追加/同义词匹配 + 中文词条拼音追加.词库整合了《现代汉语词典》和cc-cedict辞典中的词条,并且依据cc-cedict词典为词条标上了拼音,依据《中华同义词词典》为词条标上了同义词(尚未完成)。更改jcseg.properties配置文档可以在分词的时候加入拼音和同义词到分词结果中。7。中文数字和中文分数识别,例如:"一百五十个人都来了,四十分之一的人。"中的"一百五十"和"四十分之一"。并且jcseg

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论


0 个回复

  • 本程序采用循环单链表的来解决约瑟夫环问题:建立一个循环单链表,按顺序查找指定结点,找到后删除,最后打印删除的编号序列。
    本程序采用循环单链表的算法来解决约瑟夫环问题:建立一个循环单链表,按顺序查找指定结点,找到后删除,最后打印删除的编号序列。- This procedure uses circulates Shan Lianbiao algorithm to solve the Joseph link problem: Establishes to circulate Shan Lianbiao, assigns the point according to the smooth search, after found deletes, finally prints the serial number sequence which deletes.
    2022-05-30 07:29:42下载
    积分:1
  • 陀螺的仿真模型可以修改窗口的参数,是E。
    陀螺进动仿真模型,可以修改窗口参数,使用起来很方便。-gyroscope precession simulation model can modify parameters of the window, was easy to use.
    2023-03-03 20:55:04下载
    积分:1
  • subpixel motion architecture
    subpixel motion architecture
    2022-06-11 20:47:05下载
    积分:1
  • 简单二叉树的连表
    简单二叉树的连表算法-even simple binary tree algorithm Table
    2022-01-24 13:44:58下载
    积分:1
  • nec moment program by fortran
    nec moment program by fortran
    2022-10-23 07:50:04下载
    积分:1
  • 新手数码管右→左依次显数循环
    数码管仿真实验 动态刷新法   右到左  依次显示12345678  并做无限循环处理
    2022-01-31 10:14:50下载
    积分:1
  • 背包C#实现
    这是一个利用C#语言编程实现的背包问题,运用了窗体,实现了求解最优值求解,装入包中的物品编号显示和最后装入包中的物品的比例
    2022-04-07 21:03:51下载
    积分:1
  • 这是我编的利用傅多项式插值计的程序。
    这是我编的利用傅多项式插值计算法的程序。-This is for my use of polynomial interpolation method Fu procedures.
    2022-04-11 03:36:29下载
    积分:1
  • 超分辨率图像分块
    资源描述人脸超分辨率图像分块算法人脸超分辨率图像分块算法人脸超分辨率图像分块算法人脸超分辨率图像分块算法人脸超分辨率图像分块算法人脸超分辨率图像分块算法人脸超分辨率图像分块算法人脸超分辨率图像分块算法
    2022-03-13 19:17:37下载
    积分:1
  • 密码子模型
    在最近一份文件 ("多尺度表示和匹配的曲线密码子",Paul 松香、 CVGIP: 图形化的模型和图像处理,Vol 55页 286 310,1993年) 描述了如何分割并由曲线其中包括密码由霍夫曼和理查兹加上定义的一组标签更多的处理开放曲线、 直线节等。为了克服即在其"自然"的尺度-平滑曲线噪声问题那些描述曲线的一些定性的独特结构。在不同尺度的密码子相连,形成一个层次结构 ("子树")。图则的曲线然后匹配子模型,通过搜索密码子树。自便利匹配的密码子标签都附有各种形状的措施(如压实度,斜)。
    2023-08-05 08:20:03下载
    积分:1
  • 696518资源总数
  • 105306会员总数
  • 25今日下载