登录
首页 » 算法 » jsceg分词器源码

jsceg分词器源码

于 2022-03-07 发布 文件大小:17.41 MB
0 108
下载积分: 2 下载次数: 1

代码说明:

jcseg是使用Java开发的一个开源中文分词器,使用流行的mmseg算法实现,并且提供了最高版本的lucene, solr, elasticsearch(New)的分词接口.1。目前最高版本:jcseg-1.9.5。兼容最高版本lucene-4.x,solr-4.x,elasticsearch2。三种切分模式: (1).简易模式:FMM算法,适合速度要求场合。 (2).复杂模式-MMSEG四种过滤算法,具有较高的岐义去除,分词准确率达到了98.41%。 (3).(!New)检测模式:只返回词库中已有的词条,很适合某些应用场合。(1.9.4版本开始)3。支持自定义词库。在lexicon文件夹下,可以随便添加/删除/更改词库和词库内容,并且对词库进行了分类。参考下面了解如何给jcseg添加词库/新词。4。(!New) 支持词库多目录加载. 配置lexicon.path中使用";"隔开多个词库目录.5。(!New)词库分为简体/繁体/简繁体混合词库: 可以专门适用于简体切分, 繁体切分, 简繁体混合切分, 并且可以利用下面提到的同义词实现,简繁体的相互检索,  jcseg同时提供了词库两个简单的词库管理工具来进行简繁体的转换和词库的合并.6。中英文同义词追加/同义词匹配 + 中文词条拼音追加.词库整合了《现代汉语词典》和cc-cedict辞典中的词条,并且依据cc-cedict词典为词条标上了拼音,依据《中华同义词词典》为词条标上了同义词(尚未完成)。更改jcseg.properties配置文档可以在分词的时候加入拼音和同义词到分词结果中。7。中文数字和中文分数识别,例如:"一百五十个人都来了,四十分之一的人。"中的"一百五十"和"四十分之一"。并且jcseg

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论


0 个回复

  • k-均值 python
    均值比率 试图生成速度快、 内存效率的 K-均值程序。 安装 gem来源-http://rubygems.org sudo gem安装 k_means 如何使用 需要 "rubygems" 要求 "k_means" 数据 = [[1,1]、 [1,2],[1,1],[1000年、 1000年],[500、 500]] kmeans = KMeans.new (数据,: 质心 = > 2) kmeans.inspect # 使用 kmeans.view 拿到未检查数组 = > [[3,4],[0,1,2]] 自定义的质心 需要 "rubygems" 要求 "k_means" # 您自定义的质心需要有 #position 和 #reposition 的方法 类 CustomCentroid attr_acces
    2022-04-28 00:29:05下载
    积分:1
  • K均值聚类源代码
    K均值聚类算法源代码-K-means clustering algorithm source code
    2022-05-05 12:42:14下载
    积分:1
  • 测试高 led 和低led
    这个软件描述C语言用 16f877 触发一个LED,与所有配置的计时器和寄存器。
    2022-11-14 10:40:03下载
    积分:1
  • 包含几乎所有的排序
    包含几乎所有的排序算法-contains almost all the Sort Algorithm
    2022-06-20 03:57:25下载
    积分:1
  • 电脑游戏的网格路径规划
    人工智能技术变得越来越重要的计算机游戏、 自主路径规划和搜索算法在网格上。 通过在战略游戏中,如横扫千军,Pacman 地形移动。网格的阻止和取消阻止细胞通常用于表示地形。
    2023-08-21 13:15:03下载
    积分:1
  • 演示cvhmm
    面对 演示;识别方法
    2022-03-22 22:12:43下载
    积分:1
  • 光流运动检测源程序
    应用光流法对目标进行检测和估计。亲测好用,效果很不错
    2022-09-06 17:00:03下载
    积分:1
  • 自主访问控制
       创建一个主体(客体)就把创建主体(客体)的一个结构加入到主体(客体)链表中去,然后和客体关联起来,一个可以对应一主体并创建一个用户对客体的一个权限结构,使得用户对客体的权限关联起来关联起来,由于设计时候有一个小疏忽,这里的客体并不是主体自己创建的,而是由管理员创建的,所以必须为客体定义其拥有者,点击客体授权进入到客体拥有者授予界面,如下。通关选中客体与主体,点击授予就可以为客体分配其拥有者,然后回到主界面刷新一下,就可以发现授权链表内容被修改了,然后我们通过登陆界面进入到用户专属的授权表,如登录是s1我们可以看到如下界面,左边的权限表是s1所有的权限,然后我们选中一个权限(其中拥有权不能授予,不然会报错)再点击主体,授予,就可以把权限授予到点击的主体,刷新一下授权表就可以查看已经授予的权限 请点击左侧文件开始预览 !预览只提供20%的代码片段,完整代码需下载后查看 加载中 侵权举报
    2022-05-01 01:39:53下载
    积分:1
  • 比较BP,OMP,StOMP对于lena图像的CS效果
    对于同一副256*256的lena图像进行压缩感知,对比的算法是BP,OMP以及StOMP(FDR),评价指标有:运算时间,压缩比率以及峰值信噪比
    2022-04-10 19:58:26下载
    积分:1
  • 仿生模式识别 目标跟踪
    用仿生模式识别来训练目标,在视频序列中跟踪目标 function [sausage, num] = hypersausage_construct(P) %按照样本给定的顺序去求解超香肠神经元 [~, W] = size(P);%W是训练样例的个数 sausage = []; for i = 2:W     temp = power_two(P(:, i - 1), P(:, i));%构建第i-1个神经元  //temp是一个行向量     %temp = power_three(P(:, i - 2), P(:, i-1),P(:,i));     sausage = [sausage temp]; end sausage = [sausage P(:, end)]; num = (size(sausage, 2) - 1) / (W - 1);
    2023-08-13 14:40:03下载
    积分:1
  • 696518资源总数
  • 105117会员总数
  • 11今日下载