登录
首页 » 算法 » jsceg分词器源码

jsceg分词器源码

于 2022-03-07 发布 文件大小:17.41 MB
0 185
下载积分: 2 下载次数: 1

代码说明:

jcseg是使用Java开发的一个开源中文分词器,使用流行的mmseg算法实现,并且提供了最高版本的lucene, solr, elasticsearch(New)的分词接口.1。目前最高版本:jcseg-1.9.5。兼容最高版本lucene-4.x,solr-4.x,elasticsearch2。三种切分模式: (1).简易模式:FMM算法,适合速度要求场合。 (2).复杂模式-MMSEG四种过滤算法,具有较高的岐义去除,分词准确率达到了98.41%。 (3).(!New)检测模式:只返回词库中已有的词条,很适合某些应用场合。(1.9.4版本开始)3。支持自定义词库。在lexicon文件夹下,可以随便添加/删除/更改词库和词库内容,并且对词库进行了分类。参考下面了解如何给jcseg添加词库/新词。4。(!New) 支持词库多目录加载. 配置lexicon.path中使用";"隔开多个词库目录.5。(!New)词库分为简体/繁体/简繁体混合词库: 可以专门适用于简体切分, 繁体切分, 简繁体混合切分, 并且可以利用下面提到的同义词实现,简繁体的相互检索,  jcseg同时提供了词库两个简单的词库管理工具来进行简繁体的转换和词库的合并.6。中英文同义词追加/同义词匹配 + 中文词条拼音追加.词库整合了《现代汉语词典》和cc-cedict辞典中的词条,并且依据cc-cedict词典为词条标上了拼音,依据《中华同义词词典》为词条标上了同义词(尚未完成)。更改jcseg.properties配置文档可以在分词的时候加入拼音和同义词到分词结果中。7。中文数字和中文分数识别,例如:"一百五十个人都来了,四十分之一的人。"中的"一百五十"和"四十分之一"。并且jcseg

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • 该程序包括了一个应用最为广的离散傅里叶变换,褶积,抽样最小相位。绝对能运行...
    该程序包括了一个应用最为广的离散傅里叶变换,褶积,抽样最小相位。绝对能运行-The program includes an application of the most widely used discrete Fourier transform, convolution, sampling minimum phase. They can certainly run
    2022-01-31 03:24:48下载
    积分:1
  • 指派问题的匈牙利(matlab语言)
    指派问题的匈牙利算法(matlab语言)-assignment of the Hungarian algorithm (Matlab language)
    2022-04-23 09:11:20下载
    积分:1
  • 相关的语音处理,适合于现代数字信号处理的课程设计,,,并且可以运行...
    相关的语音处理,适合于现代数字信号处理的课程设计,,,并且可以运行-related to the speech processing, which is suitable for modern digital signal processing design of, and can run
    2023-02-26 01:55:03下载
    积分:1
  • 基于430的(FFT)快速傅里叶变换
    应用背景而今,我们身处于一个模拟世界,数字时代,对于外界的模拟信号,我们要用数字的方式分析处理。首先通过ad采样,然后做处理,那么(FFT)快速傅里叶变换是一个将信号由时域转换到频域分析的技术,所以了解FFT,运用FFT,尤其是在嵌入式单片机的速度逐渐提升,它的用处越来越广。关键技术本程序,是基于430f5529的程序,首先本人保证该程序可以运行。需要者可根据自身需要进行移植,该代码重要文件以.c形式存储,方便移植。对于内容,该程序用ad采集信号,对信号的主要频率成分的频率值,交流幅值进行了计算,直流分量幅度,交流相位等,进行了计算。所以值得参考。
    2023-07-04 18:45:04下载
    积分:1
  • Taflove 的FDTD的经典书籍,非常值得期待的FDTD教程。相信大家喜欢...
    Taflove 的FDTD算法的经典书籍,非常值得期待的FDTD教程。相信大家喜欢-Taflove the FDTD algorithm is the classic book, well worth looking forward to the FDTD tutorial. I believe that everyone likes
    2022-12-21 15:10:03下载
    积分:1
  • 支持向量机的分类——基于乳腺组织电阻抗特性的乳腺癌诊断
    应用背景 支持向量机(Support Vector Machine,SVM)是一种新的机器学习方法,其基础是Vapnik创建的统计学习理论(Statiscal Learning Theory,STL)。统计学习理论采用结构风险最小化(Structural Risk Minimization,SRM)准则,在最小化样本点误差的同时,最小化结构风险,提高了模型的泛化能力,且没有数据维数的限制。在进行线性分类时,将分类面取在离两类样本距离较大的地方;进行非线性分类时通过高维空间变换,将非线性分类变成高维空间的线性分类问题。 关键技术 本章将详细介绍支持向量机的分类原理,并将其应用于基于乳腺组织电阻抗频谱特性的乳腺癌诊断。 乳腺是女性身体的重要器官,乳腺疾病类别繁多、病因复杂,其中,乳腺癌是乳腺疾病的一种,逐渐成为危害女性健康的主要恶性肿瘤之一。近年来,乳腺癌等乳腺疾病发病率呈明显上升趋势,被医学界称为“女性健康第一杀手” 。 相关研究结果表明,在直流状态下不同生物组织表现出不同的电阻特性,生物组织电阻抗随着外加电信号频率的不同而表现出较大的差异。常见的电阻抗测量方法有:电阻抗频谱法(Impedance Spectroscopy)、阻抗扫描成像法(Electrical Impedance Scanning,EIS)、电阻抗断层成像法(Electrical Impedance Tomography,EIT)等。电阻抗频谱法的测量依据是生物组织的电阻抗随着外加电信号频率的不同而呈现出较大的差异;阻抗扫描成像法的原理是癌变组织与正常组织及良性肿瘤组织的电导(阻)率相比,存在着显著性的差异,从而使得均匀分布在组织外的外加电流或电压场产生畸变;电阻抗断层成像法则利用设于体表外周的电极阵列及微弱测量电流,提取相关特征并重新构造出截面的电阻抗特性图像。 尽管目前的电阻抗测量结果还存在一些偏差,但相关研究已经证实癌变组织与正常组织的电阻抗特性存在显著地差异。因此,乳腺组织的电阻抗特征可以应用于乳腺癌的检查与诊断中。由于电阻抗测量法具有无创、廉价、操作
    2022-02-01 14:48:16下载
    积分:1
  • The section of least squares procedures, very good, and hope that we share
    最小二乘法的一段程序,很好用,希望大家共享-The section of least squares procedures, very good, and hope that we share
    2022-12-26 20:45:02下载
    积分:1
  • 基于神经网络的遗传优化垃圾邮箱分类实验
    是数据挖掘实验课上的一个作业,垃圾邮箱分类,给了57个属性1个分类目标,0是垃圾邮箱1不是,给了训练集和测试集,用的C++写的神经网络,并用遗传算法优化了,正确率96.5%,但是时间较长
    2022-07-01 21:00:49下载
    积分:1
  • Cualquier mierda
    Codasdasdasdasssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssssss
    2023-01-16 14:30:04下载
    积分:1
  • 动态规则解数字三角问题给定一个由n行数字组成的数字三角形如下图所示。试设计一个,计出从三角形的顶至底的一条路径,使该路径经过的数字总和最大。...
    动态规则解数字三角问题给定一个由n行数字组成的数字三角形如下图所示。试设计一个算法,计算出从三角形的顶至底的一条路径,使该路径经过的数字总和最大。-Digital triangle Issue Description : given an OK by the number n of triangular figures shown in the diagram below. Design of a test algorithm, calculated from the top of the triangle to the end of a path, the path through the largest sum of the figures.
    2022-12-23 12:15:03下载
    积分:1
  • 696516资源总数
  • 106432会员总数
  • 11今日下载