-
jsceg分词器源码
jcseg是使用Java开发的一个开源中文分词器,使用流行的mmseg算法实现,并且提供了最高版本的lucene, solr, elasticsearch(New)的分词接口.1。目前最高版本:jcseg-1.9.5。兼容最高版本lucene-4.x,solr-4.x,elasticsearch2。三种切分模式: (1).简易模式:FMM算法,适合速度要求场合。 (2).复杂模式-MMSEG四种过滤算法,具有较高的岐义去除,分词准确率达到了98.41%。 (3).(!New)检测模式:只返回词库中已有的词条,很适合某些应用场合。(1.9.4版本开始)3。支持自定义词库。在lexicon文件夹下,可以随便添加/删除/更改词库和词库内容,并且对词库进行了分类。参考下面了解如何给jcseg添加词库/新词。4。(!New) 支持词库多目录加载. 配置lexicon.path中使用";"隔开多个词库目录.5。(!New)词库分为简体/繁体/简繁体混合词库: 可以专门适用于简体切分, 繁体切分, 简繁体混合切分, 并且可以利用下面提到的同义词实现,简繁体的相互检索, jcseg同时提供了词库两个简单的词库管理工具来进行简繁体的转换和词库的合并.6。中英文同义词追加/同义词匹配 + 中文词条拼音追加.词库整合了《现代汉语词典》和cc-cedict辞典中的词条,并且依据cc-cedict词典为词条标上了拼音,依据《中华同义词词典》为词条标上了同义词(尚未完成)。更改jcseg.properties配置文档可以在分词的时候加入拼音和同义词到分词结果中。7。中文数字和中文分数识别,例如:"一百五十个人都来了,四十分之一的人。"中的"一百五十"和"四十分之一"。并且jcseg
- 2022-03-07 04:18:17下载
- 积分:1
-
埃尔米特
埃尔米特-高斯求积法的c源程序-Hermite- Gaussian quadrature law c source
- 2023-01-24 04:20:04下载
- 积分:1
-
物联网技术进展与应用
资源描述摘要:对物联网的研究和应用进展进行综述分析。首先介绍了物联网的起源、国内外物联网的研究和应用现状。
然后详细讨论了物联网的定义、物联网的体系结构、物联网的异构融合网络层、物联网的感知节点与终端、泛在传
感网、物联网的业务支撑与智能处理技术、物联网的业务平台技术、物联网安全和物联网标准等关键技术。最后提
出了物联网研究的关键技术和主要内容。
关键词:物联网;传感网;泛在网;RFID
- 2022-02-04 06:14:49下载
- 积分:1
-
本论文介绍了一种新的校正铂电阻传感器非线性的数学方法.
本论文介绍了一种新的校正铂电阻传感器非线性的数学方法.-This paper introduce a new calibration of platinum resistance sensor non-linear mathematical method.
- 2022-12-18 19:45:03下载
- 积分:1
-
凸包的快速实现
Quick hull implementation
- 2022-12-06 08:30:03下载
- 积分:1
-
Pouring steel timing planning algorithm, a detailed procedure for the Notes, in...
炼钢浇注的时序规划算法,有详细的程序注释,希望对大家有用-Pouring steel timing planning algorithm, a detailed procedure for the Notes, in the hope that useful to everybody
- 2022-10-13 06:15:03下载
- 积分:1
-
遗传算法来训练神经网络的权值
需要一个文本文件作为输入包含 x 和 y 坐标的一系列的曲线上的点。该代码然后使用遗传算法训练神经网络来逼近同一条曲线。运行从 python 命令行 ;示例输入的命令会看起来像: python nn_weights_1.py-r 10-n 100 g 500-t 3600.0-RandomCrossOver-s random_seeds_100.txt-i sine_datapoints1.txt-o results.txt nn_weights_1.py 在哪里的代码文件中,名称-r 告诉它多少运行来执行,-n 告诉它在人口中的多少人-g 告诉它多少代人,在每个运行,-t 告诉它的最长时间 (以秒为单位) 运行,— — 告诉它要使用 (随机、 HillClimber、 RandomCrossOver、 SmallCrossOver、 SmartCrossOver) 的算法,-s 告诉它什么文件用于随机种子 (可选),我告诉它什么数据文件用作输入和-o 告诉它要将输出发送到什么文件。
- 2022-03-30 01:50:57下载
- 积分:1
-
运筹学中的贝叶斯决策方法,c++代码,可以运行
运筹学中的贝叶斯决策方法,c++代码,可以运行-Operations research in the Bayesian decision-making methods, c++ Code can run
- 2022-10-05 03:10:03下载
- 积分:1
-
双色、三色河内塔
无论是双色河内塔或是三色河内塔,其解法观念与之前介绍过的河内塔是类似的,同样也是使用递回来解
- 2022-03-23 16:29:55下载
- 积分:1
-
I have written eight issues of a variety of Queen' s random algorithm: includ...
自己编写的八皇后问题的各种随机算法:包括了随机算法,回溯法,随机+回溯求解八皇后-I have written eight issues of a variety of Queen" s random algorithm: including a random algorithm, backtracking random+ back to solve the eight Queen" s
- 2023-08-24 07:15:03下载
- 积分:1