-
jsceg分词器源码
jcseg是使用Java开发的一个开源中文分词器,使用流行的mmseg算法实现,并且提供了最高版本的lucene, solr, elasticsearch(New)的分词接口.1。目前最高版本:jcseg-1.9.5。兼容最高版本lucene-4.x,solr-4.x,elasticsearch2。三种切分模式: (1).简易模式:FMM算法,适合速度要求场合。 (2).复杂模式-MMSEG四种过滤算法,具有较高的岐义去除,分词准确率达到了98.41%。 (3).(!New)检测模式:只返回词库中已有的词条,很适合某些应用场合。(1.9.4版本开始)3。支持自定义词库。在lexicon文件夹下,可以随便添加/删除/更改词库和词库内容,并且对词库进行了分类。参考下面了解如何给jcseg添加词库/新词。4。(!New) 支持词库多目录加载. 配置lexicon.path中使用";"隔开多个词库目录.5。(!New)词库分为简体/繁体/简繁体混合词库: 可以专门适用于简体切分, 繁体切分, 简繁体混合切分, 并且可以利用下面提到的同义词实现,简繁体的相互检索, jcseg同时提供了词库两个简单的词库管理工具来进行简繁体的转换和词库的合并.6。中英文同义词追加/同义词匹配 + 中文词条拼音追加.词库整合了《现代汉语词典》和cc-cedict辞典中的词条,并且依据cc-cedict词典为词条标上了拼音,依据《中华同义词词典》为词条标上了同义词(尚未完成)。更改jcseg.properties配置文档可以在分词的时候加入拼音和同义词到分词结果中。7。中文数字和中文分数识别,例如:"一百五十个人都来了,四十分之一的人。"中的"一百五十"和"四十分之一"。并且jcseg
- 2022-03-07 04:18:17下载
- 积分:1
-
matrix eigenvalue of the largest power France. For engineering calculation, Matr...
矩阵的最大特征值的幂法.
对于工程计算而言,矩阵的特征值和特征向量都是相当重要和常见的数据,这里给出的幂法是一种常见的求解方法,用的是迭代的思想。
符号说明:
1A为待求的矩阵,
2Uk,Vk为迭代用的列向量。
3最后的最大特征值maxLamda由最后一次的max(Uk)-----求Uk中的绝对值最大的元素的绝对值.所决定。
而maxLamda所对应的特征向量由最后一次迭代的Vk所决定.
主要的想法就是先选一个不为0的初始向量U0!=0,然后按下面的式子迭代。
-matrix eigenvalue of the largest power France. For engineering calculation, Matrix eigenvalues and eigenvectors are very important and common data, here is the power law is a common solution, using the iterative thinking. Symbol : 1A of the question for the matrix, 2Uk, Vk iteration of the column vector. The final three largest eigenvalue maxLamda from last max (uk Hoffmann for the uk the largest absolute value of the absolute value of the element. by decision. While maxLamda corresponding eigenvectors from the last iteration of Vk decision. The main idea was first choice not one of the initial vector 0 U0! = 0, then by the following formula iteration.
- 2022-12-15 11:10:03下载
- 积分:1
-
4级词典构建哈希表
资源描述哈希表的构建,主要使用了ELFHASH进行编码。分别使用了指针哈希和开放地址哈希进行编写。用4级词汇构建,测试样例为4万个输入,可以明显分析其时间差距。大学二年级开学初的作业之一。
- 2022-02-22 11:13:11下载
- 积分:1
-
sofm神经网络的c++程序
神经网络是新技术领域中的一个时尚词汇。很多人听过这个词,但很少人真正明白它是什么。本文的目的是介绍所有关于神经网络的基本包括它的功能、一般结构、相关术语、类型及其应用。
一个真正的神经网络是由数个至数十亿个被称为神经元的细胞(组成我们大脑的微小细胞)所组成,它们以不同方式连接而型成网络。人工神经网络就是尝试模拟这种生物学上的体系结构及其操作。在这里有一个难题:我们对生物学上的神经网络知道的不多!因此,不同类型之间的神经网络体系结构有很大的不同,我们所知道的只是神经元基本的结构。 这是一个SOFM神经网络的c++程序。
- 2022-02-09 11:31:06下载
- 积分:1
-
稀疏矩阵,非线性数据动态分类算法例子
稀疏矩阵,非线性数据动态分类算法例子-Sparse Matrix, nonlinear dynamic data classification algorithm example
- 2022-02-01 22:54:15下载
- 积分:1
-
多维傅里叶变换,二维DFT快速算法,共分五部
多维傅里叶变换,二维DFT快速算法,共分五部--五:三维实序列3D-DFT快速算法-Multi-dimensional Fourier transform, fast algorithm for two-dimensional DFT is divided into 5- 5: Three-dimensional real sequence of 3D-DFT Fast Algorithm
- 2022-05-05 04:47:16下载
- 积分:1
-
数值字符串进制转换
数值字符串进制转换-numerical string band conversion
- 2022-03-17 07:34:33下载
- 积分:1
-
c语言简单算法实例
c语言简单算法实例-c algorithm example, simple language
- 2022-02-16 05:08:08下载
- 积分:1
-
Genetic algorithm c source code, containing the description, but is in English!
遗传算法的c源代码,内含说明,只不过是英文!-Genetic algorithm c source code, containing the description, but is in English!
- 2022-07-08 06:24:04下载
- 积分:1
-
小波变换程序,二维小波变换和一维小波变换源程序。
小波变换程序,二维小波变换和一维小波变换源程序。-wavelet transform procedures, two-dimensional wavelet transform and a peacekeeping source wavelet transform.
- 2022-03-18 03:21:11下载
- 积分:1