-
hanziinput
实现按照拼音输入汉字;
功能详尽,有使用例程;
(Realized in accordance with the Pinyin input Chinese characters
Features detailed, there is the use of routine )
- 2014-09-15 16:04:59下载
- 积分:1
-
rub
ruby script for internal DSL requirement..
- 2009-06-25 02:24:57下载
- 积分:1
-
HMM
说明: HMM中文分词,基于隐马尔科夫模型 。需要进行训练后试验(Word Segmentation Based on Hidden Markov Model)
- 2019-04-07 11:58:08下载
- 积分:1
-
ICTCLASCaller
说明: ICTCLAS的JNI调用接口文件:
Title:ICTCLAS Caller
* <p>Description:do chinese word segmentation.don t change the pakage and CLASS name, orelse you can t use it.
* 请不要改变包名、类名以及native的方法名,否则调用将失效。
* 由于ICTCLAS本身存在很多鲁棒性问题,调用segSentence时,string参数请保证不要过长或带有乱码。调用次数过多(如处理几十G的数据)会有可能造成内存溢出。
* 故基本只能用于较小规模数据(相对几十G来说)。
* 请运行时设置jvm足够的堆栈空间。(ICTCLAS calling the JNI interface documentation : Title : Caller* ICTCLAS)
- 2006-03-03 18:46:02下载
- 积分:1
-
raw
说明: 10个中文分词数据集,用于训练中文分词模型(Ten Chinese Word Segmentation Datasets for Training Chinese Word Segmentation Model)
- 2021-01-06 11:48:53下载
- 积分:1
-
ChineseSegment
根据输入的中文词来进行检索~检索出用户想要的内容(ChineseSegment)
- 2009-09-11 21:39:14下载
- 积分:1
-
raw
10个中文分词数据集,用于训练中文分词模型(Ten Chinese Word Segmentation Datasets for Training Chinese Word Segmentation Model)
- 2021-01-06 11:48:53下载
- 积分:1
-
bp
说明: 针对样本决策库数据量大的问题选用基于粗糙集对提取的样本数据进行离散化(Sample library data for decision-making problem of large sample selection based on rough sets were discrete data extraction)
- 2015-07-04 20:49:43下载
- 积分:1
-
tranditionized
中文简繁转换 GreenBrowser/TheWorld2.0插件(Tranditional Chinese Script Conversion GreenBrowser/TheWorld2.0 Plug-in)
- 2010-02-24 19:20:05下载
- 积分:1
-
Leza
it s a good code for troias project
- 2009-06-04 06:50:59下载
- 积分:1