登录
首页 » Java » lucene

lucene

于 2009-03-30 发布 文件大小:96KB
0 293
下载积分: 1 下载次数: 20

代码说明:

  java中lucene的源代码,用于文本分类的一个很好的工具,是由一个著名的语言研究者编写的(lucene code for java)

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • hanziinput
    实现按照拼音输入汉字; 功能详尽,有使用例程; (Realized in accordance with the Pinyin input Chinese characters Features detailed, there is the use of routine )
    2014-09-15 16:04:59下载
    积分:1
  • rub
    ruby script for internal DSL requirement..
    2009-06-25 02:24:57下载
    积分:1
  • HMM
    说明:  HMM中文分词,基于隐马尔科夫模型 。需要进行训练后试验(Word Segmentation Based on Hidden Markov Model)
    2019-04-07 11:58:08下载
    积分:1
  • ICTCLASCaller
    说明:  ICTCLAS的JNI调用接口文件: Title:ICTCLAS Caller * <p>Description:do chinese word segmentation.don t change the pakage and CLASS name, orelse you can t use it. * 请不要改变包名、类名以及native的方法名,否则调用将失效。 * 由于ICTCLAS本身存在很多鲁棒性问题,调用segSentence时,string参数请保证不要过长或带有乱码。调用次数过多(如处理几十G的数据)会有可能造成内存溢出。 * 故基本只能用于较小规模数据(相对几十G来说)。 * 请运行时设置jvm足够的堆栈空间。(ICTCLAS calling the JNI interface documentation : Title : Caller* ICTCLAS)
    2006-03-03 18:46:02下载
    积分:1
  • raw
    说明:  10个中文分词数据集,用于训练中文分词模型(Ten Chinese Word Segmentation Datasets for Training Chinese Word Segmentation Model)
    2021-01-06 11:48:53下载
    积分:1
  • ChineseSegment
    根据输入的中文词来进行检索~检索出用户想要的内容(ChineseSegment)
    2009-09-11 21:39:14下载
    积分:1
  • raw
    10个中文分词数据集,用于训练中文分词模型(Ten Chinese Word Segmentation Datasets for Training Chinese Word Segmentation Model)
    2021-01-06 11:48:53下载
    积分:1
  • bp
    说明:  针对样本决策库数据量大的问题选用基于粗糙集对提取的样本数据进行离散化(Sample library data for decision-making problem of large sample selection based on rough sets were discrete data extraction)
    2015-07-04 20:49:43下载
    积分:1
  • tranditionized
    中文简繁转换 GreenBrowser/TheWorld2.0插件(Tranditional Chinese Script Conversion GreenBrowser/TheWorld2.0 Plug-in)
    2010-02-24 19:20:05下载
    积分:1
  • Leza
    it s a good code for troias project
    2009-06-04 06:50:59下载
    积分:1
  • 696518资源总数
  • 105958会员总数
  • 18今日下载