-
Natural Language processing with python
说明: python自然语言处理的中文翻译
作者: StevenBird, EwanKlein & EdwardLoper
英文出版社:O'REILLY
翻译:陈涛
提供了非常易学的自然语言处理入门介绍,该领域涵盖从文本和电子邮件预测过滤,到自动总结和翻译等多种语言处理技术。在此书中,你将学会编写Python程序处理大量非结构化文本。你还将通过使用综合语言数据结构访问含有丰富注释的数据集,理解用于分析书面通信内容和结构的主要算法。
《Python自然语言处理》准备了充足的示例和练习,可以帮助你:
从非结构化文本中抽取信息,甚至猜测主题或识别“命名实体”;
分析文本语言结构,包括解析和语义分析;
访问流行的语言学数据库,包括WordNet和树库(treebank);
从多种语言学和人工智能领域中提取的整合技巧。(Natural Language processing with python)
- 2018-01-12 17:52:46下载
- 积分:1
-
201411149222244
随便下载一篇中文的文本文档,通过这个程序可以将文档进行分词处理,还能够统计词语出现的次数(To download a Chinese text documents, through this program can be word processing document, will also be able to statistics the number of occurrences of words and phrases)
- 2015-10-23 10:53:54下载
- 积分:1
-
rub
ruby script for internal DSL requirement..
- 2009-06-25 02:24:57下载
- 积分:1
-
wordsegmentation
一种基于自动机的分词方法,可进行中文分词及统计(Based method of automatic machine word)
- 2011-09-21 11:38:57下载
- 积分:1
-
HMM
说明: HMM中文分词,基于隐马尔科夫模型 。需要进行训练后试验(Word Segmentation Based on Hidden Markov Model)
- 2019-04-07 11:58:08下载
- 积分:1
-
ICTCLASCaller
说明: ICTCLAS的JNI调用接口文件:
Title:ICTCLAS Caller
* <p>Description:do chinese word segmentation.don t change the pakage and CLASS name, orelse you can t use it.
* 请不要改变包名、类名以及native的方法名,否则调用将失效。
* 由于ICTCLAS本身存在很多鲁棒性问题,调用segSentence时,string参数请保证不要过长或带有乱码。调用次数过多(如处理几十G的数据)会有可能造成内存溢出。
* 故基本只能用于较小规模数据(相对几十G来说)。
* 请运行时设置jvm足够的堆栈空间。(ICTCLAS calling the JNI interface documentation : Title : Caller* ICTCLAS)
- 2006-03-03 18:46:02下载
- 积分:1
-
Reader
在中文分词之前,要对文档进行读取,本代码是实现了从磁盘读取的任务。(In the Chinese word prior to reading the document, the code is read from the disk to achieve the task.)
- 2013-09-10 11:09:28下载
- 积分:1
-
icajade
ICA分解的优化算法——JADE法 - Dinga s Blog(ICA decomposition of the optimization algorithm- JADE Act- Dinga s Blog)
- 2008-03-26 12:55:52下载
- 积分:1
-
lucene
java中lucene的源代码,用于文本分类的一个很好的工具,是由一个著名的语言研究者编写的(lucene code for java)
- 2009-03-30 17:28:22下载
- 积分:1
-
HanLP-master
NamedEntityRecognition github
- 2018-01-31 01:47:04下载
- 积分:1