登录
首页 » Python » 共现矩阵

共现矩阵

于 2020-07-02 发布
0 322
下载积分: 1 下载次数: 0

代码说明:

说明:  将高维数据组转换为二维数据组,方便数据处理工作人员的数据分析,并包含自然语言处理(The multi-dimensional co-occurrence matrix is transformed into two-dimensional array form, and the high-dimensional data group is transformed into two-dimensional data group, which is convenient for data processing staff to analyze data, and includes natural language processing)

文件列表:

共现矩阵\yinyongjuzhenzhuanhua.py, 1249 , 2020-04-23
共现矩阵\zaichuli.py, 327 , 2020-03-26
共现矩阵, 0 , 2020-07-02

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • txtLine
    Vb 读取文本数据,每次一行一行显示,以及对文本字符串的分割。(read text data, each party and his party, and the text string segmentation.)
    2006-11-28 17:04:41下载
    积分:1
  • ICTCLASCaller
    说明:  ICTCLAS的JNI调用接口文件: Title:ICTCLAS Caller * <p>Description:do chinese word segmentation.don t change the pakage and CLASS name, orelse you can t use it. * 请不要改变包名、类名以及native的方法名,否则调用将失效。 * 由于ICTCLAS本身存在很多鲁棒性问题,调用segSentence时,string参数请保证不要过长或带有乱码。调用次数过多(如处理几十G的数据)会有可能造成内存溢出。 * 故基本只能用于较小规模数据(相对几十G来说)。 * 请运行时设置jvm足够的堆栈空间。(ICTCLAS calling the JNI interface documentation : Title : Caller* ICTCLAS)
    2006-03-03 18:46:02下载
    积分:1
  • ictclas
    中科院的分词系统ictclas源码,自由开放的源码,很好(ictclas code)
    2009-11-21 11:05:05下载
    积分:1
  • HanLP-master
    NamedEntityRecognition github
    2018-01-31 01:47:04下载
    积分:1
  • GB2312
    列出gbk2312中的每一个字符,并给出对应的编号(Listed gbk2312 in each character, and gives the corresponding number)
    2012-07-04 16:07:46下载
    积分:1
  • 201411149222244
    随便下载一篇中文的文本文档,通过这个程序可以将文档进行分词处理,还能够统计词语出现的次数(To download a Chinese text documents, through this program can be word processing document, will also be able to statistics the number of occurrences of words and phrases)
    2015-10-23 10:53:54下载
    积分:1
  • ACWPS
    词是最小的能够独立活动的有意义的语言成分。 但汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。(The word is the smallest independent activities meaningful language component. But Chinese is the word as the basic unit of writing, there is no obvious mark of distinction between the words, so Chinese word analysis is the foundation of Chinese information processing and critical.)
    2013-04-03 10:22:22下载
    积分:1
  • m_seq
    此函数用来生成最大长度线性移位寄存器序列(m序列)(This function used to generate the maximum length linear shift register sequence (m sequence))
    2008-05-05 19:37:59下载
    积分:1
  • lucene
    java中lucene的源代码,用于文本分类的一个很好的工具,是由一个著名的语言研究者编写的(lucene code for java)
    2009-03-30 17:28:22下载
    积分:1
  • ChineseSegment
    根据输入的中文词来进行检索~检索出用户想要的内容(ChineseSegment)
    2009-09-11 21:39:14下载
    积分:1
  • 696518资源总数
  • 105901会员总数
  • 40今日下载