登录
首页 » 数据挖掘 » 文本分类(采用Java语言)

文本分类(采用Java语言)

于 2022-02-13 发布 文件大小:10.96 MB
0 153
下载积分: 2 下载次数: 1

代码说明:

资源描述利用分类算法实现对文本的数据挖掘,主要包括: 1. 语料库的构建,主要包括利用爬虫收集Web文档等; 2. 语料库的数据预处理,包括文档建模,如去噪,分词,建立数据字典, 使用词袋模型或主题模型表达文档等; 注:使用主题模型,如LDA可以获得实验加分; 3. 选择分类算法(如朴素贝叶斯、SVM等),训练文本分类器,理解所选 的分类算法的建模原理、实现过程和相关参数的含义; 4. 对测试集的文本进行分类 5. 对测试集的分类结果利用正确率和召回率进行分析评价。 

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • 算法
    包含很多知名算法实现,支持向量机,决策树,粗糙集,贝叶斯分类器等,适合学术研究,短评论意见挖掘,文本分类等。
    2022-06-03 05:40:28下载
    积分:1
  • Ecalt算法
    Eclat算法是一种深度优先算法,采用垂直数据表示形式,在概念格理论的基础上利用基于前缀的等价关系将搜索空间(概念格)划分为较小的子空间(子概念格)。Eclat算法采用方法二计算支持度。对候选k项集进行支持度计算时,不需再次扫描数据库,仅在一次扫描数据库后得到每个1项集的支持度,而候选k项集的支持度就是在对k-1项集进行交集操作后得到的该k项集Tidset中元素的个数。本算法利用diffset数据格式实现。
    2022-03-02 17:06:13下载
    积分:1
  • k-means java实现 Iris四大
    通过优化的k-means算法 采用了密度和优化评测函数实现了对Iris等数据集的聚类。 
    2022-03-18 06:28:52下载
    积分:1
  • 关于大的相关论文
    关于大数据的论文,对稀疏表示分类有很大的帮助,希望对初学者哟帮助
    2022-02-06 00:21:30下载
    积分:1
  • 高效用项集算法--HMINE算法
    数据挖掘算法,高效用项集挖掘算法,加权频发项集挖掘算法,HMINE算法,源码中有详细注释
    2022-02-04 07:22:38下载
    积分:1
  • Java实现Apriori算法
    Java实现Apriori数据挖掘算法,包内还有实例用的数据库 Apriori数据挖掘算法:先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小可信度。然后使用第1步找到的频集产生期望的规则,产生只包含集合的项的所有规则,其中每一条规则的右部只有一项,这里采用的是中规则的定义。一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。为了生成所有频集,使用了递归的方法。 请在jbuilder下编译 配好JDBC驱动 商品如果 买的表示为大写 没买表示为小写的 具体看GetSource.java
    2022-10-02 14:05:03下载
    积分:1
  • 朴素贝叶斯分类
    朴素贝叶斯分类的分类器实现,使用的是matlab语言。内含测试集和训练集,可直接运行,readme.txt文件中说明了数据格式
    2022-02-07 02:48:39下载
    积分:1
  • 文本分类(采用Java语言)
    资源描述利用分类算法实现对文本的数据挖掘,主要包括: 1. 语料库的构建,主要包括利用爬虫收集Web文档等; 2. 语料库的数据预处理,包括文档建模,如去噪,分词,建立数据字典, 使用词袋模型或主题模型表达文档等; 注:使用主题模型,如LDA可以获得实验加分; 3. 选择分类算法(如朴素贝叶斯、SVM等),训练文本分类器,理解所选 的分类算法的建模原理、实现过程和相关参数的含义; 4. 对测试集的文本进行分类 5. 对测试集的分类结果利用正确率和召回率进行分析评价。 
    2022-02-13 04:15:07下载
    积分:1
  • weka源代码
    weka是一个很优秀的数据挖掘软件,可以把weka作为程序包打入工程中,基本想要的功能很快就能实现
    2023-06-01 10:00:04下载
    积分:1
  • 频繁子图算法pafi1.0.1.zip
    频繁子图挖掘算法pafi1.0.1.zip,频繁子图挖掘算法采用c++实现,图数据挖掘方向的可以看一看。
    2022-01-21 02:32:05下载
    积分:1
  • 696524资源总数
  • 103913会员总数
  • 34今日下载