-
基于Hadoop的文本分类(1)-文本预处理&文本表示
资源描述一、环境环境:Ubuntu14、Hadoop2.6,Eclipse、NLPIR/ICTCLAS2015等;
二、算法简介:
1、此项目是基于Hadoop2.6进行MapReduce并行开发;
2、此项目是文本分类的文本预处理和文本表示部分,包括分词,去停用词,特征选择和文本表示等(分类算法采用的是随机森林算法,暂时未开放,读者可自行采用Mahout或Weka进行验证);
3、分词采用的是NLPIR/ICTCLAS2015;文本表示采用的是VSM模型,权重计算采用TFIDF进行文本表示;特征选择采用CHI算法(卡方统计);
4、关于并行分词环境搭建,可参考我的博客http://www.cnblogs.com/merru/p/4917665.html
5、关于Hadoop环境搭建,可参考我的博客http://www.cnblogs.com/merru/p/4901528.html和http://www.cnblogs.com/merru/p/4905118.html。
- 2022-03-01 12:43:10下载
- 积分:1
-
I2C driver
I2C总线驱动,8位单片机适用。
在总线控制,并下发指令是,效率好,另外,此程序在keil编译器中已经编译通过。
- 2022-01-31 04:15:49下载
- 积分:1
-
并行程序设计_三角函数并行化程序设计
1) 熟练掌握并行程序设计的基本方法;
2) 通过实验,了解并行程序设计的过程以及优越性;
3) 学会并行程序的算法分析;
4) 结合高等工程数学、分布式系统、云计算等相关课程知识解决简单的实际问题。
- 2022-03-01 04:29:27下载
- 积分:1
-
OpenCl基础构架代码
应用背景密码暴力计算,大型数据计算都会用到,并行计算,本例程为通用openCL并行计算,基于nvidia平台下,例程综合了openCL的常用函数,平台创建、设备选择、内存分配、任务队列、核函数生成,可用本文件代码作为运行基础构架模板。关键技术
OpenCL常用函数构成的技术构架,可以在本代码基础之上适当修改,既可以应用于其他场合,免去繁杂的,重复配置函数的调用,本例程具有自动检测运行平台,运行设备。
- 2023-03-17 03:20:04下载
- 积分:1
-
JAVA多线程折半插入排序的并行计算算法
应用背景并行计算是最近新兴的一门技术,但是关于并行计算的代码在现在还不是特别普遍。本文是关于折半插入排序的并行计算的应用,希望对您的学习有一定的帮助。关键技术并行计算,多线程,折半插入排序,加速比,并行,串行
- 2022-07-09 13:30:02下载
- 积分:1
-
存钱银行
一套相对完整的JSP毕业论文——教学管理系统,用JSP开发与实现动态网站的好范例,描述了J2EE的相关技术,比如Servlet,JSP, 请点击左侧文件开始预览 !预览只提供20%的代码片段,完整代码需下载后查看 加载中 侵权举报
- 2022-01-26 07:00:12下载
- 积分:1
-
数据结构实验
多种算法实现链表的排序,可以更具需要进行适当该表计算哦,是基础了,欢迎同在学习的伙伴一起努力哦~
数据结构实验
- 2022-11-12 13:15:04下载
- 积分:1
-
cuda语言实现向量相加
本程序是cuda语言实现向量相加的例子,通过这个例子可以学习cuda的基本语法格式,
- 2023-07-27 23:25:04下载
- 积分:1
-
implementation of the multiplication of two double matrices by using MATLAB C-Mex and CUBLAS library
本文介绍了一个通过GPU CUDA实现两个双矩阵相乘的MATLAB运算包。
- 2022-07-17 00:43:28下载
- 积分:1
-
数字时钟
它是一个基于8051的频率计数器,可以用作学习工具。很有用的开始。
- 2023-08-27 17:20:03下载
- 积分:1