-
文本分类
1.用seg进行分词
输入参数一:输入文本语料所在的文件夹路径。 如 文本文件语料都放在 train//text 文件夹下,则参数为:train//text//* 。 注意:必须每篇文章在一个txt文本中。
输入参数二:输入存储分词后的结果文件所在的文件夹路径:如:result//text。注意:不需要加*
本工具采用了中科院的中文分词工具,ICTCLAS,请自行到ICTCLAS官网下载该工具。并把Data文件夹,Configure.xml,ICTCLAS30.h,ICTCLAS30.lib,ICTCLAS30.dll放在和seg.exe同文件夹下面。
2.getFeature获取特征:输入参数格式如上。
其输入语料为seg分词的结果。
注意:请把ICTCLAS30.dll放在于getFeature.ext同一个文件夹下面
3.getSVMTtrain转化成libSVM的格式
输入参数1:输入文本语料所在的文件夹路径。 如 文本文件语料都放在 train//text 文件夹下,则参数为:train//text//* 。其输入的文件为getFeature后得到的结果。
请点击左侧文件开始预览 !预览只提供20%的代码片段,完整代码需下载后查看 加载中 侵权举报
- 2022-05-15 15:25:33下载
- 积分:1
-
蓝牙聊天程序
通过蓝牙进行一对一聊天
- 2022-05-30 17:32:49下载
- 积分:1
-
WebCollector-master
应用背景WebCollector is an open source web crawler framework based on Java.It provides some simple interfaces for crawling the Web,you can setup a multi-threaded web crawler in less than 5 minutes.关键技术WebCollector致力于维护一个稳定、可扩的爬虫内核,源码中集成了Jsoup,可进行精准的网页解析;便于开发者学习并进行开发。内核具有健壮的扩展性,用户可以在此基础上开发自己想要的爬虫。
- 2022-03-04 18:18:47下载
- 积分:1
-
android game
/bj.baidupcs.com/file/27813d809a7398808f443c34a33547e7?xcode=1bcadf62bbca4b149f5958ec4eb4a455961c34c714fb29cb&fid=1980706517-250528-671532214&time=1384678445&sign=FDTAXER-DCb740ccc5511e5e8fedcff06b081203-NioDPRQwdpsWcA0VExRT9UYOsfw%3D&to=bb&fm=N,B,U,e&expires=8h&rt=sh&r=487525554&logid=1017676080&sh=1&vuk=3776941782
- 2022-03-12 08:43:50下载
- 积分:1
-
Java将doc,xls转为html文件
资源描述使用POI实现将doc和xls转化为html文件,支持表格,图片的转换,无乱码,无顺序错乱,无缺失,可转化为Android代码,亲测可用。
- 2022-03-29 00:49:44下载
- 积分:1
-
Android实现五子棋源码
资源描述Android实现五子棋游戏,可以打包安装到手机,适合初学者学习。游戏功能简单,实现方法也比较容易看懂,有需要的可以下下看
- 2022-03-19 07:12:25下载
- 积分:1
-
基于安卓系统USB-HID设备的通信例程
资源描述一种基于安卓系统USB-HID设备的通信例程参考源码,方便大家学习交流。
- 2022-01-25 18:54:05下载
- 积分:1
-
Flight Booking System Development
航班订票系统开发
- 2022-02-07 05:42:54下载
- 积分:1
-
jackson合并文件
jackson架包 二合一,开发文本前段技术必备的架包。JACKSON法:软件工程里软件设计的一种方法JACKSON系统开发方法是一种典型的面向数据结构的分析和设计方法,以活动为中心,一连串的活动的顺序组合成一个完整的工作进程。
- 2022-12-19 03:30:03下载
- 积分:1
-
POI---简单导出excel
POI---简单导出excel;用于导出excel表格(按照自己设置导出)
- 2022-01-26 05:20:15下载
- 积分:1