登录
首页 » 文件处理 » 原始数据划分为train.dat和test.dat

原始数据划分为train.dat和test.dat

于 2022-01-25 发布 文件大小:29.06 MB
0 149
下载积分: 2 下载次数: 2

代码说明:

应用背景开始是做movielense的数据,可以把原始数据任意划分为train.dat和test.dat,主要是为了做验证实验。非常简单明了,适合初学者看看,如果不喜欢,请轻喷。关键技术# -*- coding: cp936 -*- from sklearn import cross_validation c = [] filename = r"Raw.data" #原始数据 out_train = open(r"train.txt","w") #训练集 out_test = open(r"test.txt","w") #测试集 for line in open(filename):     items = line.strip().split(",")      c.append(items)   c_train,c_test = cross_validation.train_test_split(c,test_size=0.1)#size =你需要的比例 for i in c_train:     out_train.write(",".join(i)+" ") for i in c_test:     out_test.write(",".join(i)+" ")

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • decomposition document management : achieving reading documents and documents of...
    文件分解管理器:实现读文件并进行文件的分解,界面比较完善,有调试和错误记录功能-decomposition document management : achieving reading documents and documents of decomposition, interface sound, and debugging and error recording
    2022-04-25 04:43:01下载
    积分:1
  • CSpreadSheet use category, Excel spreadsheet file for the programming operation
    运用CSpreadSheet类,针对Excel表格文件操作的编程实现-CSpreadSheet use category, Excel spreadsheet file for the programming operation
    2022-03-24 01:56:14下载
    积分:1
  • 程序检查如果rapidshare仍然活跃
    Program to check if Rapidshare files are still active
    2022-06-12 16:16:02下载
    积分:1
  • 一个获取和设置属性的BCB程序!第一次上载,请站长及高手们多多指教^__^...
    一个获取和设置文件属性的BCB程序!第一次上载,请站长及高手们多多指教^__^-an access and document attributes of BCB procedures! On the first set, and the master chief who exhibitions ^ __ ^
    2022-02-09 11:33:47下载
    积分:1
  • 随着图像生成的代码使用PDFlib,PDF
    本代码利用PDFLIB生成带图像、附件的PDF文档-PDFLIB the code generated with the use of images, PDF document attachments
    2022-06-03 17:09:12下载
    积分:1
  • Excel通用导入设计源码
    有时候我们的数据存放在Excel中(特别是对于用户来说更喜欢使用Excel收集一些常用数据),而系统又需要这些数据来处理其他业务,那么此时我们就需要将这些数据导入到数据库中。但是鉴于Excel的样式多种多样,因此每次导入时都必须书写很多重复的代码。很明显对于一个软件开发者做这些重复劳动是一件很无趣的事情。那么怎样来寻中一种通用的方法呢?今天我们就一块看一下如何来解决这个问题。主要内容 Excel操作组件的选择总体设计思路配置文件设计类设计
    2022-12-28 10:05:04下载
    积分:1
  • super text
    超级文本处理软件,我设计该软件的目的是让它的功能远远地超过写字板-super text-processing software, the software design is aimed to allow its capabilities far exceeded tablet
    2022-03-15 22:41:15下载
    积分:1
  • VC++6.0写的关于用API函数操作INI的测试程序,欢迎大家下载...
    VC++6.0写的关于用API函数操作INI文件的测试程序,欢迎大家下载-VC++ 6.0 write operation on the use of INI file API function testing procedures are welcome to download the U.S.
    2022-12-29 02:10:04下载
    积分:1
  • electronic wordlists of the system to achieve the target : a record recorded wor...
    电子生词本 系统实现目标: 记录单词 记录文章(作为单词的上下文,可以分析出单词) 系统分为三层结构:磁盘存储、内存管理、用户交互-electronic wordlists of the system to achieve the target : a record recorded word article (as a word in the context, can analyze words) system is divided into three-tier structure : disk storage, memory management, user interaction
    2022-03-19 03:07:12下载
    积分:1
  • 为c/c++/cxx源码批量添加版权注释
    为c/c++/cxx源码批量添加版权注释,稍作修改,可以支持任何语言。使用js开发的原因是,灵活且方便随时随地修改。windows下双击就可以运行。非常地方便。
    2022-08-25 13:34:14下载
    积分:1
  • 696518资源总数
  • 106227会员总数
  • 11今日下载