登录
首页 » Python » python_sina_crawl

python_sina_crawl

于 2021-04-08 发布 文件大小:5KB
0 246
下载积分: 1 下载次数: 162

代码说明:

  新浪微博的爬虫程序。程序运行方式:保存所有代码后,打开Main.py,修改LoginName为你的新浪微博帐号,PassWord为你的密码。运行Main.py,程序会在当前目录下生成CrawledPages文件夹,并保存所有爬取到的文件在这个文件夹中。(Sina microblogging reptiles. Program operation: save all the code, open Main.py, modify LoginName for your Sina Weibo account, PassWord for your password. Run Main.py, the program will generate CrawledPages in the current directory folder and save all files to crawling in this folder.)

文件列表:

python_sina_crawl
.................\Main.py,537,2013-08-23
.................\TextAnalyze.py,1040,2013-08-23
.................\WeiboCrawl.py,7872,2013-08-23
.................\WeiboEncode.py,1642,2013-08-23
.................\WeiboSearch.py,1230,2013-08-23

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • ymsh_v1.0
    夜幕下拾荒者个人主页网站管理系统介绍: 1.设置您的站点属性 首页音乐播放:进入首页可选择是否自动播放您推荐的音乐 名称和网址:网站名称和网站地址 网站关键字:可以根据您站点的特点来填写,有利于百度各大搜索引擎搜索,让他/她更快的找到你 (Night scavengers personal home page website management system introduced: 1. Set up your site properties Home music player: Go Home recommended you choose whether to automatically play music Name and Address: Site name and website address Website Keywords: according to the characteristics of your site to be completed in favor of Baidu major search engines, so that he/she find you faster )
    2016-05-03 11:52:49下载
    积分:1
  • 1905
    很好的搜索: 给你很多长度不定的木棒,将他们分成几组,每组中的总长度作为这组的标示值,请给出一种分组方法,能使得所有标示值中的最小值最大。 Input 多组,每组两行,第一行是一个N和K,代表有N根木棒,分成K组,第二行是N个数字,代表木棒的长度。(N不超过100,K不超过20,每根木棒长度不超过1000) Output 输出所有标示值中的最小值的最大值。 Sample Input 5 3 1 3 5 7 9 5 3 89 59 68 35 29 Sample Output 8 89(err)
    2007-12-28 16:47:08下载
    积分:1
  • DuplicateHandle
    利用句柄复制进行文件占坑实现阻止文件删除,外加枚举进程内所有打开的文件、搜索文件句柄所在进程、卸载相关句柄。(Copy files using handles accounting realize pit stop delete files, plus the process of enumeration of all open files, search file handles where the process of unloading the relevant handler.)
    2009-02-20 19:12:36下载
    积分:1
  • 作业
    应用背景清华大学搜索引擎pagerank算法,采用C编写而成,处理大数据,大规模的网页,能够完美运行,数据格式为a-b,a代表源网页,b代表目的网页关键技术pagerank算法,大数据处理,数据格式见应用背景,编译环境是dev-c++,在windows下完美运行
    2022-03-03 09:44:49下载
    积分:1
  • 6-spsPworkspace
    工作空间分析,利用极限搜索法对空间进行求解(Workspace analysis, the use of space limit search method to solve)
    2021-04-28 13:58:44下载
    积分:1
  • Zernike-Moment
    关于泽尼克矩的应用于二维图形文件的搜索。(Zernike Moment)
    2015-05-11 11:40:18下载
    积分:1
  • python_sina_crawl
    新浪微博的爬虫程序。程序运行方式:保存所有代码后,打开Main.py,修改LoginName为你的新浪微博帐号,PassWord为你的密码。运行Main.py,程序会在当前目录下生成CrawledPages文件夹,并保存所有爬取到的文件在这个文件夹中。(Sina microblogging reptiles. Program operation: save all the code, open Main.py, modify LoginName for your Sina Weibo account, PassWord for your password. Run Main.py, the program will generate CrawledPages in the current directory folder and save all files to crawling in this folder.)
    2021-04-08 16:39:00下载
    积分:1
  • bbk2818
    说明:  nutch开发自己的搜索引擎 视频教程 简单 环境搭建(nutch own yourself search engine)
    2011-03-30 09:24:59下载
    积分:1
  • 4714
    搜索论坛最新主题搜例程,源码演示取论坛最新主题20贴,读取论坛帖子地址列表,使用正则搜索地址文本。(Search Latest Forum Posts search routines , source code demonstrate fetch Latest Forum Posts 20 , read forum posts address list , search for addresses using regular text .)
    2015-07-28 19:57:07下载
    积分:1
  • zhizhupc
    使用网络爬虫技术实现自动查找指定网页上的新闻链接(Using web crawler technology automatically find links to news on a given page)
    2012-06-21 16:28:45下载
    积分:1
  • 696516资源总数
  • 106457会员总数
  • 15今日下载