-
网页中的语义文本提取
应用背景这个代码是我们在我们学院的语义网技术学科中的一部分。这个代码是一个非常基本的尝试,试图从网页中删除广告,只显示相关的文本。我们删除广告、Flash及其他JavaScript等,只用文字显示。此代码使用Python语言因为它减少程序员的编码工作提供了许多图书馆侧。关键技术Web 已经成为最大的信息来源,有数十亿网页。然而,
web 页通常包含一些与主题无关的内容。例如,
有这么多的多媒体广告段、 不必要的图像或导航链接
在 Web 页中。这些部件可以严重损害 Web 数据挖掘,分散注意力从主要用户
主题,并影响 PageRank。有一些现有的方法来发现翔实的内容块。最简单的方法是辨识和消除杂波,广告、 装饰等。
- 2022-08-09 19:34:35下载
- 积分:1
-
树复选框
例如一个组件treeCheckBox(工会的组件树和复选框)使用ActionScript linguaguem的 - - Apache Flex
- 2022-02-21 13:35:25下载
- 积分:1
-
测试应用程序
就业工作门户的应用已发展为私人雇主的在线注册,提交空位信息,搜索和联系候选人,候选人的信件发放,进入面试和了解所选候选人等状况
- 2022-03-18 21:20:09下载
- 积分:1
-
浅谈高校图书馆的电子书
存储的书籍和作者的信息,就像电子图书馆,管理员登录注销,观书,由作者功能都可用,在使用 HTML 和 Mysql 的 PHP 4.0 版本开发。
- 2023-01-16 04:35:04下载
- 积分:1
-
PHP注册和登录
应用背景允许用户注册一个新的帐户和登录系统使用授权的帐户。关键技术PHP,数据库,SQL,Java脚本和HTML用于这个项目的注册和登录。 ;
- 2022-11-11 16:35:04下载
- 积分:1
-
Php lzss 压缩算法压缩
Lzss 压缩算法压缩
编码算法
地方的编码位置到开头的输入流 ;
为预测先行缓冲区在窗口中查找最长的匹配:
P : = 指向的指针,这场比赛 ;
L : = 长度的匹配 ;
是L > = MIN_LENGTH?
是: 输出P和向前迈进的编码的位置L字符 ;
NO: 输出预测先行缓冲区的第一个字符
- 2022-02-02 05:01:56下载
- 积分:1
-
Test universitario para elegir carrera
我们的项目是在大学的网络上进行的,我们的考试是在大学里进行的
- 2022-04-01 12:11:57下载
- 积分:1
-
Game Browser C# 页游浏览器(可自定义挂机脚本)
可以 边看电影边工作, 不你可以继续做后一层程序的操作.可以 自动化的页游浏览器自定义 录制操作的内容一切都那么轻松实现...娱乐工作两不误...
- 2023-02-06 05:15:04下载
- 积分:1
-
JSON WEB 打包
本程序以JSON格式为基础, 将FORM的有绑定的字段打包到, 然后上传到指定的后台代码, 进行处理.本程序使用了extjs库, 3.2.x; 欢迎大家使用并提出意见! 谢谢!
- 2022-05-08 18:51:39下载
- 积分:1
-
阿罗拉浏览器源代码
阿罗拉是一个轻量级的跨平台的Web浏览器。它是免费的(如言论自由和免费的啤酒)。阿罗拉运行在Linux,嵌入式Linux,FreeBSD的,Mac OS X上的Windows,俳句,并通过Qt工具包支持的其他平台。阿罗拉采用了完全符合标准的WebKit布局引擎的QtWebKit的端口。它具有快速渲染,强大的JavaScript引擎,并且支持的Netscape插件。
- 2022-01-23 11:15:33下载
- 积分:1