登录
首页 » Java » design-documents

design-documents

于 2021-04-01 发布 文件大小:627KB
0 111
下载积分: 1 下载次数: 144

代码说明:

  网页信息采集子系统: 网页采集:动态查找及实时分析新增网页,读取网页回帖信息。 网页过滤:,对获取的网页,通过网页清洗模块清除网页中的广告、导航信息、 图片、版权说明等噪声数据,萃取出相关网页的标题、正文、链接地址、采集时 间、回帖、发帖人数等数据。 网页信息预处理子系统: 网页审查脏字:主要功能包括中文分词、词性标注、命名实体识别、新词识别, 建立数据库说明每类词库,建立敏感词词库。 网页舆情监测:监测是否出现了一定影响的舆论,即回帖的回帖或支持、顶等 达到一个预先设定的阈值; 舆情分析子系统: 汇总网站舆情:汇总整个网站的舆情监控信息,自动生成报告。(Web information collection subsystem: the pages collection: dynamic lookup and real-time analysis of the new website, read pages Replies. Web filtering: to clear advertising pages, navigation information, images, copyright noise data access pages via web cleaning module, extract the relevant page title, text, link address, acquisition time, posts, posting number and other data. Web information preprocessing subsystem: Web review dirty: The main features include the Chinese word segmentation, POS tagging, named entity recognition, new word identification, to establish a database description of each type of thesaurus, and the establishment of a sensitive word thesaurus. Page opinion monitoring: monitoring whether there is a certain influence public opinion, that a reply to the post or support other top reaches a preset threshold public opinion analysis subsystems: summary website public opinion, public opinion monitoring information: summary of the entire site, automatically generate re)

文件列表:

design documents.pdf,771713,2013-01-09

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • JMT-src-and-libs-0.7.0.tar
    一个用于排队系统仿真的开源软件,有非常形象的图象仿真过程!(a queuing system simulation for the revenue-generating software, the image of the very image simulation!)
    2007-01-21 12:47:45下载
    积分:1
  • huangfang
    JAVA 实现魔方的计算,并用图形界面输出,最多可计算N个,数值课变,可以报错(java )
    2015-06-12 22:38:27下载
    积分:1
  • java swing学生信息管理系统(源码+数据库+文档)
    java swing学生信息管理系统(源码+数据库+文档)
    2021-05-06下载
    积分:1
  • javapicture
    Java照片合成程序示例,只是进行简单的图片合成处理,合并后生成新的图片,有兴趣的可参考源代码(Java photo synthesis program example, just a simple image synthesis process, after the merger to generate a new image, interested can refer to the source code)
    2014-04-16 09:01:23下载
    积分:1
  • Hibernate-code
    深入浅出Hibernate源码,学习hibernate的好资料(Hibernate code)
    2014-02-20 15:22:41下载
    积分:1
  • test
    说明:  part1 (1)可以在“请输入文件路径和名称:”后面的文本框中输入文件名和路径。 (2)可以在文本区中写文本。 (3)可以在“请输入需要追加的内容:”后面的文本域中输入内容,按回车键之后,其中的内容会添加到文本区中(添加的内容另起一行)。 (4)单击“将文本区的内容写入文件”按钮,文本区中的内容就会被写到指定的文件中。 part2 (1)窗体的标题是“猜数字小游戏”。 (2)单击“得到一个随机数”按钮,系统会产生一个1~10之间的随机整数(使用Math类的方法random( ))。 (3)在“输入您的猜测:”后面的文本框中输入你要猜测的整数,之后单击“确定”按钮。 (4)对你猜测的整数,图形用户界面的最下面会有提示信息,没有猜的时候,显示“无反馈信息”,如果猜大了,显示“猜大了”,如果猜小了,显示“猜小了”,如果猜对了,显示“猜对了”。(其中,蓝色字体是JLabel类的对象调用方法setForeground(Color.blue)实现的。)(Java Simple Graphic Interface)
    2020-12-11 15:59:18下载
    积分:1
  • 89346494easyjferp
    erp java jsp struts javabean 很好很强大的(erp java jsp struts javabean very very powerful)
    2008-05-05 12:47:14下载
    积分:1
  • graduatedesign
    说明:  毕业设计:使用ssh框架开发银行管理系统(Developing bank management system with SSH Framework)
    2020-06-22 17:00:02下载
    积分:1
  • wordsegment
    中文分词系统,有IKAnalyzer和MMAnalyzer两种分词方式可供选择,有界面展示,可是清楚的比较两种的特点,各有千秋(Chinese word segmentation system, there are two kinds of segmentation MMAnalyzer IKAnalyzer and methods are available, there are interface shows, but a clear comparison of two characteristics, each has its advantages)
    2011-05-21 19:10:25下载
    积分:1
  • javamain99
    说明:  the main of the println file of china
    2020-06-20 03:00:02下载
    积分:1
  • 696522资源总数
  • 104049会员总数
  • 30今日下载