网页正文的抽取是指将存在于网页中的,与网页主题相关的、结构完整的文本提取出来。
互联网摘选
服务器会将动态组件的数据结构和JavaScript代码添加到页面内容中,而非发送静态HTML。
互联网摘选
The page content and browsing path are taken into account in measurement of browsing interest.
在用户访问兴趣度量中综合考虑网页内容和浏览路径因素;
互联网摘选
在页面与主题的相关性判定中,应用在自然语言处理中比较成熟的基于关键词的向量空间模型计算页面与主题的相似度。
互联网摘选
下面的代码示例演示如何创建将网页内容回发到服务器的“提交”button控件。
provided by jukuu
在网页净化技术说明中,我们将网页表示成一颗DOM树,并首次将中文标点符号数引入到衡量网页正文的权重中,通过对DOM树不断的剪枝,极大的减少了网页的噪音。
互联网摘选
The traditional Web resource automatic discovery is based on page content.
传统的Web资源自动发现是基于Web页面内容实现的。
互联网摘选
Use this tool to evaluate your internal links, meta information and page content.
使用此工具来评估你的内部联系,元信息和网页内容。
互联网摘选
Main page content to adjust, typesetting optimization allows content easier to read.
对主要页面内容进行调整、排版进行优化,让内容更容易阅读。
互联网摘选
越来越多的应用要求返回给用户的检索结果不仅是内容相关的,还必须是与用户当前或提供的地理位置相关的。
互联网摘选
由于Web服务器和Web网页内容具有动态多变的特点,使用单一的算法并不能挖掘出所有的离群数据。
互联网摘选
模样奇特的返回值server.NOT DONE YET是一个标记,要求Twisted服务器将页面内容清出request对象。
互联网摘选
它们通过重点显示页面内容的某一部分来提供较为有用的搜索结果,如图1所示。
互联网摘选
JavaScript的历史与Web浏览器动态表示和操作Web页面内容的能力是相符合的。
互联网摘选
PHP主要用于服务端的编脚本,可以起到CGI程序的作用,比如:收集表格数据,产生动态页面内容,或者收发点心。
互联网摘选
该方法将搜索所有页面内容,查找包含文本AAAAPlace721134315的Link类对象,然后返回要执行操作的对象。
互联网摘选
为了得到更优的页面检索结果,本系统提出了一种基于页面内容和URL链接深度相结合的页面优先度排序算法,并通过改进Lucene的基本排序算法加以实现。
互联网摘选
Web Page Content Extraction is a technology of extracting useful information from web pages.
网页的内容抽取是指从网页中抽取出有用的内容。
互联网摘选
纯文本浏览器的用户或解释网页内容的软件的用户也可能要使用辅助功能选项。
provided by jukuu