
现在互联网上存在的网页数量是数以百亿千亿计的,这些网站存储在不同的服务器上,分布在世界各地的数据中心和机房。
对于搜索引擎来说,要抓取互联网上所有的网页几乎是不可能的,从目前公布的数据来看,容量最大的搜索引擎也不过是抓取了整个网页数量的百分之四十左右。一方面原因是抓取技术存在瓶颈,无法遍历所有网页,有许多网页无法从其它网页的链接中找到;另一个原因是存储技术和处理技术的问题,如果按照每个页面平均大小 20K 计算(包含图片),100[......]
{ 0 comments }
WORDPRESS | CSS | SEO
Posts tagged as:

现在互联网上存在的网页数量是数以百亿千亿计的,这些网站存储在不同的服务器上,分布在世界各地的数据中心和机房。
对于搜索引擎来说,要抓取互联网上所有的网页几乎是不可能的,从目前公布的数据来看,容量最大的搜索引擎也不过是抓取了整个网页数量的百分之四十左右。一方面原因是抓取技术存在瓶颈,无法遍历所有网页,有许多网页无法从其它网页的链接中找到;另一个原因是存储技术和处理技术的问题,如果按照每个页面平均大小 20K 计算(包含图片),100[......]
{ 0 comments }

如果非要列举出搜索引擎能做什么,恐怕没有人可以给出完整的答案。那么搜索引擎到底在我们的生活中扮演着怎样的角色呢?搜索引擎已经成为广大网民日常生活中不可缺少的重要部分。中国互联网信息中心CNNIC 2007 年第二十次调查报告显示:搜索引擎以 74.8%的比率已经成为中国网民最常使用的网络服务之一。
给搜索引擎下一个定义是非常困难的。一千个人就有一千个搜索引擎:有人认为搜索引擎就是百度,有人认为搜索引擎就是 Google,有人认为搜[......]
{ 0 comments }