互联网网页资源现状
CNNIC2014年年初发布的《中国互联网络发展状况统计报告》中称:截至2013年12月,中国网页数据为1500亿,相比2012年同期增长了22.2%。2013年中国单个网站的平均网页数和单个网页的平均字节数均维持增长,显示出中国互联网上的内容更为丰富:平均网站的网页数达到4.69万个,较去年同期增长2.3%。
为了保证搜索质量、提高用户使用满意度,百度搜索引擎每周都会进行网页质量抽样评估。然而从近一年的评估数据中我们发现,优质网页的绝对数量非常少,且几乎没有增长;普通网页的占比在下降,相应的,质差网页的比例却有明显上涨。截至2014年5月,统计数据显示,在百度网页搜索发现的海量网页中,优质网页仅占7.4%,质差网页高达21%,其余普通网页为71.6%。
百度网页搜索通过一系列筛选、识别、分析、赋权等工作,努力将更多优质网页呈现在用户面前,每天约打击上万质量差网站,涉及网页达百万量级,尽可能减少质量差网页给用户带来的干扰。从下图2014年5月的网页展现分析数据显示,目前展现在用户面前的网页质量分布中,优质网页占比为40%,质量差网页降为11%——虽然这个变化已经非常明显,但百度网页搜索还是希望能和广大站长一起努力,将质量差占比降到更低。
互联网全部网页
在百度搜索得到展现的网页
优质网页
7.4%
41%
普通网页
71.6%
49%
质量差网页
21%
11%
上述质量差网页包括低质网页和垃圾网页两部分,低质网页问题分布如下图所示:
从上图我们看出,目前低质网页中最严重的问题即因广告过多、占据网页主要位置以及超预期弹窗带来的浏览体验差,内容空短、网页需要权限才能获取资源和过期信息也是低质网页的重要组成部分。
质量差网页中除了低质网页外,无任何质量可言的垃圾页面的问题分布如下图所示:
从上图我们看出,目前低质网页中最严重的问题即因广告过多、占据网页主要位置以及超预期弹窗带来的浏览体验差,内容空短、网页需要权限才能获取资源和过期信息也是低质网页的重要组成部分。
质量差网页中除了低质网页外,无任何质量可言的垃圾页面的问题分布如下图所示:
死链对用户、网站和搜索引擎来说都已没有存在的意义,垃圾网页中占比最大。其次是对用户和搜索引擎伤害巨大的作弊网页,资源无效、有问无答和不相关搜索结果页这些极大浪费用户时间的网页也是搜索引擎不希望呈现给用户的。
2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!
7. 如遇到加密压缩包,请使用WINRAR解压,如遇到无法解压的请联系管理员!
8. 精力有限,不少源码未能详细测试(解密),不能分辨部分源码是病毒还是误报,所以没有进行任何修改,大家使用前请进行甄别
9.本站默认解压密码为:www.sudo1.com
本站提供的一切软件、教程和内容信息仅限用于学习和研究目的。
不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。
本站信息来自网络收集整理,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑或手机中彻底删除上述内容。
如果您喜欢该程序和内容,请支持正版,购买注册,得到更好的正版服务。
我们非常重视版权问题,如有侵权请邮件与我们联系处理。敬请谅解!
云资源网 » 百度搜索引擎网页质量白皮书
常见问题FAQ
- 免费下载或者VIP会员专享资源能否直接商用?
- 本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
- 提示下载完但解压或打开不了?
- 你们有qq群吗怎么加入?