网站是多个网页共同组成的集合。细化到单个网页的质量时,360搜索在一般会按以下几个维度进行综合衡量:
下面,我们向大家具体介绍这些维度:
内容质量
在评价网页的内容质量时,360搜索首先会考虑这个网页内容的优劣,以及对用户需求是否可以被满足。
3.1 不同类型网页的质量关注维度
网页的形态不尽相同,针对不同类型的页面,360搜索在质量上也会有不同的关注维度。我们在此举一些常见的例子,供大家参考:
- 网站首页:标签是否完善、清晰;网页中的内容及链接是否可访问。
- 列表页、搜索结果页:内容与网页主题、搜索词是否有相关性,并且内容清晰,符合用户的习惯。
- 文章页:是否提供完整、真实的内容,图文并茂更佳。
- 新闻页:具备新闻属性,对新近发生的事实有完整准确的报道,图文并茂更佳。
- 小说页:能否提供清晰可阅读的小说内容,无错章,章节之间连贯,更新及时。
- 文档页:用户是否可以正常阅读,是否有权限限制。
- 视频页:是否清晰且能正常播放,是否有权限限制。
- 图片页:图片是否清晰且能浏览,有文字信息介绍该图片中的内容更佳。
- 百科及问答知识页:是否对某一事物、词语、现象进行了准确的解释,或具有参考价值的答案。带有图片或参考资料说明更佳。
- 以UGC为主要特征的网页(如:博客、自媒体、贴吧、社区帖子):是否能产出独具自身特色或观点的内容,内容完整丰富,具有一定的阅读价值。
- 商品页:是否提供了完整真实的商品信息,是否提供了可成功购买入口。如有产品评价的内容会更好。
- 分类信息页:是否提供了完整有效准确的信息(如黄页中的联系方式,地址,联系人,公司,产品信息是否准确有效),并且没有过期。
- 下载页:是否提供了下载的入口,是否有下载权限限制,下载的资源安全且真实。
3.2 网页内容质量现状与收录的权衡
根据2017年7月发布的第40次 《中国互联网络发展状况统计报告》:截止2017年月,中国网站的总数已达 506 万个,半年增长率为 4.8%。中国网民规模已达到 7.51亿 。
目前,全网网页数量已接近万亿级别。网页内容的质量情况大体分布如下:
数据来自:360站长平台
通过数据我们可以知道:尽管网站、网页数量目前已经达到了一个惊人的数量级,但优质内容仍然较为稀缺。互联网中大部分内容都属于质量一般的内容,还有相当一部分内容是属于内容质量差的。因此,基于网页资源质量的实际情况,从用户需求和内容索引择优的原则出发,并非所有网页都会被360搜索收录。
3.3 内容质量好的网页
一个内容质量好的网页,往往是网站投入了一定精力来制作的。具备原创属性。资源有效、权威,能充分满足用户的需求,能彰显出网页及网站的价值。个别内容甚至是全网独家拥有的稀缺资源。
对于此类网页,360搜索会在一定程度上给予优先收录和排序的机会。我们列举了其中一小部分网页作为例子,供大家来感受一下:
示 例 | 说 明 |
case1 | 政府网站一个权威且完整有效的通知。 |
case2 | 新闻网站的原创内容,倾注了精力运营的新闻报道或专题。 |
case3 | 医疗网站发布的内容丰富且权威的页面。针对感冒,提供了问答、文章、症状、诊断和鉴别等内容,可满足用户的需求。 |
case4 | 经过网友用心编辑,内容丰富的 UGC 内容。 |
case5 | 房产网站的一个丰富且内容有效的列表页。 |
case6 | 一个 IT 技术类博客文章,内容完整且能解决专业技术性问题。 |
case7 | 购物网站一个包含商品信息、评价的完整页面。 |
case8 | 汽车网站提供的车系聚合信息页,包含了汽车价格,配置参数,经销商,评价等全面且多样的信息。 |
3.4 内容质量一般的网页
相较于内容质量好的网页,这种类型的网页往往可能不是网站自身原创的,也能在一定程度上满足用户的需求,但本身网页中的内容可替代性较强。对于此类网页,360搜索会综合其资源可替代性、需求满足程度、用户体验等维度考虑其是否收录及排序高低。
3.5 内容质量差的网页
这种类型的网页,往往主体内容不完整,缺失有效信息,无法从实质性上解决用户的需求。请站长们尤其需要注意:如果在一个网站中此类网页占比很大,不仅影响用户的体验,也会影响到360搜索对这个网站或网页的评价。
提供一些 badcase 例子,供站长们参考:
示 例 | 说 明 |
case1 | 网页主体内容缺失。 |
case2 | 交易、团购、活动结束,商品下架,招聘失效等,不能满足用户当前时效需求。 |
case3 | 问答类网页存在有问无答、回答无用、回答推广等特征。 |
case4 | 差标签页、差搜索结果页,列表页的标题和内容相关性差。 |
case5 | 视频页标题文不对题,还带有推广的性质。 |
case6 | 网页中的文字、链接、图片、视频或必要的下载链接失效。 |
case7 | 论坛水贴。 |
case8 | 通过新闻网站、博客等渠道发布的医疗推广内容,以及差医疗站点。 |
case9 | 网页或文章的标题与内容相关性差,或者毫无关系。 |
3.6 作弊网页
此类网页往往有作弊行为,内容粗制滥造,完全不能为用户提供任何帮助,甚至还夹带病毒,没有任何价值。360搜索会依据实际情况,做降低排序和直接拒绝收录的处理!
在此,我们列举一部分例子,请各位站长知悉:
示 例 | 说 明 |
case1 | 在正常文章的句子或段落之前穿插其他无关联的关键词或锚文本。 |
case2 | 在网页或标题中刻意的大量重复关键词或锚文本,进行恶劣优化,提高关键词密度,从而欺骗搜索引擎。 |
case3 | 网页打开跳转到其他带有明显推广盈利性质的页面,如博彩、色情等,或跳转到其他明显作弊特征的页面。 |
case4 | 把转载的文章进行再加工,欺骗搜索引擎,让其认为这是一篇原创的文章。 |
case5 | 页面有虚假电话、虚假下载、钓鱼网站等危害用户安全的行为。 |
case6 | 网站内容采集于其他网站,通常有规模大、范围广、板式差、不完整等特征,并可能兼有其他黑帽 SEO 或作弊行为,达到被搜索引擎收录的目的。 |
case7 | 网站将目录或频道页租售出去,或自行有意而为之。在全站或其中几个目录下,发布大量与网站主题完全无关的内容,包括蹭热点事件、编造八卦、发广告软文、甚至发布低俗色情及非法的内容,以此来达到吸引用户点击的目的。 |
case8 | 在首页或子页面刻意设置垃圾外链,形成恶劣链接关系,达到欺骗搜索引擎或恶意推广的目的。部分网站甚至利用这一手段,形成了链接买卖和链接黑市交易的行为。 |
case9 | 刻意生成大量二级或多级子域名,制造作弊垃圾内容,获取搜索引擎的广泛收录达到推广目的。 |
case10 | 利用模板粗制滥造,生成大量相同但质量很低网站,达到欺骗搜索引擎排序目的。 |