欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  网络运营

百度推出网站采集反馈机制:打击采集网站不能心慈手软

程序员文章站 2022-07-07 17:58:54
可能对于搜索引擎和用户来说,采集网站不一定就是无价值的垃圾站点。但对于广大个人站长来说,采集网站是我们无法容忍的,不仅是赤裸裸的侵权行为,还违背了行业的公平原则。...

9月10日消息,近日有一些站长发现百度站长工具后台上线了新功能,即针对网站采集排名推出的反馈机制。不过目前该功能还在测试阶段,以后肯定会进一步完善。对于很多个人站长来说,采集网站是我们十分头疼的问题。辛苦撰写的一篇原创文章,很快就被采集站转载了,然后自己的网站可能还未被百度收录。采集网站严重破坏了业界的公平原则,百度官方早该下狠手整治了。

必须抵制大量采集站点

对于采集类站点,很多站长都是无可奈何,比较常见的就是一些盗版小说类站点。以及一些新闻资讯类站点,通过采集同行网站的内容存活。此类站点的服务器一般都在国外,域名也是未备案的。所以即便网站被举报,也很难找到背后的运营者。采集网站明显是侵权的,如果采集网站的排名比原文章页面还好,那么肯定会打击原作者的积极性。进而会出现更多的采集网站,这就是一种恶性循环。

采集网站为何屡禁不止

随着百度搜索技术的不断升级,对原创内容的识别度越来越高,相信未来肯定可以杜绝采集网站。但目前百度上线的采集网站排名反馈机制,很有可能是机器和人工审核相结合的。通过技术手段还很难准确判断某篇文章是否为最初的作者,主要原因是百度蜘蛛只能根据抓取时间判断文章的发布时间。一些权重高的采集网站很快会被抓取和收录,而很多新站百度蜘蛛抓取的频率较低。这对于很多新站来说十分不公平。

对投诉机制的一些建议

既然百度站长工具测试了这样的功能,作为个人站长,当然希望该功能可以继续完善。不管是通过人工审核,还是机器程序过滤,对那些采集网站应该都会起到一定的威慑作用。如果某个站点被多次举报为采集网站,百度官方应该重点打击这样的站点。此前百度也推出过一些重点打击采集网站的算法,但真实效果确实不太理想。采集网站的数量实在太多了,对于恶意采集的网站应该是零容忍。

尽管许多站长通过各种技术手段防采集,但那些采集网站总能采集到内容。可能对于搜索引擎和用户来说,采集网站不一定就是无价值的垃圾站点。但对于广大个人站长来说,采集网站是我们无法容忍的,不仅是赤裸裸的侵权行为,还违背了行业的公平原则。

文章由 北京办公室装修 http://www.shangbangzhuangshi.com/ 站长原创 转载保留

相关标签: 网站采集 百度