百度推出网站采集反馈机制:打击采集网站不能心慈手软
9月10日消息,近日有一些站长发现百度站长工具后台上线了新功能,即针对网站采集排名推出的反馈机制。不过目前该功能还在测试阶段,以后肯定会进一步完善。对于很多个人站长来说,采集网站是我们十分头疼的问题。辛苦撰写的一篇原创文章,很快就被采集站转载了,然后自己的网站可能还未被百度收录。采集网站严重破坏了业界的公平原则,百度官方早该下狠手整治了。
必须抵制大量采集站点
对于采集类站点,很多站长都是无可奈何,比较常见的就是一些盗版小说类站点。以及一些新闻资讯类站点,通过采集同行网站的内容存活。此类站点的服务器一般都在国外,域名也是未备案的。所以即便网站被举报,也很难找到背后的运营者。采集网站明显是侵权的,如果采集网站的排名比原文章页面还好,那么肯定会打击原作者的积极性。进而会出现更多的采集网站,这就是一种恶性循环。
采集网站为何屡禁不止
随着百度搜索技术的不断升级,对原创内容的识别度越来越高,相信未来肯定可以杜绝采集网站。但目前百度上线的采集网站排名反馈机制,很有可能是机器和人工审核相结合的。通过技术手段还很难准确判断某篇文章是否为最初的作者,主要原因是百度蜘蛛只能根据抓取时间判断文章的发布时间。一些权重高的采集网站很快会被抓取和收录,而很多新站百度蜘蛛抓取的频率较低。这对于很多新站来说十分不公平。
对投诉机制的一些建议
既然百度站长工具测试了这样的功能,作为个人站长,当然希望该功能可以继续完善。不管是通过人工审核,还是机器程序过滤,对那些采集网站应该都会起到一定的威慑作用。如果某个站点被多次举报为采集网站,百度官方应该重点打击这样的站点。此前百度也推出过一些重点打击采集网站的算法,但真实效果确实不太理想。采集网站的数量实在太多了,对于恶意采集的网站应该是零容忍。
尽管许多站长通过各种技术手段防采集,但那些采集网站总能采集到内容。可能对于搜索引擎和用户来说,采集网站不一定就是无价值的垃圾站点。但对于广大个人站长来说,采集网站是我们无法容忍的,不仅是赤裸裸的侵权行为,还违背了行业的公平原则。
文章由 北京办公室装修 http://www.shangbangzhuangshi.com/ 站长原创 转载保留