百度阻止用户接触到维基百科的方法

百度 互联网
blackhat (19032)发表于 2010年12月23日 18时40分 星期四
来自拷贝猫部门
Jerry  写道 "我发现了一个大量从维基百科复制条目到百度百科的用户。用百度搜索其中随机的5个条目,发现第一个结果就是被他复制去的百度百科条目。在搜索诓中加入“wikipedia”也搜索不到维基百科的条目。然而,有的关键词却能搜到手机版zh.m.wikipedia.org里的条目。显然,维基百科条目主网址要比手机版网址更重要,却不被收录。另外,手机版zh.m.wikipedia.org服务器也在美国,所以,因为美国服务器所谓“不稳定”而不能收录的说法是站不住脚的。 结论是,虽然百度估算能搜到超过30万条目的维基百科中的1,800个网页,但还是利用了伎俩,使其用户很难通过其接触到维基百科。另一个证据是,百度只收录了zh.wikipedia.org的1,800个网页却收录了手机版zh.m.wikipedia.org的10万多个网页(估计是忘记过滤zh.m.wikipedia.org了)。"

「星期四」 Hello Thursday

百度阻止用户接触到维基百科的方法

Jerry  写道 "我发现了一个大量从维基百科复制条目到百度百科的用户。用百度搜索其中随机的5个条目,发现第一个结果就是被他复制去的百度百科条目。在搜索诓中加入“wikipedia”也搜索不到维基百科的条目。然而,有的关键词却能搜到手机版zh.m.wikipedia.org里的条目。显然,维基百科条目主网址要比手机版网址更重要,却不被收录。另外,手机版zh.m.wikipedia.org服务器也在美国,所以,因为美国服务器所谓“不稳定”而不能收录的说法是站不住脚的。 结论是,虽然百度估算能搜到超过30万条目的维基百科中的1,800个网页,但还是利用了伎俩,使其用户很难通过其接触到维基百科。另一个证据是,百度只收录了zh.wikipedia.org的1,800个网页,却收录了手机版zh.m.wikipedia.org的10万多个网页(估计是忘记过滤zh.m.wikipedia.org了)。"

blackhat 发表于

2010年12月23日 18时40分