让垃圾留言远离您的网站和用户

2008年10月22日星期三

Keeping comment spam off your site and away from users
发表于: 2008年9月26日星期五 下午2:26

假设您已经在您的网站上开辟了一个论坛,或者在您的博客上激活了评论功能。您精心准备了一两篇帖子,点击了提交按钮,然后开始屏住呼吸等待评论的到来。


评论真的来了。您的一个博友发表了友好的评论,您参加的在线角色扮演游戏的盟友发来了新的消息,
Millie 阿姨发来了星期四晚上聚餐的提醒 但同时您还收到另外一些东西 一些让您头疼的东西。比如一些鼓吹得天花乱坠的广告信息,乱七八糟不知所云的信息,甚至还有一些暴露的图片。可以这样说,您已经陷入可怕的 垃圾留言 里了。

垃圾留言对您来说是有害的,因为它加重了您的工作负担。垃圾留言对您的用户来说也是有害的,因为他们只是来您的网站来寻找感兴趣的内容,而这些毫不相关的内容只会影响他们的注意力。垃圾留言对整个网络来说也是有害的,因为它使网站管理员们不敢轻易开放自己的网站,这给人们在论坛和博客上自由发表自己的观点带来了不便。

那么作为一个网站管理员,您可以做些什么呢?

注:下面的解决办法是一个很好的起点,但可能并不是全部的解决方案。互联网上有许多不同的博客,论坛和 BBS 我们不可能对每一种系统都提供详尽的指导,以下是较广泛通用的解决办法。

确保是真正的人而不是机器在您的网站上留言

  • 添加一个输入验证码环节 (CAPTCHA) CAPTCHA 要求用户阅读一段模糊的文字并输入相应的文字,这种办法能够验证对方究竟是真正的人类还是机器程序。如果您的博客或论坛没有植入验证环节的话,您可以使用 Recaptcha 这个插件。验证环节并不能解决所有的问题,但是它可以有效地制止垃圾留言制造者的猖狂行为。 您可以了解更多类型的 CAPTCHAS ,但是请记住仅仅是添加这么一个环节,就可以起到很大的作用。
  • 阻止可疑行为。许多论坛允许您设置两次发贴之间的最小时间间隔。您也可以通过安装插件,监控那些来自于同一 IP 地址或 proxy 的异常巨大的流量,以及其他更可能来自于机器程序而不是人类访问者的异常行为。

使用自动过滤系统

  • 通过将一些关键词加入黑名单能够帮助您阻止一些明显的不恰当的留言。垃圾制者们有时候会故意模糊所使用的词语,所以这个方法也不是万能的,不过您也不妨一试。
  • 使用能够自动删除垃圾留言的插件或系统特性。垃圾制造者们使用自动程序的方式来侵扰您的站点,那我们为什么不也用自动的方式来保护自己呢?像 Akismet (有很多针对博客和论坛的插件)这样的系统和 TypePad Antispam (开源并兼容 Akismet ),很容易安装,并能帮您完成大部分的工作。

将您的设置调整地更严格一些

  • 禁止跟踪 不被信任的链接。许多系统有这样的功能,可以给链接添加“ nofollow” 的属性。这样做可以防止某种类型的垃圾留言,但并不是唯一可行的方式。
  • 您可以考虑要求用户在发帖前必须登录,这样可以防止用户任意地发表留言。但是,这样做也会使信噪比提高。
  • 改变您的设置,使留言必须经过您的批准才能展示。如果您是一个规模较小的网站,并且没有太多的留言的话,这是一个使自己网站留言保持高水平的很好的办法。您可以允许自己的员工或者值得信赖的用户能够自助批准自己的留言,这样能减轻您一部分工作负担。
  • 可以考虑禁止某些类型的留言。比如,您可以将那些比较陈旧、已经不太可能有高质量评论的帖子冻结。在博客上,您可以把引用通告等功能暂停,因为这是极易吸引网络垃圾的地方。

及时更新您的网站

  • 请您花些时间将您的软件及时更新,并关注那些重大的安全升级。一些网络垃圾制造者会利用旧版本博客、论坛或内容管理系统的安全漏洞攻击您的网站。您可以在 网站安全快速检查清单 上找到更多相应的解决方案。

您可能需要权衡您的软件、您的用户群,及您的经验等多种因素来选择实施各种方法。无论您是一个小型的个人博客,还是一个大型的多用户的网站,不加任何保护地就贸然开放您的网站留言是有很大风险的。另外,如果您的网站已经被成千上万条垃圾帖所侵蚀并且不再出现在 Google 搜索结果的话,当您已经彻底清除了这些不良内容并采取了相应保护措施的话,您可以考虑 提交一个重新收录的申请

作为一个 有较长时间经验的网站开发者和博客一员 ,我可以以我自己的切身体验告诉您,花一点点时间做一些预防措施会节省您将来大量的时间和精力。我是一个网站管理员中心组的一个较新的成员。我很乐意帮助我的网站管理员同行们,而且我对搜索质量也非常感兴趣(我已经在这一领域做了 一些学术研究 )。欢迎您在留言板里分享您对防止留言垃圾的心得,同时始终欢迎您访问 Google 网站管理员支持论坛 并提出您的问题。