由于网站是一个论坛,其内容都是用户发的,内容中有很多 类似:参考出自:www.xxx.com,原文:www.xxxx.com,可以访问我的博客:www.xxxxx.com,你可以上这里看看:www.xxxxx.com 等等等。。 当刚发帖子的时候,这些链接都是可以正常访问的,可是过了一段时间后大部分链接失效了,所以现在出现这样一个情况,大部分来自搜索引擎的朋友,看到帖子后,点击用户留下的参考地址后发现页面都打不开,一个两个打不开还行,但是现在大部分都打不开,用户体验造成了极坏的影响,所以现在想先将失效的链接删除,然后在用户跟帖的时候加一个分析内容的功能,就是匹配出链接地址,将其入库,定时分析入库的地址。请大家想想具体的方案,该如何设计比较合理呢? 还有目前先想个如何高效,快速的查找站点下失效的链接的办法(只当一个脚本运行,检测出失效的链接,并记录出页面地址,方便站长删除)。