搜索页被恶意搜索词留痕的几个解决方法,以防止被K站排名

网站的默认搜索页是存在将搜索内容变为标题的规则的,本意是为了自站SEO,但未加以限制(如敏感词拦截),这就给了非法人员可乘之机,他们可以利用你的搜索页将他们的词条收录,进行非法推广获利。解决办法是有的,比如设置robot.txt,但刷的多了,还是会被意外收录。因为有很多站长的站点经常被恶意搜索违禁词、广告引蜘蛛到页面进行留痕,本文介绍几个方法,来防止这些问题。

搜索留痕排名技术属于黑帽技术层面,是指利用某些网站的搜索功能,批量生成包含自身广告关键词的页面,并使其被搜索引擎收录,借助这些网站在搜索引擎上的权重,促使自己的关键词快速参与排名,以此实现引流拓客的目的。然而,这种做法对被利用的网站极为不利,大量无实际作用的搜索聚合页面被收录后,会严重影响网站权重和排名,甚至可能致使网站面临被K站的风险。因此,建议站长们查看自己的站点有无此“漏洞”,若有则需尽快修补。

由于我使用的是wordpress子比主题,所以以下内容会基于子比主题来操作,其它主题模板及程序网站也可以参考此内容。

主要是为了防止恶意人员,借用你网站的搜索功能,在搜索引擎留下痕迹导致的K站降低排名。

表现方式为:site你的网站发现以下内容。

图片[1]-搜索页被恶意搜索词留痕的几个解决方法,以防止被K站排名-王先生笔记

删除搜索标题仅保留网站名防止搜索留痕

原修改方法来自子比论坛(李初一):https://www.zibll.com/forum-post/28383.html

但此方法修改后,在主题更新时会覆盖为原版,所以我对其进行了二次开发,是更新免修改版本。

此为我在子比论坛分享的帖子:https://www.zibll.com/forum-post/30560.html

发布时间2024年11月1日,主题版本8.0,后续是否可用,自测。

不过这个函数以及文件,主题作者很久没动过了,应该可以适用几个版本。

在主题根目录创建func.php文件,填入<?php,换行填入以下代码(如果有,当我没说)。

在主题根目录创建wxs_new_search.php文件,文件内填入以下代码。

原理就是将代码中的标题及描述,改为只输出xx网站的搜索结果,而不是原本的xxx搜索词+网站名的搜索结果,这样输出的HTML中就不会有搜索词,这样就留不下痕迹了。

设置robot.txt防止搜索引擎收录搜索页

如果你不考虑收录搜索页带来的流量,可以设置robot.txt,告知搜索引擎不要收录搜索页。

如:我的搜索url为:/?=搜索内容

图片[2]-搜索页被恶意搜索词留痕的几个解决方法,以防止被K站排名-王先生笔记

那么我就可以在robot.txt添加

Disallow:/?s=*
图片[3]-搜索页被恶意搜索词留痕的几个解决方法,以防止被K站排名-王先生笔记

robots.txt文件一般放置在网站根目录,如果你的网站有使用框架,请放置在运行目录或模板目录,最终要实现的是当访问域名/robots.txt时,结果为上图所示的规则,如果不是,请询问你所使用程序的开发者。

此方法会告知搜索引擎不要收录搜索页面,也就防止了被收录的问题,但会有可能被收录,原因不得而知,我猜是刷的多了,而部分搜索引擎未更新你站点设置的robot.txt所导致的问题。

设置WAF验证防止搜索引擎获取内容

WAF使用正则模式,以人机验证方式防御搜索,下面以宝塔及子比主题为例

宝塔nginx防火墙,url增强模式,类型正则匹配,url规则^/,参数s,方法为跳转验证,以此防御搜索被搜索引擎蜘蛛爬取。

类型正则匹配,url规则^/user_sign,参数tab,方法为跳转验证,以此防御登录接口。

图片[4]-搜索页被恶意搜索词留痕的几个解决方法,以防止被K站排名-王先生笔记

原理就是此链接先验证是否为人机,因为搜索引擎蜘蛛和非法人员发布违规词都用的是机器人工具,而不是正常浏览器,所以可以拦截。

搜索页面人机验证防止恶意搜索

wordpress的搜索一直以来不是很好,没有分词搜索(下文未提供此缺点的解决方法,但确实有替代方案,如果有人需要,可以评论在本文,后续我会考虑发布分享),并且性能极差,同时搜索的人多时,数据库查询压力过大,从而给服务器带来过大的负载压力,严重时会导致站点奔溃。

wordpress为搜索增加敏感词拦截

如果你还需要搜索页为你增加收录,你可以看看下文,注意,内存较低的服务器不要使用

使用AI搜索代替原有搜索

AI使用你网站的文章知识库,快速,高效,为你找到最相关的文章,比wordpress自带的搜索快了不知多少倍,而且无需完全匹配,自然语言提问,自然语言回答

证明本文有效,恶意搜索者攻击我站记录

我非常建议你使用WAF以及验证码的方案,因为之前我为搜索增加了敏感词拦截,攻击者狗急跳墙,使用数万被入侵的肉鸡电脑IP地址,对我站进行了猛烈的攻击,当时PHP建立了很多任务,导致内存爆满,站点无法被访问。截至到本文发布时,他还在攻击本站,但现在事实如你所见,使用WAF和验证码后,站点还是可以正常访问的。

请求攻击IP主要分布在福建,贵州,浙江,江苏,及海外

同时还有全国各地的IP

省份统计

图片[5]-搜索页被恶意搜索词留痕的几个解决方法,以防止被K站排名-王先生笔记

IP请求统计

图片[6]-搜索页被恶意搜索词留痕的几个解决方法,以防止被K站排名-王先生笔记

75万条请求

图片[7]-搜索页被恶意搜索词留痕的几个解决方法,以防止被K站排名-王先生笔记

PHP占用拉满

图片[8]-搜索页被恶意搜索词留痕的几个解决方法,以防止被K站排名-王先生笔记

上次是CDN被刷流量,这次是被刷硬件占用。我一个打工人,没空跟你们耗,每天熬夜运维很难的。

如果本文对你有帮助,请点个赞再走吧。

原文链接(非王先生笔记发布均为盗版):https://wxsnote.cn/5583.html

评论后可接收该文章的更新邮箱通知
友情赞助

如果你喜欢我的内容,可以赞助我哦!你的一点点心意,是我不断前进的动力!
温馨提示: 本文最后更新于2025-01-06 21:39:35,某些文章具有时效性,若有错误或已失效,请在下方留言或加入QQ群: 399019539 联系群主反馈。注意一些链接无法访问可能是你网络的原因,如Github,并非资源地址失效。
© 版权声明
THE END
喜欢就支持一下吧
点赞15 分享
评论 共11条

请登录后发表评论

    请登录后查看评论内容

王先生笔记