当前位置:首页 > 站长资讯 > 正文内容

【说站】nginx宝塔面板如何屏蔽垃圾蜘蛛禁止抓取不影响火车头发布

yc8882年前 (2022-07-27)站长资讯284

最近查看服务器日志,发现一些垃圾蜘蛛,一直爬行很多,比如以下这些垃圾,太烦人了,就想着如何屏蔽这些垃圾蜘蛛,但是又想着不影响火车头的发布。查了一些资料,下面把技巧分享给大家。

Mozilla/5.0 (compatible; SemrushBot/6~bl; +http://www.semrush.com/bot.html)"Mozilla/5.0 (compatible; AhrefsBot/6.1; +http://ahrefs.com/robot/)"

本人一直使用的linux系统服务器宝塔面板管理,个人感觉比较方便。网上查找方法,屏蔽这些垃圾。

网上找到的代码如下:目前为止比较好用。

#禁止Scrapy等工具的抓取if ($http_user_agent ~* (Scrapy|Curl|HttpClient)) {return 403;}#禁止指定UA及UA为空的访问if ($http_user_agent ~* "FeedDemon|Indy Library|Alexa Toolbar|AskTbFXTV|AhrefsBot|CrawlDaddy|CoolpadWebkit|Java|Feedly|UniversalFeedParser|ApacheBench|Microsoft URL Control|Swiftbot|ZmEu|oBot|jaunty|Python-urllib|lightDeckReports Bot|YYSpider|DigExt|HttpClient|MJ12bot|heritrix|Bytespider|Ezooms|Googlebot|JikeSpider|SemrushBot|^$" ) {return 403;}#禁止非GET|HEAD|POST方式的抓取if ($request_method !~ ^(GET|HEAD|POST)$) {return 403;}

宝塔面板下使用方法如下:

1、找到文件目录/www/server/nginx/conf文件夹下面,新建一个文件

agent_deny.conf

内容就是以上代码。


nginx宝塔面板如何屏蔽垃圾蜘蛛禁止抓取不影响火车头发布

2.找到网站设置里面的第7行左右 写入代码: include agent_deny.conf;



nginx宝塔面板如何屏蔽垃圾蜘蛛禁止抓取不影响火车头发布

如果你网站使用火车头采集发布,使用以上代码会返回403错误,发布不了的。如果想使用火车头采集发布,请使用下面的代码


#禁止Scrapy等工具的抓取if ($http_user_agent ~* (Scrapy|Curl|HttpClient)) {return 403;}#禁止指定UA访问。UA为空的可以访问,比如火车头可以正常发布。if  ($http_user_agent ~ "FeedDemon|Indy Library|Alexa Toolbar|AskTbFXTV|AhrefsBot|CrawlDaddy|CoolpadWebkit|Java|Feedly|UniversalFeedParser|ApacheBench|Microsoft URL Control|Swiftbot|ZmEu|YandexBot|jaunty|Python-urllib|lightDeckReports Bot|YYSpider|DigExt|HttpClient|MJ12bot|heritrix|Bytespider|Ezooms|Googlebot|JikeSpider|SemrushBot" ) {return 403;             }#禁止非GET|HEAD|POST方式的抓取if ($request_method !~ ^(GET|HEAD|POST)$) {return 403;}

最后重启重启nginx,就可以在网站日志里看到防御效果了。

nginx宝塔面板如何屏蔽垃圾蜘蛛禁止抓取不影响火车头发布


本站发布的内容若侵犯到您的权益,请邮件联系站长删除,我们将及时处理!


从您进入本站开始,已表示您已同意接受本站【免责声明】中的一切条款!


本站大部分下载资源收集于网络,不保证其完整性以及安全性,请下载后自行研究。


本站资源仅供学习和交流使用,版权归原作者所有,请勿商业运营、违法使用和传播!请在下载后24小时之内自觉删除。


若作商业用途,请购买正版,由于未及时购买和付费发生的侵权行为,使用者自行承担,概与本站无关。


本文链接:https://www.10zhan.com/zhanzhang/7453.html

分享给朋友:

“【说站】nginx宝塔面板如何屏蔽垃圾蜘蛛禁止抓取不影响火车头发布” 的相关文章

【说站】宝塔站点日志文件过大怎么办?网站日志切割教程

【说站】宝塔站点日志文件过大怎么办?网站日志切割教程

宝塔面板日志文件过大的原因?宝塔面板的网站日志文件默认是生成一个日志文件,然后系统每天不断的对这个文件进行写入操作,这样日子长了,这个日志文件就会越来越大,几百兆、几个G都是蛮正常的,这样对于我们分析...

【说站】删除WordPress页脚的 由WordPress强力驱动

【说站】删除WordPress页脚的 由WordPress强力驱动

所周知目前最新版的WordPress搭建的个人博客的2020主题(Twenty_Twenty)在网页的末端会有“由WordPress强力驱动”链接跳转字样,即WordPress的商业推广。作为网站搭建...

【说站】未能与站点联系来检查致命错误,因此PHP修改已被回滚解决办法

【说站】未能与站点联系来检查致命错误,因此PHP修改已被回滚解决办法

今天在小鸟云新购了一台轻量服务器,默认安装了WordPress,在修改默认主题模板文件的时候,点击“更新文件”出现以下提示:未能与站点联系来检查致命错误,因此PHP修改已被回滚。您需要采用其他方式(如...

【说站】Vultr的Without SELinux是什么意思?如何选择

【说站】Vultr的Without SELinux是什么意思?如何选择

Vultr官网上我们在进行服务器部署的时候,可以选择的操作系统有很多,包括Windows系统和主流的Linux系统CentOS、Ubuntu、Debian等,如下图所示:但当我们选择Linux系统:C...

【说站】360右下角弹窗广告如何关闭?360浏览器游戏广告关闭方法

【说站】360右下角弹窗广告如何关闭?360浏览器游戏广告关闭方法

最简单的方法就是换成360极速版!如果不愿意换的话则如下:360的广告弹窗特别烦人,电脑开机总是弹出360安全卫士的开机助手新闻弹窗窗口怎么办?电脑运行过程中不定时的弹出360新闻弹窗窗口如何解决?怎...

【说站】宝塔面板上行下行 总发送 总接收是什么意思

【说站】宝塔面板上行下行 总发送 总接收是什么意思

下图是宝塔面板后台云服务器的上行速度、下行速度、总发送、总接收流量图,橘红色代表的是上行速度曲线,蓝色代表的是下行速度曲线,鼠标移动到一个时间点,会显示上行和下行的网速,右上角“全部”可以选择网卡。网...