欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  网络运营

apache使用.htaccess文件实现屏蔽wget下载网站内容

程序员文章站 2023-11-08 09:40:04
经发现,虽然wget遵循 robots.txt 规则,但是那个还是可以绕过去,现在把我自己使用的屏蔽方法分享给大家: 1. 屏蔽下载任何文件 .htaccess...

经发现,虽然wget遵循 robots.txt 规则,但是那个还是可以绕过去,现在把我自己使用的屏蔽方法分享给大家:

1. 屏蔽下载任何文件

.htaccess

setenvifnocase user-agent "^wget" bad_bot
<limit get post>
  order allow,deny
  allow from all
  deny from env=bad_bot
</limit>

2. 屏蔽下载部分文件

.htaccess

setenvifnocase user-agent "^wget" bad_bot
setenvifnocase user-agent "^wget/1.5.3" bad_bot
setenvifnocase user-agent "^wget/1.6" bad_bot
<files ~ "\.(html|pdf|mp3|zip|rar|exe|gif|jpe?g|png|php|jsp) $">
order allow,deny
allow from all
deny from env=bad_bot
</files>