[조연호]님이 남기신 글:
>지난번에도 질문을 드렸는데 자세한 답변 감사합니다.
>
>검색로봇의 사이트 접속을 퇴치할 수 있는 방법은 없는지요.. 개인홈인데도 감당하기 힘든 접속량으로 트레픽제한에 걸리는지라 하루에 거의 절반은 사용을 못하고 있습니다...
>답변부탁드립니다...
========================================
웹호스팅 업체의 서버라면 .htaccess 파일을 사용할 수 있어야 합니다.
이것은 직접 웹호스팅 업체에 문의해서 파일 이름이 어떻게 되는지
정확하게 알아야 합니다.
'각 가상호스트마다 따로 설정하는 access 파일(예:.htaccess) 이름은
무엇입니까?'
라고 문의하면 됩니다.
만약 .htaccess 파일이라면, 최상위 DocumentRoot
(홈페이지 최상위의 디렉토리)에 .htaccess 파일을 만들고,
-- .htaccess -------------------------------------
BrowserMatchNocase "WebZIP" is_a_robot deny_robot
BrowserMatchNocase "Teleport" is_a_robot deny_robot
BrowserMatchNocase "GetRight" is_a_robot
BrowserMatchNocase "Namo" is_a_robot deny_robot
BrowserMatchNocase "ApacheBench" is_a_robot deny_robot
BrowserMatchNocase "Wget" is_a_robot deny_robot
BrowserMatchNoCase "robot" do_not_log is_a_robot
BrowserMatchNoCase "Spider" do_not_log is_a_robot
BrowserMatchNoCase "[a-zA-Z]@[a-zA-Z]" do_not_log is_a_robot
BrowserMatchNoCase "Slurp/si" do_not_log is_a_robot
BrowserMatchNoCase "Mercator" do_not_log is_a_robot
BrowserMatchNoCase "Gulliver" do_not_log is_a_robot
BrowserMatchNoCase "SyncIT/" do_not_log is_a_robot
BrowserMatchNoCase "FAST-WebCrawler" do_not_log is_a_robot
BrowserMatchNoCase "Lycos_Spider" do_not_log is_a_robot
BrowserMatchNoCase "^ia_archive" do_not_log is_a_robot
BrowserMatchNoCase "^tv" do_not_log is_a_robot
BrowserMatchNoCase "Scooter" do_not_log is_a_robot
BrowserMatchNoCase "ZyBorg/" do_not_log is_a_robot
BrowserMatchNoCase "KIT-Fireball" do_not_log is_a_robot
BrowserMatchNoCase "Googlebot/" do_not_log is_a_robot
BrowserMatchNoCase "DIIbot/" do_not_log is_a_robot
BrowserMatchNoCase "teoma" do_not_log is_a_robot
Deny from env=is_a_robot
------------------------------------------
이렇게 입력하고 저장하면 됩니다.
물론 완벽하지는 않지만 어느 정도는 막을 수 있을 겁니다.
http://linuxchannel.net/?vhost=server
http://linuxchannel.net/docs/apache_log.txt
을 참고하세요. |