Back to Question Center
0

Semalt нь ваар, аалз, мөлхөгчийг хэрхэн яаж зохицуулах талаар зөвлөгөө өгдөг

1 answers:

хайлтын хөдөлгүүр нөхөрсөг вэбсайтуудыг үүсгэхээс гадна, .htaccess файл нь вебмассууд өөрсдийн вебсайт руу нэвтрэхийн тулд тодорхой вебсуудыг хаах боломжийг олгодог. Эдгээр роботуудыг блоклох нэг арга бол robots.txt файлаар дамждаг. Гэсэн хэдий ч хэрэглэгчийн амжилттай менежер Семальт Росс Барбер энэ хүсэлтийг үл тоомсорлож буй зарим мөлхөгчдийг харсан гэжээ. Хамгийн сайн арга зам бол тэдгээрийг индексжүүлэхээсээ өмнө .htaccess файлыг ашиглах явдал юм.

Эдгээр вакуумууд нь юу вэ

Эдгээр нь интернетээс интеграцийн зорилгоор шинэ контентыг устгахын тулд хайлтын системд ашигладаг програм хангамжийн төрөл юм.

Тэд дараах үүрэг гүйцэтгэдэг:

  • Холбогдох вэб хуудсаа үзэх
  • алдаатай HTML кодоо шалга
  • Тэд таны холбосон вэб хуудсуудыг хадгалж, вэб хуудсууд нь таны контент холбоосыг хардаг
  • Тэд таны агуулгыг индекс

Гэхдээ зарим вирусууд хортой бөгөөд таны вэбсайтыг хүсээгүй мессеж, спам илгээхийн тулд ихэвчлэн ашигладаг имэйл хаягууд болон маягтуудыг хайж олох. Зарим нь таны кодын аюулгүй байдлын цоорхойг хайдаг.

Вэб мөлхөгчийг хаахын тулд юу хийх хэрэгтэй вэ?

.htaccess файлыг ашиглахаасаа өмнө дараах зүйлсийг шалгах хэрэгтэй:

1. Таны сайт Apache сервер дээр ажиллаж байх ёстой. Өнөө үед вэб байршуулж буй компаниуд ч гэсэн тэдний ажлын талбарт хангалттай сайн байгаа бөгөөд шаардлагатай файл руу хандах боломжийг олгож байна.

2. Та өөрийн веб хуудсанд зочилсон цэгүүдийг олохын тулд та өөрийн вебсайт дахь түүхэн серверийн бүртгэлийг авах боломжтой байх ёстой.

Хэрэв та бүхнийг, тэр ч байтугай тустай гэж үзсэн хүмүүсийг блоклохгүй бол та бүх хортой вакуумуудыг хааж чадахгүй байх болно гэдгийг санаарай. Шинэ bots өдөр бүр гарч ирдэг ба ахмадууд нь өөрчлөгдсөн байдаг. Хамгийн үр дүнтэй арга бол кодоо хамгаалж, бүүтлэхэд хэцүү болгоно.

Болтыг таних

Ботуудыг IP хаягаар эсвэл тэдгээрийн HTTP толгойн хэсэгт илгээгдэх "User Agent String" -аас тодорхойлдог. Жишээ нь, Google "Googlebot"

ашигладаг.

Хэрэв та аль хэдийн .htaccess

ашиглан хаахыг хүсч байгаа bot нэртэй бол энэ жагсаалтыг 302 bot ашиглан танд хэрэгтэй байж болох юм.

Өөр нэг арга бол серверээс бүх лог файлуудыг татаж авах, текст засварлагч ашиглан нээх, сервер дээрх тэдний байрлал таны серверийн тохиргооноос хамааран өөрчлөгдөж болох юм. таны вэб хостоос тусламж авах.

Хэрэв та ямар хуудас руу зочлохыг мэддэг бол, эсвэл зочлох цаг бол хүсээгүй bot-тэй цуг ирдэг. Та эдгээр фонтын лог файлыг хайж болно.

Нэгэн удаа та блокуудаа хаах хэрэгтэй гэж тэмдэглэсэн. Дараа нь тэдгээрийг .htaccess файлд оруулж болно. Бүү хаах нь үүнийг зогсооход хангалттай биш гэдгийг анхаарна уу. Энэ нь шинэ IP эсвэл нэрээр буцаж ирж болно.

Тэднийг хэрхэн хаах вэ

.htaccess файлын хуулбарыг татаж авах. Шаардлагатай бол нөөцөлж авах.

Арга 1: IP-ийг хаах

Энэ код нь IP хаягийг 197.0.0.1

Эрэмбэлэх, зөвшөөрөх

197.0.0.1

-аас татгалзах

Эхний мөрөнд сервер таны заасан загваруудыг тааруулан бүх хүсэлтийг зөвшөөрөх болно.

Хоёр дахь мөр нь серверийг хориглодог хуудсыг

Арга 2: Хэрэглэгч агентаар хаалт хийх

Хамгийн хялбар арга бол Apache-ийн дахин бичмэл хөдөлгүүрийг ашиглах явдал юм

RewriteEngine On

RewriteCond% {HTTP_USER_AGENT} BotUserAgent

Дахин бичих дүрэм. - [F, L]

Эхний мөр нь дахин бичих модуль идэвхжсэнийг баталгаажуулдаг. Хоёрдугаар мөр нь дүрэмд хамаарах нөхцөл юм. 4 дэх мөрөнд "F" нь серверийг буцаах 403: "Л" гэж хэлэхэд энэ нь сүүлчийн дүрэм гэсэн үг юм.

Дараа нь .htaccess файлыг таны серверт байршуулж, одоо байгаа файлыг дарж бичих болно. Цаг хугацаа өнгөрөхөд та bot-ийн IP-г шинэчлэх хэрэгтэй болно. Хэрэв та алдаа гаргавал зөвхөн хийсэн нөөцөө оруулна уу.

November 29, 2017
Semalt нь ваар, аалз, мөлхөгчийг хэрхэн яаж зохицуулах талаар зөвлөгөө өгдөг
Reply