Otsingumootorite blokeerimine (piltidega)

Sisukord:

Otsingumootorite blokeerimine (piltidega)
Otsingumootorite blokeerimine (piltidega)

Video: Otsingumootorite blokeerimine (piltidega)

Video: Otsingumootorite blokeerimine (piltidega)
Video: Kuidas teha varukoopiaid? 2024, Mai
Anonim

Otsingumootorid on varustatud robotitega, mida nimetatakse ka ämblikeks või robotiteks, mis indekseerivad ja indekseerivad veebilehti. Kui teie sait või leht on väljatöötamisel või sisaldab tundlikku sisu, võiksite blokeerida robotite saidi indekseerimise ja indekseerimise. Siit saate teada, kuidas blokeerida veebisaite, lehti ja linke robots.txt -failidega ning blokeerida teatud lehed ja lingid html -siltidega. Lugege edasi, et teada saada, kuidas blokeerida teatud robotite juurdepääs teie sisule.

Sammud

Meetod 1 /2: otsingumootorite blokeerimine failidega robots.txt

576315 1
576315 1

Samm 1. Saate aru failidest robots.txt

Fail robots.txt on tavaline või ASCII tekstifail, mis teavitab otsingumootori ämblikke sellest, mis neil teie saidil lubatud on. Otsingumootori ämblikud ei tohi robots.txt -failis loetletud faile ja kaustu indekseerida. Teil võib vaja minna faili robots.txt, kui:

  • Soovite blokeerida konkreetse sisu otsingumootori ämblikelt.
  • Arendate reaalajas saiti ega ole valmis otsingumootori ämblike saidi indekseerimiseks ja indekseerimiseks
  • Soovite piirata juurdepääsu usaldusväärsetele robotitele.
576315 2
576315 2

Samm 2. Looge ja salvestage fail robots.txt

Faili loomiseks käivitage lihttekstiredaktor või koodiredaktor. Salvestage fail nimega: robots.txt. Faili nimi peab olema väike.

  • Ärge unustage tähti.
  • Faili salvestamisel valige laiend “.txt” '. Kui kasutate Wordi, valige suvand „Tavaline tekst”.
576315 3 1
576315 3 1

Samm 3. Kirjutage täielikult keelatud fail robots.txt

Võimalik on blokeerida iga hea mainega otsingumootori ämblik teie saidil indekseerimast ja indekseerimast failiga robots.txt. Kirjutage oma tekstifaili järgmised read:

    User-agent: * Keela: /

  • Robot.txt-faili täieliku keelamise kasutamine pole tungivalt soovitatav. Kui robot, näiteks Bingbot, seda faili loeb, ei indekseeri see teie saiti ja otsingumootor ei kuva teie veebisaiti.
  • Kasutajaagendid: see on teine termin otsingumootori ämblike või robotite kohta
  • *: tärn tähendab, et kood kehtib kõigi kasutajaagentide kohta
  • Keela: /: kaldkriips näitab, et kogu sait on robotitele keelatud
576315 4 1
576315 4 1

Samm 4. Kirjutage fail robots.txt tingimuslikult lubama

Kõigi robotite blokeerimise asemel kaaluge teatud ämblike blokeerimist saidi teatud piirkondadest. Tavalised tingimusliku lubamise käsud on järgmised:

  • Blokeerige konkreetne robot: asendage selle kõrval olevad tärnid Kasutaja agent koos googlebot, googlebot-uudised, googleboti pilt, bingbotvõi teoma.
  • Kataloogi ja selle sisu blokeerimine:

    User-agent: * Keela: /sample-directory /

  • Veebilehe blokeerimine:

    User-agent: * Keela: /private_file.html

  • Blokeeri pilt:

    User-agent: googlebot-image Keela: /images_mypicture.jpg

  • Blokeeri kõik pildid:

    User-agent: googlebot-image Keela: /

  • Blokeerige konkreetne failivorming:

    Kasutajaagent: * Keela: /p*.gif$

576315 5
576315 5

Samm 5. Julgustage roboteid oma saiti indekseerima ja roomama

Paljud inimesed soovivad blokeerimise asemel tervitada otsingumootori ämblikke, sest nad soovivad kogu saidi indekseerimist. Selle saavutamiseks on teil kolm võimalust. Esiteks võite loobuda faili robots.txt loomisest-kui robot ei leia faili robots.txt, jätkab ta kogu saidi indekseerimist ja indekseerimist. Teiseks saate luua tühja robots.txt faili-robot leiab faili robots.txt, tunneb ära, et see on tühi, ning jätkab saidi indekseerimist ja indekseerimist. Lõpuks võite kirjutada täielikult lubatud robots.txt-faili. Kasutage koodi:

    User-agent: * Keela:

  • Kui robot, näiteks googlebot, seda faili loeb, külastab ta julgelt kogu teie saiti.
  • Kasutajaagendid: see on teine termin otsingumootori ämblike või robotite kohta
  • *: tärn tähendab, et kood kehtib kõigi kasutajaagentide kohta
  • Keela: tühi keelamiskäsk näitab, et kõik failid ja kaustad on juurdepääsetavad
576315 6
576315 6

Samm 6. Salvestage txt -fail oma domeeni juure

Pärast faili robots.txt kirjutamist salvestage muudatused. Laadige fail üles oma saidi juurkataloogi. Näiteks kui teie domeen on www.yourdomain.com, asetage fail robots.txt aadressile www.yourdomain.com/robots.txt.

Meetod 2/2: otsingumootorite blokeerimine metasiltidega

576315 7
576315 7

Samm 1. Mõista HTML -robotite metasilte

Robotide metasilt võimaldab programmeerijatel määrata robotite või otsingumootori ämblike parameetreid. Neid silte kasutatakse selleks, et blokeerida robotite indekseerimine ja kogu saidi või ainult saidi osade indekseerimine. Neid märgendeid saate kasutada ka selleks, et blokeerida teatud otsingumootori ämblik teie sisu indekseerimast. Need sildid kuvatakse teie HTML -faili peas.

Seda meetodit kasutavad tavaliselt programmeerijad, kellel pole juurdepääsu veebisaidi juurkataloogile

576315 8
576315 8

Samm 2. Blokeerige robotid ühelt lehelt

Võimalik on blokeerida kõik robotid lehe indekseerimisest ja lehe linkide järgimisest. Seda märgendit kasutatakse tavaliselt siis, kui reaalajas sait on väljatöötamisel. Kui sait on valmis, on tungivalt soovitatav see silt eemaldada. Kui te märgendit ei eemalda, ei indekseerita teie lehte ega otsita otsingumootorite kaudu.

  • Saate blokeerida robotite lehe indekseerimise ja mis tahes linkide järgimise.
  • Saate blokeerida kõik robotid lehe indekseerimise:
  • Saate blokeerida kõik robotid lehe linkide järgimise:
576315 9
576315 9

Samm 3. Luba robotitel lehte indekseerida, kuid ärge järgige selle linke

Kui lubate robotitel lehte indekseerida, hakatakse lehte indekseerima; kui takistate ämblikel linkide järgimist, katkeb selle konkreetse lehe linkide tee teistele lehtedele. Sisestage päisesse järgmine koodirida:

576315 10
576315 10

Samm 4. Laske otsingumootori ämblikel järgida linke, kuid mitte lehte indekseerida

Kui lubate robotitel järgida linke, jääb selle konkreetse lehe linkide tee teistele lehtedele taktitundeks; kui piirate neil lehe indekseerimist, ei kuvata teie veebilehte indeksis. Sisestage päisesse järgmine koodirida:

576315 11
576315 11

Samm 5. Blokeerige üks väljuv link

Lehel ühe lingi peitmiseks manustage a rel märgend lingimärgendis. Võib -olla soovite seda märgendit kasutada linkide blokeerimiseks teistel lehtedel, mis viivad konkreetsele lehele, mille soovite blokeerida.

    Sisestage link blokeeritud lehele

576315 12
576315 12

Samm 6. Blokeerige konkreetne otsingumootori ämblik

Selle asemel, et blokeerida oma veebilehel kõik robotid, võiksite takistada ühel robotil lehe indekseerimist ja indekseerimist. Selle saavutamiseks asendage metasildis olev „robot” konkreetse roboti nimega. Näiteks: googlebot, googlebot-uudised, googleboti pilt, bingbotja teoma.

576315 13
576315 13

Samm 7. Julgustage roboteid oma lehte indekseerima ja indekseerima

Kui soovite tagada, et teie leht indekseeritakse ja selle linke järgitakse, saate sisestada jälgimisloa meta "robot" märkige oma päisesse. Kasutage järgmist koodi:

Soovitan: