Indeksiranje spletnega mesta
Samodejno izvlecite vsebino s strani vašega spletnega mesta
Pregled
Indeksirnik spletnega mesta samodejno odkriva in izvleče vsebino z več strani na vašem spletnem mestu. Namesto dodajanja strani eno po eno lahko indeksirate celotno spletno mesto (ali določene razdelke) in samodejno dodate vso vsebino v bazo znanja vaše UI.
Indeksirnik sledi povezavam za odkrivanje strani, izvleče besedilno vsebino in obdela vse, da lahko vaša UI odgovarja na vprašanja o vašem spletnem mestu.
Načini indeksiranja
Izbirate lahko med dvema načinoma indeksiranja glede na vaše potrebe:
Samodejni način
Indeksirnik začne z vaše domače strani in samodejno odkriva strani s sledenjem povezavam. Preveri tudi vaš sitemap.xml, če je na voljo. Najbolje za indeksiranje celotnega spletnega mesta ali velikih delov.
Vsi načrtiRočni način
Navedete natančne URL-je za indeksiranje (ločene z vejicami). Indeksirnik obišče samo te določene strani. Najbolje, ko želite v bazo znanja dodati samo določene strani.
Starter+Omejitve indeksiranja po načrtu
The maximum number of pages you can crawl depends on your plan:
| Načrt | Največ strani | Ročni način | Zaščiteno z geslom |
|---|---|---|---|
| Brezplačno | 50 strani | ||
| Starter | 250 strani | ||
| Standard | 1.000 strani | ||
| Pro | 5.000 strani |
Strani zaščitene z geslom Starter+
Potrebujete indeksiranje strani za prijavo? Omogočite možnost "Strani zaščitene z geslom" za indeksiranje vsebine samo za člane, nadzornih plošč ali katerih koli z geslom zaščitenih območij vašega spletnega mesta.
Kako uporabiti
- Omogočite stikalo "Strani zaščitene z geslom" na strani za indeksiranje
- Vnesite URL prijavne strani (npr.
yoursite.com/login) - Vnesite svoje uporabniško ime/e-pošto in geslo
- Kliknite Začni indeksiranje - sistem se bo najprej prijavil, nato indeksiral zaščitene strani
Kako deluje
Ko omogočite zaščito z geslom, indeksirnik:
- Obišče vašo prijavno stran in samodejno zazna polja obrazca
- Pošlje vaše poverilnice (vključno z morebitnimi žetoni CSRF)
- Ohranja avtenticirano sejo med indeksiranjem
- Začne od tam, kamor ste preusmerjeni po prijavi (npr. vaša nadzorna plošča)
- Odkriva in indeksira vse zaščitene strani, ki jih najde
Nasvet: Indeksirnik samodejno zaznava polja obrazca (e-pošta, uporabniško ime, geslo) in varnostne žetone, zato deluje z večino prijavnih obrazcev brez dodatne konfiguracije.
Napredno: Prilagojena imena polj
Če vaš prijavni obrazec uporablja nestandardna imena polj, razširite razdelek "Napredno" in navedite:
- Ime polja uporabniškega imena - Ime polja obrazca za uporabniško ime/e-pošto (npr.
user_email) - Ime polja gesla - Ime polja obrazca za geslo (npr.
user_pass)
Omejitve: Indeksiranje zaščiteno z geslom deluje s standardnimi prijavnimi obrazci HTML. Morda ne bo delovalo z:
- JavaScript-based logins (React, Vue, Angular single-page apps)
- Prijavami, zaščitenimi s CAPTCHA ali reCAPTCHA
- Dvofaktorsko avtentikacijo (2FA)
- Prijavami OAuth (Google, Facebook itd.)
- Večstopenjskimi prijavnimi postopki
Nasvet: Namesto uporabe osebnega računa razmislite o ustvarjanju namenskega računa posebej za indeksiranje. To vam omogoča natančen nadzor nad tem, do česa ima indeksirnik dostop.
Najboljše prakse
Pred indeksiranjem
- Make sure your website is accessible and pages load correctly
- Check that important pages are linked from your homepage or sitemap
- Za indeksiranje zaščiteno z geslom preverite, da vaše poverilnice delujejo
Izbira strani
- Start with your most important pages - product pages, FAQs, services
- Uporabite ročni način, če potrebujete samo določene strani
- Izogibajte se indeksiranju strani z zastarelimi ali netočnimi informacijami
Po indeksiranju
- Preglejte indeksirano vsebino v svoji bazi znanja
- Odstranite morebitne nepomembne strani, ki so bile zajete
- Preizkusite svojo UI z vprašanji o indeksirani vsebini
- Redno ponovno indeksirajte, da vsebina ostane posodobljena
Opomba: Vsako novo indeksiranje nadomesti prejšnje za to spletno mesto. Vaša UI bo vedno uporabljala nazadnje indeksirano vsebino.
Upravljanje indeksiranih strani
Ko je indeksiranje zaključeno, lahko predogledate in upravljate posamezne strani iz razdelka Baza znanja na vaši nadzorni plošči.
Predogled vsebine strani
- Pojdite na svojo nadzorno ploščo in odprite razdelek Baza znanja
- Kliknite na postavko indeksiranja, da jo odprete — videli boste seznam vseh indeksiranih strani
- Kliknite kateri koli naslov strani za predogled izvlečene vsebine
- Uporabite gumb Nazaj na strani za vrnitev na seznam strani
Nasvet: Predogled strani je odličen način za preverjanje, ali je indeksirnik izvlekel pravo vsebino. Če stran izgleda napačno, jo lahko neposredno uredite ali izbrišete in namesto tega ročno dodate vsebino.
Urejanje posameznih strani Starter+
Izvlečeno vsebino katere koli indeksirane strani lahko uredite. To je uporabno za odpravljanje težav z oblikovanjem, odstranjevanje nepomembnih razdelkov ali dodajanje manjkajočih informacij.
- Open the crawl item and click a page title to view its content
- Kliknite gumb Uredi na vrhu predogleda
- Po potrebi spremenite naslov ali vsebino
- Kliknite Shrani in znova vdelaj — vdelave UI strani bodo regenerirane s posodobljeno vsebino
Opomba: Urejanje strani znova vdela samo to določeno stran, ne celotnega indeksiranja. Vaše druge indeksirane strani niso prizadete.
Ponovno brskanje posameznih strani Starter+
Če je bila stran na vaši spletni strani posodobljena, lahko znova prebrskate samo to stran brez ponovnega brskanja celotne spletne strani.
- Odprite postavko indeksiranja iz vaše baze znanja
- Click the re-crawl button next to the page you want to update
- Potrdite — stran bo znova pridobljena in njene vložitve posodobljene z najnovejšo vsebino
Nasvet: To je odlično za ohranjanje posameznih strani posodobljenih po spremembah vsebine, brez potrebe po ponovnem brskanju stotin strani.
Brisanje posameznih strani
Določene strani lahko odstranite iz indeksiranja, ne da bi izbrisali celotno indeksiranje. To je uporabno za odstranjevanje nepomembnih, podvojenih ali napačno indeksiranih strani.
- Odprite postavko indeksiranja iz vaše baze znanja
- Kliknite gumb izbriši poleg strani, ki jo želite odstraniti
- Potrdite brisanje — stran in njene vdelave bodo trajno odstranjene
Opomba: Če izbrišete vse strani iz indeksiranja, bo celoten vnos indeksiranja samodejno odstranjen iz vaše baze znanja.
Odpravljanje težav
Indeksiranje vrne manj strani kot pričakovano
- Strani morda niso povezane z odkrivnih strani
- Nekatere strani so morda blokirane z robots.txt
- Cloudflare ali druge varnostne storitve lahko blokirajo indeksirnik
- Solution: Use Manual mode to specify exact URLs
Indeksiranje zaščiteno z geslom ne uspe
- Preverite, da so vaše poverilnice pravilne
- Preverite, ali vaša prijava uporablja CAPTCHA ali 2FA
- Poskusite navesti prilagojena imena polj v naprednih nastavitvah
- Your site might use JavaScript-based authentication (not supported)
Alternative, če indeksiranje ne deluje:
- Začasno naredite strani javne, jih indeksirajte, nato znova omogočite zaščito
- Shranite strani kot datoteke HTML in jih naložite prek množičnega nalaganja
Vsebina se zdi nepopolna
- Nekatera vsebina se morda nalaga prek JavaScripta (ni izvlečena)
- Vsebina je morda v slikah (ni izvlečena kot besedilo)
- Rešitev: Ročno dodajte manjkajočo vsebino prek nalaganja besedila ali PDF