Verkkosivuston indeksointi
Poimi sisältöä automaattisesti verkkosivustosi sivuilta
Yleiskatsaus
Verkkosivuston indeksoija löytää ja poimii automaattisesti sisältöä useilta verkkosivustosi sivuilta. Sen sijaan, että lisäisit sivuja yksitellen, voit indeksoida koko sivustosi (tai tietyt osiot) ja lisätä kaiken sisällön automaattisesti tekoälysi tietopohjaan.
Indeksoija seuraa linkkejä löytääkseen sivuja, poimii tekstisisällön ja käsittelee kaiken, jotta tekoälysi voi vastata verkkosivustoasi koskeviin kysymyksiin.
Indeksointitilat
Voit valita kahdesta indeksointitilasta tarpeidesi mukaan:
Automaattinen tila
Indeksoija aloittaa etusivultasi ja löytää automaattisesti sivuja seuraamalla linkkejä. Se tarkistaa myös sitemap.xml-tiedostosi, jos saatavilla. Paras koko verkkosivuston tai sen suurten osien indeksointiin.
Kaikki tilauksetManuaalinen tila
Määrität tarkat indeksoitavat URL-osoitteet (pilkuilla erotettuina). Indeksoija vierailee vain näillä tietyillä sivuilla. Paras, kun haluat lisätä vain tietyt sivut tietopohjaasi.
Starter+Indeksointirajat tilauksen mukaan
Indeksoitavien sivujen enimmäismäärä riippuu tilauksestasi:
| Paketti | Sivujen enimmäismäärä | Manuaalinen tila | Salasanasuojattu |
|---|---|---|---|
| Ilmainen | 50 sivua | ||
| Starter | 250 sivua | ||
| Standard | 1 000 sivua | ||
| Pro | 5 000 sivua |
Salasanasuojatut sivut Starter+
Tarvitsetko indeksoida kirjautumisen takana olevia sivuja? Ota käyttöön "Salasanasuojatut sivut" -asetus indeksoidaksesi jäsensisältöä, kojelautoja tai muita verkkosivustosi salasanasuojattuja alueita.
Käyttöohjeet
- Ota käyttöön "Salasanasuojatut sivut" -kytkin indeksointisivulla
- Syötä kirjautumissivun URL-osoite (esim.
yoursite.com/login) - Syötä käyttäjätunnus/sähköposti ja salasana
- Napsauta Aloita indeksointi - järjestelmä kirjautuu ensin sisään ja indeksoi sitten suojatut sivut
Näin se toimii
Kun otat salasanasuojauksen käyttöön, indeksoija:
- Vierailee kirjautumissivullasi ja tunnistaa lomakekentät automaattisesti
- Lähettää kirjautumistietosi (mukaan lukien CSRF-tunnisteet)
- Ylläpitää todennetun istunnon indeksoinnin aikana
- Starts from where you're redirected after login (e.g., your dashboard)
- Löytää ja indeksoi kaikki suojatut sivut, jotka se löytää
Vinkki: Indeksoija tunnistaa automaattisesti lomakekentät (sähköposti, käyttäjätunnus, salasana) ja suojaustunnisteet, joten se toimii useimpien kirjautumislomakkeiden kanssa ilman lisämäärityksiä.
Lisäasetukset: Mukautetut kenttänimet
Jos kirjautumislomakkeesi käyttää epätyypillisiä kenttänimiä, laajenna "Lisäasetukset"-osio ja määritä:
- Käyttäjätunnuskentän nimi - Lomakekentän nimi käyttäjätunnukselle/sähköpostille (esim.
user_email) - Salasanakentän nimi - Lomakekentän nimi salasanalle (esim.
user_pass)
Rajoitukset: Salasanasuojattu indeksointi toimii tavallisten HTML-kirjautumislomakkeiden kanssa. Se ei välttämättä toimi seuraavien kanssa:
- JavaScript-based logins (React, Vue, Angular single-page apps)
- CAPTCHA- tai reCAPTCHA-suojatut kirjautumiset
- Kaksivaiheinen tunnistautuminen (2FA)
- OAuth-kirjautumiset (Google, Facebook jne.)
- Monivaiheinen kirjautuminen
Vinkki: Henkilökohtaisen tilisi sijaan harkitse erillisen tilin luomista nimenomaan indeksointia varten. Näin voit hallita tarkasti, mihin indeksoija pääsee käsiksi.
Parhaat käytännöt
Ennen indeksointia
- Make sure your website is accessible and pages load correctly
- Tarkista, että tärkeät sivut on linkitetty etusivultasi tai sivukartastasi
- For password-protected crawls, verify your credentials work
Sivujen valitseminen
- Start with your most important pages - product pages, FAQs, services
- Käytä manuaalista tilaa, jos tarvitset vain tiettyjä sivuja
- Vältä sivujen indeksointia, joissa on vanhentunutta tai virheellistä tietoa
Indeksoinnin jälkeen
- Tarkastele indeksoitua sisältöä tietopohjassasi
- Poista kaikki talteen otetut merkityksettömät sivut
- Testaa tekoälyäsi kysymyksillä indeksoidusta sisällöstä
- Indeksoi uudelleen säännöllisesti pitääksesi sisällön ajan tasalla
Huomautus: Jokainen uusi indeksointi korvaa edellisen kyseiselle verkkosivustolle. Tekoälysi käyttää aina viimeisimmän indeksoinnin sisältöä.
Indeksoitujen sivujen hallinta
Indeksoinnin valmistuttua voit esikatsella ja hallita yksittäisiä sivuja Tietopankki-osiossa Hallintapaneelissasi.
Sivun sisällön esikatselu
- Siirry kojelaudallesi ja avaa Tietopohja-osio
- Napsauta indeksointikohdetta avataksesi sen — näet listan kaikista indeksoiduista sivuista
- Click any page title to preview its extracted content
- Käytä Takaisin sivuille -painiketta palataksesi sivulistaan
Vinkki: Sivujen esikatselu on loistava tapa varmistaa, että indeksoija poimi oikean sisällön. Jos sivu näyttää väärältä, voit muokata sitä suoraan tai poistaa sen ja lisätä sisällön manuaalisesti.
Yksittäisten sivujen muokkaus Starter+
Voit muokata minkä tahansa indeksoidun sivun poimittua sisältöä. Tämä on hyödyllistä muotoiluvirheiden korjaamiseen, merkityksettömien osioiden poistamiseen tai puuttuvien tietojen lisäämiseen.
- Avaa indeksointikohde ja napsauta sivun otsikkoa nähdäksesi sen sisällön
- Napsauta Muokkaa-painiketta esikatselun yläosassa
- Muokkaa otsikkoa tai sisältöä tarpeen mukaan
- Napsauta Tallenna ja upota uudelleen — sivun tekoälyupotukset luodaan uudelleen päivitetyllä sisällöllä
Huomautus: Sivun muokkaaminen upottaa uudelleen vain kyseisen sivun, ei koko indeksointia. Muut indeksoidut sivusi eivät muutu.
Yksittäisten sivujen uudelleenindeksointi Starter+
Jos verkkosivustosi sivu on päivitetty, voit indeksoida uudelleen vain kyseisen sivun ilman koko sivuston uudelleenindeksointia.
- Avaa indeksointikohde Tietopohjastasi
- Click the re-crawl button next to the page you want to update
- Vahvista — sivu haetaan uudelleen ja sen upotukset päivitetään uusimmalla sisällöllä
Vinkki: Tämä on loistava tapa pitää yksittäiset sivut ajan tasalla sisältömuutosten jälkeen ilman satojen sivujen uudelleenindeksointia.
Yksittäisten sivujen poistaminen
Voit poistaa yksittäisiä sivuja indeksoinnista poistamatta koko indeksointia. Tämä on hyödyllistä merkityksettömien, päällekkäisten tai virheellisesti indeksoitujen sivujen poistamiseen.
- Avaa indeksointikohde Tietopohjastasi
- Napsauta poista -painiketta poistettavan sivun vieressä
- Vahvista poistaminen — sivu ja sen upotukset poistetaan pysyvästi
Huomautus: Jos poistat kaikki sivut indeksoinnista, koko indeksointimerkintä poistetaan automaattisesti tietopohjastasi.
Vianmääritys
Indeksointi palauttaa odotettua vähemmän sivuja
- Sivuja ei ehkä ole linkitetty löydettäviltä sivuilta
- Jotkin sivut saattavat olla robots.txt-tiedoston estämiä
- Cloudflare tai muut tietoturvapalvelut saattavat estää indeksoijan
- Solution: Use Manual mode to specify exact URLs
Salasanasuojattu indeksointi epäonnistuu
- Varmista, että kirjautumistietosi ovat oikein
- Tarkista, käyttääkö kirjautumisesi CAPTCHA:a tai 2FA:ta
- Kokeile määrittää mukautetut kenttänimet Lisäasetuksissa
- Sivustosi saattaa käyttää JavaScript-pohjaista todennusta (ei tuettu)
Vaihtoehdot, jos indeksointi ei toimi:
- Tee sivuista väliaikaisesti julkisia, indeksoi ne ja ota suojaus sitten uudelleen käyttöön
- Tallenna sivut HTML-tiedostoina ja lataa ne Joukkolataus-toiminnolla
Sisältö vaikuttaa puutteelliselta
- Osa sisällöstä saattaa latautua JavaScriptin kautta (ei poimittu)
- Sisältö saattaa olla kuvissa (ei poimittu tekstinä)
- Ratkaisu: Lisää puuttuva sisältö manuaalisesti teksti- tai PDF-latauksen kautta