Verkkosivuston indeksointi

Poimi sisältöä automaattisesti verkkosivustosi sivuilta

Aloita indeksointi

Yleiskatsaus

Verkkosivuston indeksoija löytää ja poimii automaattisesti sisältöä useilta verkkosivustosi sivuilta. Sen sijaan, että lisäisit sivuja yksitellen, voit indeksoida koko sivustosi (tai tietyt osiot) ja lisätä kaiken sisällön automaattisesti tekoälysi tietopohjaan.

Indeksoija seuraa linkkejä löytääkseen sivuja, poimii tekstisisällön ja käsittelee kaiken, jotta tekoälysi voi vastata verkkosivustoasi koskeviin kysymyksiin.

Indeksointitilat

Voit valita kahdesta indeksointitilasta tarpeidesi mukaan:

Automaattinen tila

Indeksoija aloittaa etusivultasi ja löytää automaattisesti sivuja seuraamalla linkkejä. Se tarkistaa myös sitemap.xml-tiedostosi, jos saatavilla. Paras koko verkkosivuston tai sen suurten osien indeksointiin.

Kaikki tilaukset

Manuaalinen tila

Määrität tarkat indeksoitavat URL-osoitteet (pilkuilla erotettuina). Indeksoija vierailee vain näillä tietyillä sivuilla. Paras, kun haluat lisätä vain tietyt sivut tietopohjaasi.

Indeksointirajat tilauksen mukaan

Indeksoitavien sivujen enimmäismäärä riippuu tilauksestasi:

Paketti Sivujen enimmäismäärä Manuaalinen tila Salasanasuojattu
Ilmainen 50 sivua
Starter 250 sivua
Standard 1 000 sivua
Pro 5 000 sivua

Salasanasuojatut sivut

Tarvitsetko indeksoida kirjautumisen takana olevia sivuja? Ota käyttöön "Salasanasuojatut sivut" -asetus indeksoidaksesi jäsensisältöä, kojelautoja tai muita verkkosivustosi salasanasuojattuja alueita.

Käyttöohjeet

  1. Ota käyttöön "Salasanasuojatut sivut" -kytkin indeksointisivulla
  2. Syötä kirjautumissivun URL-osoite (esim. yoursite.com/login)
  3. Syötä käyttäjätunnus/sähköposti ja salasana
  4. Napsauta Aloita indeksointi - järjestelmä kirjautuu ensin sisään ja indeksoi sitten suojatut sivut

Näin se toimii

Kun otat salasanasuojauksen käyttöön, indeksoija:

  1. Vierailee kirjautumissivullasi ja tunnistaa lomakekentät automaattisesti
  2. Lähettää kirjautumistietosi (mukaan lukien CSRF-tunnisteet)
  3. Ylläpitää todennetun istunnon indeksoinnin aikana
  4. Starts from where you're redirected after login (e.g., your dashboard)
  5. Löytää ja indeksoi kaikki suojatut sivut, jotka se löytää

Vinkki: Indeksoija tunnistaa automaattisesti lomakekentät (sähköposti, käyttäjätunnus, salasana) ja suojaustunnisteet, joten se toimii useimpien kirjautumislomakkeiden kanssa ilman lisämäärityksiä.

Lisäasetukset: Mukautetut kenttänimet

Jos kirjautumislomakkeesi käyttää epätyypillisiä kenttänimiä, laajenna "Lisäasetukset"-osio ja määritä:

  • Käyttäjätunnuskentän nimi - Lomakekentän nimi käyttäjätunnukselle/sähköpostille (esim. user_email)
  • Salasanakentän nimi - Lomakekentän nimi salasanalle (esim. user_pass)

Rajoitukset: Salasanasuojattu indeksointi toimii tavallisten HTML-kirjautumislomakkeiden kanssa. Se ei välttämättä toimi seuraavien kanssa:

  • JavaScript-based logins (React, Vue, Angular single-page apps)
  • CAPTCHA- tai reCAPTCHA-suojatut kirjautumiset
  • Kaksivaiheinen tunnistautuminen (2FA)
  • OAuth-kirjautumiset (Google, Facebook jne.)
  • Monivaiheinen kirjautuminen

Vinkki: Henkilökohtaisen tilisi sijaan harkitse erillisen tilin luomista nimenomaan indeksointia varten. Näin voit hallita tarkasti, mihin indeksoija pääsee käsiksi.

Parhaat käytännöt

Ennen indeksointia

  • Make sure your website is accessible and pages load correctly
  • Tarkista, että tärkeät sivut on linkitetty etusivultasi tai sivukartastasi
  • For password-protected crawls, verify your credentials work

Sivujen valitseminen

  • Start with your most important pages - product pages, FAQs, services
  • Käytä manuaalista tilaa, jos tarvitset vain tiettyjä sivuja
  • Vältä sivujen indeksointia, joissa on vanhentunutta tai virheellistä tietoa

Indeksoinnin jälkeen

  • Tarkastele indeksoitua sisältöä tietopohjassasi
  • Poista kaikki talteen otetut merkityksettömät sivut
  • Testaa tekoälyäsi kysymyksillä indeksoidusta sisällöstä
  • Indeksoi uudelleen säännöllisesti pitääksesi sisällön ajan tasalla

Huomautus: Jokainen uusi indeksointi korvaa edellisen kyseiselle verkkosivustolle. Tekoälysi käyttää aina viimeisimmän indeksoinnin sisältöä.

Indeksoitujen sivujen hallinta

Indeksoinnin valmistuttua voit esikatsella ja hallita yksittäisiä sivuja Tietopankki-osiossa Hallintapaneelissasi.

Sivun sisällön esikatselu

  1. Siirry kojelaudallesi ja avaa Tietopohja-osio
  2. Napsauta indeksointikohdetta avataksesi sen — näet listan kaikista indeksoiduista sivuista
  3. Click any page title to preview its extracted content
  4. Käytä Takaisin sivuille -painiketta palataksesi sivulistaan

Vinkki: Sivujen esikatselu on loistava tapa varmistaa, että indeksoija poimi oikean sisällön. Jos sivu näyttää väärältä, voit muokata sitä suoraan tai poistaa sen ja lisätä sisällön manuaalisesti.

Yksittäisten sivujen muokkaus

Voit muokata minkä tahansa indeksoidun sivun poimittua sisältöä. Tämä on hyödyllistä muotoiluvirheiden korjaamiseen, merkityksettömien osioiden poistamiseen tai puuttuvien tietojen lisäämiseen.

  1. Avaa indeksointikohde ja napsauta sivun otsikkoa nähdäksesi sen sisällön
  2. Napsauta Muokkaa-painiketta esikatselun yläosassa
  3. Muokkaa otsikkoa tai sisältöä tarpeen mukaan
  4. Napsauta Tallenna ja upota uudelleen — sivun tekoälyupotukset luodaan uudelleen päivitetyllä sisällöllä

Huomautus: Sivun muokkaaminen upottaa uudelleen vain kyseisen sivun, ei koko indeksointia. Muut indeksoidut sivusi eivät muutu.

Yksittäisten sivujen uudelleenindeksointi

Jos verkkosivustosi sivu on päivitetty, voit indeksoida uudelleen vain kyseisen sivun ilman koko sivuston uudelleenindeksointia.

  1. Avaa indeksointikohde Tietopohjastasi
  2. Click the re-crawl button next to the page you want to update
  3. Vahvista — sivu haetaan uudelleen ja sen upotukset päivitetään uusimmalla sisällöllä

Vinkki: Tämä on loistava tapa pitää yksittäiset sivut ajan tasalla sisältömuutosten jälkeen ilman satojen sivujen uudelleenindeksointia.

Yksittäisten sivujen poistaminen

Voit poistaa yksittäisiä sivuja indeksoinnista poistamatta koko indeksointia. Tämä on hyödyllistä merkityksettömien, päällekkäisten tai virheellisesti indeksoitujen sivujen poistamiseen.

  1. Avaa indeksointikohde Tietopohjastasi
  2. Napsauta poista -painiketta poistettavan sivun vieressä
  3. Vahvista poistaminen — sivu ja sen upotukset poistetaan pysyvästi

Huomautus: Jos poistat kaikki sivut indeksoinnista, koko indeksointimerkintä poistetaan automaattisesti tietopohjastasi.

Vianmääritys

Indeksointi palauttaa odotettua vähemmän sivuja

  • Sivuja ei ehkä ole linkitetty löydettäviltä sivuilta
  • Jotkin sivut saattavat olla robots.txt-tiedoston estämiä
  • Cloudflare tai muut tietoturvapalvelut saattavat estää indeksoijan
  • Solution: Use Manual mode to specify exact URLs

Salasanasuojattu indeksointi epäonnistuu

  • Varmista, että kirjautumistietosi ovat oikein
  • Tarkista, käyttääkö kirjautumisesi CAPTCHA:a tai 2FA:ta
  • Kokeile määrittää mukautetut kenttänimet Lisäasetuksissa
  • Sivustosi saattaa käyttää JavaScript-pohjaista todennusta (ei tuettu)

Vaihtoehdot, jos indeksointi ei toimi:

  • Tee sivuista väliaikaisesti julkisia, indeksoi ne ja ota suojaus sitten uudelleen käyttöön
  • Tallenna sivut HTML-tiedostoina ja lataa ne Joukkolataus-toiminnolla

Sisältö vaikuttaa puutteelliselta

  • Osa sisällöstä saattaa latautua JavaScriptin kautta (ei poimittu)
  • Sisältö saattaa olla kuvissa (ei poimittu tekstinä)
  • Ratkaisu: Lisää puuttuva sisältö manuaalisesti teksti- tai PDF-latauksen kautta