Nettstedgjennomsøking
Trekk ut innhold fra nettsidene dine automatisk
Oversikt
Nettstedscrawleren oppdager og trekker ut innhold fra flere sider på nettstedet ditt automatisk. I stedet for å legge til sider en etter en, kan du crawle hele nettstedet (eller bestemte deler) og få alt innholdet lagt til i AI-ens kunnskapsbase automatisk.
Crawleren følger lenker for å oppdage sider, trekker ut tekstinnhold og behandler alt slik at AI-en din kan svare på spørsmål om nettstedet ditt.
Automatisk innholdsutvidelse
Hvis nettstedet ditt er bygget på en populær plattform som WordPress, Shopify, WooCommerce, Drupal, Squarespace eller Strapi, henter crawleren automatisk ekstra strukturert innhold ved siden av vanlige sider — for eksempel hele produktkatalogen din, blogginnlegg, kategorier og oppføringer.
Du trenger ikke å konfigurere noe. Hvis nettstedet ditt er bygget på en støttet plattform, får AI-en din automatisk rikere og bedre organisert kunnskap.
Crawlingsmoduser
Du kan velge mellom to crawlingsmoduser avhengig av dine behov:
Automatisk modus
Crawleren starter fra hjemmesiden din og oppdager sider automatisk ved å følge lenker. Den sjekker også sitemap.xml hvis tilgjengelig. Best for crawling av hele nettstedet eller store deler av det.
Alle planerManuell modus
Du angir eksakte URL-er som skal crawles (kommaseparert). Crawleren besøker kun disse spesifikke sidene. Best når du bare vil ha bestemte sider lagt til i kunnskapsbasen din.
Starter+Crawlingsgrenser per plan
Maksimalt antall sider du kan crawle avhenger av planen din:
| Abonnement | Maks sider | Manuell modus | Passordbeskyttet |
|---|---|---|---|
| Free | 50 sider | ||
| Starter | 250 sider | ||
| Standard | 1 000 sider | ||
| Pro | 5 000 sider |
Passordbeskyttede sider Starter+
Trenger du å gjennomsøke sider bak en innlogging? Aktiver alternativet «Passordbeskyttede sider» for å gjennomsøke innhold kun for medlemmer, dashbord eller andre passordbeskyttede områder av nettsiden din.
Slik bruker du det
- Aktiver «Passordbeskyttede sider»-bryteren på gjennomsøkingssiden
- Skriv inn URL-en til innloggingssiden (f.eks.
yoursite.com/login) - Skriv inn brukernavn/e-post og passord
- Klikk Start gjennomsøking – systemet logger inn først, og gjennomsøker deretter beskyttede sider
Slik fungerer det
Når du aktiverer passordbeskyttelse, vil gjennomsøkeren:
- Besøke innloggingssiden din og oppdage skjemafeltene automatisk
- Sende inn legitimasjonen din (inkludert eventuelle CSRF-tokener)
- Opprettholde den autentiserte økten under gjennomsøking
- Starter fra der du blir videresendt etter innlogging (f.eks. dashbordet ditt)
- Oppdage og gjennomsøke alle beskyttede sider den finner
Tips: Gjennomsøkeren oppdager automatisk skjemafelter (e-post, brukernavn, passord) og sikkerhetstokener, så den fungerer med de fleste innloggingsskjemaer uten ekstra konfigurasjon.
Avansert: Egendefinerte feltnavn
Hvis innloggingsskjemaet ditt bruker ikke-standard feltnavn, utvid «Avansert»-seksjonen og spesifiser:
- Feltnavn for brukernavn - Skjemafeltnavnet for brukernavn/e-post (f.eks.
user_email) - Feltnavn for passord - Skjemafeltnavnet for passord (f.eks.
user_pass)
Begrensninger: Passordbeskyttet gjennomsøking fungerer med standard HTML-innloggingsskjemaer. Det fungerer kanskje ikke med:
- JavaScript-baserte innlogginger (React, Vue, Angular enkeltsideapper)
- CAPTCHA- eller reCAPTCHA-beskyttede innlogginger
- Tofaktorautentisering (2FA)
- OAuth-innlogginger (Google, Facebook osv.)
- Flerstegs innloggingsflyter
Tips: I stedet for å bruke din personlige konto, bør du vurdere å opprette en dedikert konto spesielt for gjennomsøking. Dette lar deg kontrollere nøyaktig hva gjennomsøkeren har tilgang til.
Beste praksis
Før gjennomsøking
- Sørg for at nettstedet ditt er tilgjengelig og at sidene lastes riktig
- Sjekk at viktige sider er lenket fra hjemmesiden eller sidekartet ditt
- For passordbeskyttede gjennomsøkinger, bekreft at legitimasjonen din fungerer
Velge sider
- Start med de viktigste sidene dine – produktsider, ofte stilte spørsmål, tjenester
- Bruk manuell modus hvis du bare trenger bestemte sider
- Unngå å gjennomsøke sider med utdatert eller unøyaktig informasjon
Etter gjennomsøking
- Gjennomgå det gjennomsøkte innholdet i kunnskapsbasen din
- Fjern eventuelle irrelevante sider som ble fanget opp
- Test AI-en din med spørsmål om det gjennomsøkte innholdet
- Gjennomsøk på nytt jevnlig for å holde innholdet oppdatert
Merk: Hver ny gjennomsøking erstatter den forrige for det nettstedet. AI-en din vil alltid bruke det sist gjennomsøkte innholdet.
Administrere gjennomsøkte sider
Etter at en gjennomsøking er fullført, kan du forhåndsvise og administrere individuelle sider fra Kunnskapsbase-seksjonen på Dashbordet ditt.
Forhåndsvise sideinnhold
- Gå til dashbordet ditt og åpne kunnskapsbase-seksjonen
- Klikk på et crawlingselement for å åpne det — du ser en liste over alle crawlede sider
- Klikk på en sidetittel for å forhåndsvise det uttrukne innholdet
- Bruk Tilbake til sider-knappen for å gå tilbake til sidelisten
Tips: Forhåndsvisning av sider er en fin måte å bekrefte at crawleren hentet ut riktig innhold. Hvis en side ser feil ut, kan du redigere den direkte eller slette den og legge til innholdet manuelt i stedet.
Redigering av individuelle sider Starter+
Du kan redigere det uttrukne innholdet på en crawlet side. Dette er nyttig for å fikse formateringsproblemer, fjerne irrelevante seksjoner eller legge til manglende informasjon.
- Åpne crawlingselementet og klikk på en sidetittel for å se innholdet
- Klikk på Rediger-knappen øverst i forhåndsvisningen
- Endre tittelen eller innholdet etter behov
- Klikk Lagre og re-embed — sidens AI-embeddinger vil bli regenerert med det oppdaterte innholdet
Merk: Redigering av en side re-embedder kun den spesifikke siden, ikke hele crawlingen. Dine andre crawlede sider påvirkes ikke.
Re-crawling av individuelle sider Starter+
Hvis en side på nettstedet ditt har blitt oppdatert, kan du re-crawle bare den siden uten å re-crawle hele nettstedet.
- Åpne crawlingselementet fra kunnskapsbasen din
- Klikk på re-crawl-knappen ved siden av siden du vil oppdatere
- Bekreft — siden vil bli hentet på nytt og dens innleiringer oppdatert med det nyeste innholdet
Tips: Dette er flott for å holde individuelle sider oppdatert etter innholdsendringer, uten å måtte re-crawle hundrevis av sider.
Slette individuelle sider
Du kan fjerne spesifikke sider fra en crawling uten å slette hele crawlingen. Dette er nyttig for å fjerne irrelevante, dupliserte eller feilaktig crawlede sider.
- Åpne crawlingselementet fra kunnskapsbasen din
- Klikk på slett-knappen ved siden av siden du vil fjerne
- Bekreft slettingen — siden og dens embeddinger vil bli permanent fjernet
Merk: Hvis du sletter alle sider fra en crawling, vil hele crawlingsoppføringen bli automatisk fjernet fra kunnskapsbasen din.
Feilsøking
Crawlingen returnerer færre sider enn forventet
- Sider er kanskje ikke lenket fra oppdagbare sider
- Noen sider kan være blokkert av robots.txt
- Cloudflare eller andre sikkerhetstjenester kan blokkere crawleren
- Løsning: Bruk manuell modus for å angi eksakte URL-er
Passordbeskyttet crawling mislykkes
- Bekreft at legitimasjonen din er korrekt
- Sjekk om innloggingen bruker CAPTCHA eller 2FA
- Prøv å angi egendefinerte feltnavn i Avanserte innstillinger
- Nettstedet ditt bruker kanskje JavaScript-basert autentisering (ikke støttet)
Alternativer hvis crawling ikke fungerer:
- Gjør sidene midlertidig offentlige, crawl dem, og aktiver deretter beskyttelsen igjen
- Lagre sidene som HTML-filer og last dem opp via Masseopplasting
Innholdet virker ufullstendig
- Noe innhold kan være lastet via JavaScript (ikke hentet ut)
- Innhold kan være i bilder (ikke hentet ut som tekst)
- Løsning: Legg til manglende innhold manuelt via tekst- eller PDF-opplasting