Nettstedgjennomsøking

Trekk ut innhold fra nettsidene dine automatisk

Oversikt

Nettstedscrawleren oppdager og trekker ut innhold fra flere sider på nettstedet ditt automatisk. I stedet for å legge til sider en etter en, kan du crawle hele nettstedet (eller bestemte deler) og få alt innholdet lagt til i AI-ens kunnskapsbase automatisk.

Crawleren følger lenker for å oppdage sider, trekker ut tekstinnhold og behandler alt slik at AI-en din kan svare på spørsmål om nettstedet ditt.

Automatisk innholdsutvidelse

Hvis nettstedet ditt er bygget på en populær plattform som WordPress, Shopify, WooCommerce, Drupal, Squarespace eller Strapi, henter crawleren automatisk ekstra strukturert innhold ved siden av vanlige sider — for eksempel hele produktkatalogen din, blogginnlegg, kategorier og oppføringer.

Du trenger ikke å konfigurere noe. Hvis nettstedet ditt er bygget på en støttet plattform, får AI-en din automatisk rikere og bedre organisert kunnskap.

Crawlingsmoduser

Du kan velge mellom to crawlingsmoduser avhengig av dine behov:

Automatisk modus

Crawleren starter fra hjemmesiden din og oppdager sider automatisk ved å følge lenker. Den sjekker også sitemap.xml hvis tilgjengelig. Best for crawling av hele nettstedet eller store deler av det.

Alle planer

Manuell modus

Du angir eksakte URL-er som skal crawles (kommaseparert). Crawleren besøker kun disse spesifikke sidene. Best når du bare vil ha bestemte sider lagt til i kunnskapsbasen din.

Starter+

Tips: Hvis du skriver inn én URL i manuell modus, spør vi om du vil crawle bare den siden eller følge lenkene dens og crawle hele nettstedet — slik at du ikke ved et uhell indekserer bare én side.

Crawle et underdomene eller en bestemt seksjon

Som standard starter en automatisk crawling på nettstedets forside. Hvis innholdet du vil ha er på et underdomene — som et hjelpesenter, et dokumentasjonsnettsted eller en blogg — kan du i stedet rette crawleren dit.

I modusen Automatisk slår du på bryteren Crawl et bestemt underdomene eller URL
Skriv inn start-URL-en — for eksempel https://help.yoursite.com
Klikk på Start crawling — crawleren følger lenker innenfor det underdomenet eller den seksjonen

Merk: Start-URL-en må tilhøre det valgte nettstedet — enten samme domene eller et av underdomenene.

Crawlingsgrenser per plan

Maksimalt antall sider du kan crawle avhenger av planen din:

Abonnement	Maks sider	Manuell modus	Passordbeskyttet
Free	50 sider
Starter	250 sider
Standard	1 000 sider
Pro	5 000 sider

Passordbeskyttede sider Starter+

Trenger du å gjennomsøke sider bak en innlogging? Aktiver alternativet «Passordbeskyttede sider» for å gjennomsøke innhold kun for medlemmer, dashbord eller andre passordbeskyttede områder av nettsiden din.

Slik bruker du det

Aktiver «Passordbeskyttede sider»-bryteren på gjennomsøkingssiden
Skriv inn URL-en til innloggingssiden (f.eks. yoursite.com/login)
Skriv inn brukernavn/e-post og passord
Klikk Start gjennomsøking – systemet logger inn først, og gjennomsøker deretter beskyttede sider

Slik fungerer det

Når du aktiverer passordbeskyttelse, vil gjennomsøkeren:

Besøke innloggingssiden din og oppdage skjemafeltene automatisk
Sende inn legitimasjonen din (inkludert eventuelle CSRF-tokener)
Opprettholde den autentiserte økten under gjennomsøking
Starter fra der du blir videresendt etter innlogging (f.eks. dashbordet ditt)
Oppdage og gjennomsøke alle beskyttede sider den finner

Tips: Gjennomsøkeren oppdager automatisk skjemafelter (e-post, brukernavn, passord) og sikkerhetstokener, så den fungerer med de fleste innloggingsskjemaer uten ekstra konfigurasjon.

Avansert: Egendefinerte feltnavn

Hvis innloggingsskjemaet ditt bruker ikke-standard feltnavn, utvid «Avansert»-seksjonen og spesifiser:

Feltnavn for brukernavn - Skjemafeltnavnet for brukernavn/e-post (f.eks. user_email)
Feltnavn for passord - Skjemafeltnavnet for passord (f.eks. user_pass)

Begrensninger: Passordbeskyttet gjennomsøking fungerer med standard HTML-innloggingsskjemaer. Det fungerer kanskje ikke med:

JavaScript-baserte innlogginger (React, Vue, Angular enkeltsideapper)
CAPTCHA- eller reCAPTCHA-beskyttede innlogginger
Tofaktorautentisering (2FA)
OAuth-innlogginger (Google, Facebook osv.)
Flerstegs innloggingsflyter

Tips: I stedet for å bruke din personlige konto, bør du vurdere å opprette en dedikert konto spesielt for gjennomsøking. Dette lar deg kontrollere nøyaktig hva gjennomsøkeren har tilgang til.

Beste praksis

Før gjennomsøking

Sørg for at nettstedet ditt er tilgjengelig og at sidene lastes riktig
Sjekk at viktige sider er lenket fra hjemmesiden eller sidekartet ditt
For passordbeskyttede gjennomsøkinger, bekreft at legitimasjonen din fungerer

Velge sider

Start med de viktigste sidene dine – produktsider, ofte stilte spørsmål, tjenester
Bruk manuell modus hvis du bare trenger bestemte sider
Unngå å gjennomsøke sider med utdatert eller unøyaktig informasjon

Etter gjennomsøking

Gjennomgå det gjennomsøkte innholdet i kunnskapsbasen din
Fjern eventuelle irrelevante sider som ble fanget opp
Test AI-en din med spørsmål om det gjennomsøkte innholdet
Gjennomsøk på nytt jevnlig for å holde innholdet oppdatert

Merk: Hver ny gjennomsøking erstatter den forrige for det nettstedet. AI-en din vil alltid bruke det sist gjennomsøkte innholdet.

Administrere gjennomsøkte sider

Etter at en gjennomsøking er fullført, kan du forhåndsvise og administrere individuelle sider fra Kunnskapsbase-seksjonen på Dashbordet ditt.

Forhåndsvise sideinnhold

Gå til dashbordet ditt og åpne kunnskapsbase-seksjonen
Klikk på et crawlingselement for å åpne det — du ser en liste over alle crawlede sider
Klikk på en sidetittel for å forhåndsvise det uttrukne innholdet
Bruk Tilbake til sider-knappen for å gå tilbake til sidelisten

Tips: Forhåndsvisning av sider er en fin måte å bekrefte at crawleren hentet ut riktig innhold. Hvis en side ser feil ut, kan du redigere den direkte eller slette den og legge til innholdet manuelt i stedet.

Redigering av individuelle sider Starter+

Du kan redigere det uttrukne innholdet på en crawlet side. Dette er nyttig for å fikse formateringsproblemer, fjerne irrelevante seksjoner eller legge til manglende informasjon.

Åpne crawlingselementet og klikk på en sidetittel for å se innholdet
Klikk på Rediger-knappen øverst i forhåndsvisningen
Endre tittelen eller innholdet etter behov
Klikk Lagre og re-embed — sidens AI-embeddinger vil bli regenerert med det oppdaterte innholdet

Merk: Redigering av en side re-embedder kun den spesifikke siden, ikke hele crawlingen. Dine andre crawlede sider påvirkes ikke.

Re-crawling av individuelle sider Starter+

Hvis en side på nettstedet ditt har blitt oppdatert, kan du re-crawle bare den siden uten å re-crawle hele nettstedet.

Åpne crawlingselementet fra kunnskapsbasen din
Klikk på re-crawl-knappen ved siden av siden du vil oppdatere
Bekreft — siden vil bli hentet på nytt og dens innleiringer oppdatert med det nyeste innholdet

Tips: Dette er flott for å holde individuelle sider oppdatert etter innholdsendringer, uten å måtte re-crawle hundrevis av sider.

Slette individuelle sider

Du kan fjerne spesifikke sider fra en crawling uten å slette hele crawlingen. Dette er nyttig for å fjerne irrelevante, dupliserte eller feilaktig crawlede sider.

Åpne crawlingselementet fra kunnskapsbasen din
Klikk på slett-knappen ved siden av siden du vil fjerne
Bekreft slettingen — siden og dens embeddinger vil bli permanent fjernet

Merk: Hvis du sletter alle sider fra en crawling, vil hele crawlingsoppføringen bli automatisk fjernet fra kunnskapsbasen din.

Feilsøking

Crawlingen returnerer færre sider enn forventet

Sider er kanskje ikke lenket fra oppdagbare sider
Noen sider kan være blokkert av robots.txt
Cloudflare eller andre sikkerhetstjenester kan blokkere crawleren
Innholdet ditt kan være på et underdomene — bruk alternativet Crawl et bestemt underdomene eller URL for å rette crawleren dit
Løsning: Bruk manuell modus for å angi eksakte URL-er

Passordbeskyttet crawling mislykkes

Bekreft at legitimasjonen din er korrekt
Sjekk om innloggingen bruker CAPTCHA eller 2FA
Prøv å angi egendefinerte feltnavn i Avanserte innstillinger
Nettstedet ditt bruker kanskje JavaScript-basert autentisering (ikke støttet)

Alternativer hvis crawling ikke fungerer:

Gjør sidene midlertidig offentlige, crawl dem, og aktiver deretter beskyttelsen igjen
Lagre sidene som HTML-filer og last dem opp via Masseopplasting

Innholdet virker ufullstendig

Noe innhold kan være lastet via JavaScript (ikke hentet ut)
Innhold kan være i bilder (ikke hentet ut som tekst)
Løsning: Legg til manglende innhold manuelt via tekst- eller PDF-opplasting

Dokumentasjon