Pretraživanje web stranice
Automatski izvucite sadržaj sa stranica vaše web stranice
Pregled
Pretraživač web stranica automatski otkriva i izvlači sadržaj s više stranica na vašoj web stranici. Umjesto dodavanja stranica jednu po jednu, možete pretražiti cijelu stranicu (ili određene odjeljke) i automatski dodati sav sadržaj u bazu znanja vaše AI.
Pretraživač slijedi poveznice za otkrivanje stranica, izvlači tekstualni sadržaj i obrađuje sve kako bi vaša AI mogla odgovarati na pitanja o vašoj web stranici.
Načini pretraživanja
Možete birati između dva načina pretraživanja ovisno o vašim potrebama:
Automatski način
Pretraživač počinje s vaše početne stranice i automatski otkriva stranice slijedeći poveznice. Također provjerava vaš sitemap.xml ako je dostupan. Najbolje za pretraživanje cijele web stranice ili velikih dijelova.
Svi planoviRučni način
Navedete točne URL-ove za pretraživanje (odvojene zarezom). Pretraživač posjećuje samo te određene stranice. Najbolje kada želite samo određene stranice dodane u svoju bazu znanja.
Starter+Ograničenja pretraživanja po planu
Maksimalan broj stranica koje možete pretražiti ovisi o vašem planu:
| Plan | Maks. stranica | Ručni način | Zaštićeno lozinkom |
|---|---|---|---|
| Besplatno | 50 stranica | ||
| Starter | 250 stranica | ||
| Standard | 1.000 stranica | ||
| Pro | 5.000 stranica |
Stranice zaštićene lozinkom Starter+
Trebate pretražiti stranice iza prijave? Omogućite opciju "Stranice zaštićene lozinkom" za pretraživanje sadržaja samo za članove, nadzornih ploča ili bilo kojih područja vaše web stranice zaštićenih lozinkom.
Kako koristiti
- Omogućite preklopnik "Stranice zaštićene lozinkom" na stranici pretraživanja
- Unesite svoj URL stranice za prijavu (npr.
vasastranica.com/login) - Unesite svoje korisničko ime/e-poštu i lozinku
- Kliknite Započni pretraživanje - sustav će se prvo prijaviti, a zatim pretražiti zaštićene stranice
Kako funkcionira
Kada omogućite zaštitu lozinkom, pretraživač:
- Posjećuje vašu stranicu za prijavu i automatski otkriva polja obrasca
- Šalje vaše vjerodajnice (uključujući sve CSRF tokene)
- Održava autentificiranu sesiju tijekom pretraživanja
- Starts from where you're redirected after login (e.g., your dashboard)
- Otkriva i pretražuje sve zaštićene stranice koje može pronaći
Savjet: Pretraživač automatski otkriva polja obrasca (e-pošta, korisničko ime, lozinka) i sigurnosne tokene, pa radi s većinom obrazaca za prijavu bez dodatne konfiguracije.
Napredno: Prilagođeni nazivi polja
Ako vaš obrazac za prijavu koristi nestandardne nazive polja, proširite odjeljak "Napredno" i navedite:
- Naziv polja za korisničko ime - Naziv polja obrasca za korisničko ime/e-poštu (npr.
user_email) - Naziv polja za lozinku - Naziv polja obrasca za lozinku (npr.
user_pass)
Ograničenja: Pretraživanje zaštićeno lozinkom radi sa standardnim HTML obrascima za prijavu. Možda neće raditi s:
- JavaScript-based logins (React, Vue, Angular single-page apps)
- Prijavama zaštićenim CAPTCHA-om ili reCAPTCHA-om
- Dvofaktorskom autentifikacijom (2FA)
- OAuth prijavama (Google, Facebook itd.)
- Višekoračnim postupcima prijave
Savjet: Umjesto korištenja osobnog računa, razmislite o kreiranju namjenskog računa specifično za pretraživanje. To vam omogućuje da točno kontrolirate čemu pretraživač može pristupiti.
Najbolje prakse
Prije pretraživanja
- Make sure your website is accessible and pages load correctly
- Check that important pages are linked from your homepage or sitemap
- Za pretraživanja zaštićena lozinkom, provjerite rade li vaše vjerodajnice
Odabir stranica
- Start with your most important pages - product pages, FAQs, services
- Koristite ručni način ako trebate samo određene stranice
- Avoid crawling pages with outdated or inaccurate information
Nakon pretraživanja
- Pregledajte pretraženi sadržaj u svojoj bazi znanja
- Uklonite sve irelevantne stranice koje su uhvaćene
- Testirajte svoju AI pitanjima o pretraženom sadržaju
- Povremeno ponovno pretražujte kako biste sadržaj održali ažurnim
Napomena: Svako novo pretraživanje zamjenjuje prethodno za tu web stranicu. Vaša AI će uvijek koristiti najnoviji pretraženi sadržaj.
Upravljanje pretraženim stranicama
Nakon završetka pretraživanja, možete pregledati i upravljati pojedinačnim stranicama iz odjeljka Baza znanja na vašoj Nadzornoj ploči.
Pregled sadržaja stranice
- Idite na svoju Nadzornu ploču i otvorite odjeljak Baza znanja
- Kliknite na stavku pretraživanja da je otvorite — vidjet ćete popis svih pretraženih stranica
- Kliknite naslov bilo koje stranice za pregled njezina izvučenog sadržaja
- Koristite gumb Natrag na stranice za povratak na popis stranica
Savjet: Pregled stranica odličan je način za provjeru je li pretraživač izvukao pravi sadržaj. Ako stranica izgleda pogrešno, možete je izravno urediti ili obrisati i umjesto toga ručno dodati sadržaj.
Uređivanje pojedinačnih stranica Starter+
Možete urediti izvučeni sadržaj bilo koje pretražene stranice. Ovo je korisno za ispravljanje problema s formatiranjem, uklanjanje irelevantnih odjeljaka ili dodavanje nedostajućih informacija.
- Open the crawl item and click a page title to view its content
- Kliknite gumb Uredi na vrhu pregleda
- Izmijenite naslov ili sadržaj prema potrebi
- Kliknite Spremi i ponovno ugradi — AI ugradnje stranice bit će regenerirane s ažuriranim sadržajem
Napomena: Uređivanje stranice ponovno ugrađuje samo tu određenu stranicu, ne cijelo pretraživanje. Vaše druge pretražene stranice nisu pogođene.
Ponovno indeksiranje pojedinačnih stranica Starter+
Ako je stranica na vašoj web stranici ažurirana, možete ponovno indeksirati samo tu stranicu bez ponovnog indeksiranja cijele web stranice.
- Otvorite stavku pretraživanja iz svoje baze znanja
- Click the re-crawl button next to the page you want to update
- Potvrdite — stranica će se ponovno dohvatiti i njezine ugradnje ažurirati s najnovijim sadržajem
Savjet: Ovo je odlično za održavanje pojedinačnih stranica ažurnima nakon promjena sadržaja, bez potrebe za ponovnim indeksiranjem stotina stranica.
Brisanje pojedinačnih stranica
Možete ukloniti određene stranice iz pretraživanja bez brisanja cijelog pretraživanja. Ovo je korisno za uklanjanje irelevantnih, dupliciranih ili netočno pretraženih stranica.
- Otvorite stavku pretraživanja iz svoje baze znanja
- Kliknite gumb obriši pored stranice koju želite ukloniti
- Potvrdite brisanje — stranica i njezine ugradnje bit će trajno uklonjene
Napomena: Ako obrišete sve stranice iz pretraživanja, cijeli unos pretraživanja bit će automatski uklonjen iz vaše baze znanja.
Rješavanje problema
Pretraživanje vraća manje stranica nego što se očekivalo
- Stranice možda nisu povezane s otkrivim stranicama
- Neke stranice mogu biti blokirane datotekom robots.txt
- Cloudflare ili drugi sigurnosni servisi mogu blokirati pretraživač
- Solution: Use Manual mode to specify exact URLs
Pretraživanje zaštićeno lozinkom ne uspijeva
- Provjerite jesu li vaše vjerodajnice ispravne
- Provjerite koristi li vaša prijava CAPTCHA ili 2FA
- Pokušajte navesti prilagođene nazive polja u naprednim postavkama
- Your site might use JavaScript-based authentication (not supported)
Alternative ako pretraživanje ne radi:
- Privremeno učinite stranice javnima, pretražite ih, a zatim ponovno omogućite zaštitu
- Spremite stranice kao HTML datoteke i prenesite ih putem skupnog prijenosa
Sadržaj se čini nepotpunim
- Dio sadržaja može biti učitan putem JavaScripta (nije izvučen)
- Sadržaj može biti u slikama (nije izvučen kao tekst)
- Rješenje: Ručno dodajte nedostajući sadržaj putem prijenosa teksta ili PDF-a