Natrag na nadzornu ploču

Dokumentacija

Naučite kako koristiti Asyntai

Pretraživanje web stranice

Automatski izvucite sadržaj sa stranica vaše web stranice

Započnite pretraživanje

Pregled

Pretraživač web stranica automatski otkriva i izvlači sadržaj s više stranica na vašoj web stranici. Umjesto dodavanja stranica jednu po jednu, možete pretražiti cijelu stranicu (ili određene odjeljke) i automatski dodati sav sadržaj u bazu znanja vaše AI.

Pretraživač slijedi poveznice za otkrivanje stranica, izvlači tekstualni sadržaj i obrađuje sve kako bi vaša AI mogla odgovarati na pitanja o vašoj web stranici.

Načini pretraživanja

Možete birati između dva načina pretraživanja ovisno o vašim potrebama:

Automatski način

Pretraživač počinje s vaše početne stranice i automatski otkriva stranice slijedeći poveznice. Također provjerava vaš sitemap.xml ako je dostupan. Najbolje za pretraživanje cijele web stranice ili velikih dijelova.

Svi planovi

Ručni način

Navedete točne URL-ove za pretraživanje (odvojene zarezom). Pretraživač posjećuje samo te određene stranice. Najbolje kada želite samo određene stranice dodane u svoju bazu znanja.

Ograničenja pretraživanja po planu

Maksimalan broj stranica koje možete pretražiti ovisi o vašem planu:

Plan Maks. stranica Ručni način Zaštićeno lozinkom
Besplatno 50 stranica
Starter 250 stranica
Standard 1.000 stranica
Pro 5.000 stranica

Stranice zaštićene lozinkom

Trebate pretražiti stranice iza prijave? Omogućite opciju "Stranice zaštićene lozinkom" za pretraživanje sadržaja samo za članove, nadzornih ploča ili bilo kojih područja vaše web stranice zaštićenih lozinkom.

Kako koristiti

  1. Omogućite preklopnik "Stranice zaštićene lozinkom" na stranici pretraživanja
  2. Unesite svoj URL stranice za prijavu (npr. vasastranica.com/login)
  3. Unesite svoje korisničko ime/e-poštu i lozinku
  4. Kliknite Započni pretraživanje - sustav će se prvo prijaviti, a zatim pretražiti zaštićene stranice

Kako funkcionira

Kada omogućite zaštitu lozinkom, pretraživač:

  1. Posjećuje vašu stranicu za prijavu i automatski otkriva polja obrasca
  2. Šalje vaše vjerodajnice (uključujući sve CSRF tokene)
  3. Održava autentificiranu sesiju tijekom pretraživanja
  4. Starts from where you're redirected after login (e.g., your dashboard)
  5. Otkriva i pretražuje sve zaštićene stranice koje može pronaći

Savjet: Pretraživač automatski otkriva polja obrasca (e-pošta, korisničko ime, lozinka) i sigurnosne tokene, pa radi s većinom obrazaca za prijavu bez dodatne konfiguracije.

Napredno: Prilagođeni nazivi polja

Ako vaš obrazac za prijavu koristi nestandardne nazive polja, proširite odjeljak "Napredno" i navedite:

  • Naziv polja za korisničko ime - Naziv polja obrasca za korisničko ime/e-poštu (npr. user_email)
  • Naziv polja za lozinku - Naziv polja obrasca za lozinku (npr. user_pass)

Ograničenja: Pretraživanje zaštićeno lozinkom radi sa standardnim HTML obrascima za prijavu. Možda neće raditi s:

  • JavaScript-based logins (React, Vue, Angular single-page apps)
  • Prijavama zaštićenim CAPTCHA-om ili reCAPTCHA-om
  • Dvofaktorskom autentifikacijom (2FA)
  • OAuth prijavama (Google, Facebook itd.)
  • Višekoračnim postupcima prijave

Savjet: Umjesto korištenja osobnog računa, razmislite o kreiranju namjenskog računa specifično za pretraživanje. To vam omogućuje da točno kontrolirate čemu pretraživač može pristupiti.

Najbolje prakse

Prije pretraživanja

  • Make sure your website is accessible and pages load correctly
  • Check that important pages are linked from your homepage or sitemap
  • Za pretraživanja zaštićena lozinkom, provjerite rade li vaše vjerodajnice

Odabir stranica

  • Start with your most important pages - product pages, FAQs, services
  • Koristite ručni način ako trebate samo određene stranice
  • Avoid crawling pages with outdated or inaccurate information

Nakon pretraživanja

  • Pregledajte pretraženi sadržaj u svojoj bazi znanja
  • Uklonite sve irelevantne stranice koje su uhvaćene
  • Testirajte svoju AI pitanjima o pretraženom sadržaju
  • Povremeno ponovno pretražujte kako biste sadržaj održali ažurnim

Napomena: Svako novo pretraživanje zamjenjuje prethodno za tu web stranicu. Vaša AI će uvijek koristiti najnoviji pretraženi sadržaj.

Upravljanje pretraženim stranicama

Nakon završetka pretraživanja, možete pregledati i upravljati pojedinačnim stranicama iz odjeljka Baza znanja na vašoj Nadzornoj ploči.

Pregled sadržaja stranice

  1. Idite na svoju Nadzornu ploču i otvorite odjeljak Baza znanja
  2. Kliknite na stavku pretraživanja da je otvorite — vidjet ćete popis svih pretraženih stranica
  3. Kliknite naslov bilo koje stranice za pregled njezina izvučenog sadržaja
  4. Koristite gumb Natrag na stranice za povratak na popis stranica

Savjet: Pregled stranica odličan je način za provjeru je li pretraživač izvukao pravi sadržaj. Ako stranica izgleda pogrešno, možete je izravno urediti ili obrisati i umjesto toga ručno dodati sadržaj.

Uređivanje pojedinačnih stranica

Možete urediti izvučeni sadržaj bilo koje pretražene stranice. Ovo je korisno za ispravljanje problema s formatiranjem, uklanjanje irelevantnih odjeljaka ili dodavanje nedostajućih informacija.

  1. Open the crawl item and click a page title to view its content
  2. Kliknite gumb Uredi na vrhu pregleda
  3. Izmijenite naslov ili sadržaj prema potrebi
  4. Kliknite Spremi i ponovno ugradi — AI ugradnje stranice bit će regenerirane s ažuriranim sadržajem

Napomena: Uređivanje stranice ponovno ugrađuje samo tu određenu stranicu, ne cijelo pretraživanje. Vaše druge pretražene stranice nisu pogođene.

Ponovno indeksiranje pojedinačnih stranica

Ako je stranica na vašoj web stranici ažurirana, možete ponovno indeksirati samo tu stranicu bez ponovnog indeksiranja cijele web stranice.

  1. Otvorite stavku pretraživanja iz svoje baze znanja
  2. Click the re-crawl button next to the page you want to update
  3. Potvrdite — stranica će se ponovno dohvatiti i njezine ugradnje ažurirati s najnovijim sadržajem

Savjet: Ovo je odlično za održavanje pojedinačnih stranica ažurnima nakon promjena sadržaja, bez potrebe za ponovnim indeksiranjem stotina stranica.

Brisanje pojedinačnih stranica

Možete ukloniti određene stranice iz pretraživanja bez brisanja cijelog pretraživanja. Ovo je korisno za uklanjanje irelevantnih, dupliciranih ili netočno pretraženih stranica.

  1. Otvorite stavku pretraživanja iz svoje baze znanja
  2. Kliknite gumb obriši pored stranice koju želite ukloniti
  3. Potvrdite brisanje — stranica i njezine ugradnje bit će trajno uklonjene

Napomena: Ako obrišete sve stranice iz pretraživanja, cijeli unos pretraživanja bit će automatski uklonjen iz vaše baze znanja.

Rješavanje problema

Pretraživanje vraća manje stranica nego što se očekivalo

  • Stranice možda nisu povezane s otkrivim stranicama
  • Neke stranice mogu biti blokirane datotekom robots.txt
  • Cloudflare ili drugi sigurnosni servisi mogu blokirati pretraživač
  • Solution: Use Manual mode to specify exact URLs

Pretraživanje zaštićeno lozinkom ne uspijeva

  • Provjerite jesu li vaše vjerodajnice ispravne
  • Provjerite koristi li vaša prijava CAPTCHA ili 2FA
  • Pokušajte navesti prilagođene nazive polja u naprednim postavkama
  • Your site might use JavaScript-based authentication (not supported)

Alternative ako pretraživanje ne radi:

  • Privremeno učinite stranice javnima, pretražite ih, a zatim ponovno omogućite zaštitu
  • Spremite stranice kao HTML datoteke i prenesite ih putem skupnog prijenosa

Sadržaj se čini nepotpunim

  • Dio sadržaja može biti učitan putem JavaScripta (nije izvučen)
  • Sadržaj može biti u slikama (nije izvučen kao tekst)
  • Rješenje: Ručno dodajte nedostajući sadržaj putem prijenosa teksta ili PDF-a