Prehľadávanie webu

Automaticky extrahujte obsah z vasich webovych stranok

Zacat prehladavanie

Prehľad

Prehladavac webu automaticky objavuje a extrahuje obsah z viacerych stranok na vasom webe. Namiesto pridavania stranok jednej po druhej mozete prehladat cely svoj web (alebo konkretne sekcie) a mat vsetok obsah automaticky pridany do znalostnej bazy vasej AI.

Prehladavac sleduje odkazy na objavovanie stranok, extrahuje textovy obsah a spracuje vsetko, aby vasa AI mohla odpoveddat na otazky o vasom webe.

Rezimy prehladavania

Mozete si vybrat medzi dvoma rezimami prehladavania podla vasich potrieb:

Automaticky rezim

Prehladavac zacne z vasej domovskej stranky a automaticky objavuje stranky sledovanim odkazov. Taktiez kontroluje vas sitemap.xml, ak je dostupny. Najlepsie na prehladavanie celej vasej webovej stranky alebo jej velkych casti.

Vsetky plany

Manualny rezim

Uvediete presne URL na prehladavanie (oddelene ciarkou). Prehladavac navstivi iba tie konkretne stranky. Najlepsie, ked chcete do znalostnej bazy pridat iba urcite stranky.

Limity prehladavania podla planu

Maximalny pocet stranok, ktore mozete prehladat, zavisi od vasho planu:

Plán Max. stranok Manualny rezim Chranene heslom
Bezplatny 50 stranok
Starter 250 stranok
Standard 1 000 stranok
Pro 5 000 stranok

Stranky chranene heslom

Potrebujete prehladavat stranky za prihlasenim? Povol'te moznost "Stranky chranene heslom" na prehladavanie obsahu iba pre clenov, panelov alebo akychkolvek oblasty vasej webovej stranky chranenych heslom.

Ako pouzivat

  1. Povol'te prepinac "Stranky chranene heslom" na stranke prehladavania
  2. Zadajte URL prihlasovacej stranky (napr. vasastranka.com/prihlasenie)
  3. Zadajte svoje Pouzivatel'ske meno/E-mail a Heslo
  4. Kliknite na Zacat prehladavanie - system sa najprv prihlasi a potom prehlada chranene stranky

Ako to funguje

Ked povolite ochranu heslom, prehladavac:

  1. Navstivi vasu prihlasovaciu stranku a automaticky deteguje polia formulara
  2. Odosle vase prihlasovacie udaje (vratane akychkolvek CSRF tokenov)
  3. Udrzuje autentifikovanu relaciu pocas prehladavania
  4. Zacne odtial', kam ste presmerovany po prihlaseni (napr. vas panel)
  5. Objavi a prehlada vsetky chranene stranky, ktore najde

Tip: Prehladavac automaticky deteguje polia formulara (e-mail, pouzivatel'ske meno, heslo) a bezpecnostne tokeny, takze funguje s vacsinou prihlasovacich formularov bez dalsej konfiguracie.

Pokrocile: Vlastne nazvy poli

Ak vas prihlasovaci formular pouziva nestandarane nazvy poli, rozbal'te sekciu "Pokrocile" a uvedte:

  • Nazov pol'a pouzivatel'skeho mena - Nazov pol'a formulara pre pouzivatel'ske meno/e-mail (napr. user_email)
  • Nazov pol'a hesla - Nazov pol'a formulara pre heslo (napr. user_pass)

Obmedzenia: Prehladavanie chranenych heslom funguje so standardnymi HTML prihlasovacimi formularmi. Nemusi fungovat s:

  • JavaScript-based logins (React, Vue, Angular single-page apps)
  • Prihlasovaniami chrananymi CAPTCHA alebo reCAPTCHA
  • Dvojfaktorova autentifikacia (2FA)
  • OAuth prihlasovaniami (Google, Facebook atd.)
  • Viackrokove prihlasovacie postupy

Tip: Namiesto pouzivania osobneho uctu zvazite vytvorenie specialneho uctu konkretne na prehladavanie. To vam umozni presne kontrolovat, k comu ma prehladavac pristup.

Osvedcene postupy

Pred prehladavanim

  • Make sure your website is accessible and pages load correctly
  • Check that important pages are linked from your homepage or sitemap
  • For password-protected crawls, verify your credentials work

Vyber stranok

  • Start with your most important pages - product pages, FAQs, services
  • Pouzite manualny rezim, ak potrebujete iba konkretne stranky
  • Avoid crawling pages with outdated or inaccurate information

Po prehladavani

  • Prezrite si prehladany obsah vo vasej znalostnej baze
  • Odstrant akekolvek irelevantne stranky, ktore boli zachytene
  • Otestujte svoju AI otazkami o prehladanom obsahu
  • Pravidelne opat prehladavajte, aby bol obsah aktualny

Poznámka: Kazde nove prehladanie nahradi predchadzajuce pre danu webovu stranku. Vasa AI bude vzdy pouzivat naposledy prehladany obsah.

Sprava prehladanych stranok

Po dokonceni prehladavania mozete zobrazit nahlad a spravovat jednotlive stranky v sekcii Znalostna baza na vasom Paneli.

Nahlad obsahu stranky

  1. Prejdite na svoj Panel a otvorte sekciu Znalostna baza
  2. Kliknite na polozku prehladavania, aby ste ju otvorili — uvidite zoznam vsetkych prehladanych stranok
  3. Click any page title to preview its extracted content
  4. Pouzite tlacidlo Spat na stranky na navrat do zoznamu stranok

Tip: Nahlad stranok je skvelym sposobom, ako overit, ze prehladavac extrahoval spravny obsah. Ak stranka vyzera nespravne, mozete ju priamo upravit alebo vymazat a pridat obsah rucne.

Uprava jednotlivych stranok

Mozete upravit extrahovany obsah akejkolvek prehladanej stranky. To je uzitocne na opravu problemov s formatovanim, odstranenie irelevantnych sekcii alebo pridanie chybajucich informacii.

  1. Open the crawl item and click a page title to view its content
  2. Kliknite na tlacidlo Upravit v hornej casti nahladu
  3. Upravte nazov alebo obsah podla potreby
  4. Kliknite na Ulozit a znovu vlozit — AI vkladania stranky budu regenerovane s aktualizovanym obsahom

Poznámka: Uprava stranky znovu vlozi iba tu konkretnu stranku, nie cele prehladanie. Vase ostatne prehladane stranky nie su ovplyvnene.

Opakovane prehladavanie jednotlivych stranok

Ak bola stranka na vasej webovej stranke aktualizovana, mozete prehladat len tu stranku bez prehladavania celej webovej stranky.

  1. Otvorte polozku prehladavania z vasej Znalostnej bazy
  2. Click the re-crawl button next to the page you want to update
  3. Potvrdite — stranka bude znovu stiahnuta a jej embeddingy aktualizovane najnovsim obsahom

Tip: Toto je skvelne pre udrzanie jednotlivych stranok aktualizovanych po zmenach obsahu bez nutnosti opakovaneho prehladania stoviek stranok.

Odstranenie jednotlivych stranok

Mozete odstranit konkretne stranky z prehladavania bez odstranenia celeho prehladavania. To je uzitocne na odstranenie irelevantnych, duplicitnych alebo nespravne prehladanych stranok.

  1. Otvorte polozku prehladavania z vasej Znalostnej bazy
  2. Kliknite na tlacidlo vymazat vedla stranky, ktoru chcete odstranit
  3. Potvrdte odstranenie — stranka a jej vkladania budu trvalo odstranene

Poznámka: Ak odstranite vsetky stranky z prehladavania, cely zaznam prehladavania bude automaticky odstraneny z vasej znalostnej bazy.

Riesenie problemov

Prehladavanie vracia menej stranok, nez sa ocakavalo

  • Stranky nemusia byt prepojene z objavitelnych stranok
  • Niektore stranky mozu byt blokovane suborom robots.txt
  • Cloudflare alebo ine bezpecnostne sluzby mozu blokovat prehladavac
  • Riesenie: Pouzite manualny rezim na urcenie presnych URL

Prehladavanie chraneneho heslom zlyhava

  • Overte, ze vase prihlasovacie udaje su spravne
  • Skontrolujte, ci vase prihlasenie pouziva CAPTCHA alebo 2FA
  • Skuste urcit vlastne nazvy poli v Pokrocilych nastaveniach
  • Your site might use JavaScript-based authentication (not supported)

Alternativy, ak prehladavanie nefunguje:

  • Docasne spristupnite stranky verejnosti, prehladajte ich a potom znovu zapnite ochranu
  • Ulozte stranky ako HTML subory a nahrajte ich cez Hromadne nahratie

Obsah sa javi neuplny

  • Niektory obsah moze byt nacitany cez JavaScript (nie je extrahovany)
  • Obsah moze byt v obrazkoch (nie je extrahovany ako text)
  • Riesenie: Pridajte chybajuci obsah rucne cez nahratie textu alebo PDF