Prehľadávanie webu
Automaticky extrahujte obsah z vasich webovych stranok
Prehľad
Prehladavac webu automaticky objavuje a extrahuje obsah z viacerych stranok na vasom webe. Namiesto pridavania stranok jednej po druhej mozete prehladat cely svoj web (alebo konkretne sekcie) a mat vsetok obsah automaticky pridany do znalostnej bazy vasej AI.
Prehladavac sleduje odkazy na objavovanie stranok, extrahuje textovy obsah a spracuje vsetko, aby vasa AI mohla odpoveddat na otazky o vasom webe.
Rezimy prehladavania
Mozete si vybrat medzi dvoma rezimami prehladavania podla vasich potrieb:
Automaticky rezim
Prehladavac zacne z vasej domovskej stranky a automaticky objavuje stranky sledovanim odkazov. Taktiez kontroluje vas sitemap.xml, ak je dostupny. Najlepsie na prehladavanie celej vasej webovej stranky alebo jej velkych casti.
Vsetky planyManualny rezim
Uvediete presne URL na prehladavanie (oddelene ciarkou). Prehladavac navstivi iba tie konkretne stranky. Najlepsie, ked chcete do znalostnej bazy pridat iba urcite stranky.
Starter+Limity prehladavania podla planu
Maximalny pocet stranok, ktore mozete prehladat, zavisi od vasho planu:
| Plán | Max. stranok | Manualny rezim | Chranene heslom |
|---|---|---|---|
| Bezplatny | 50 stranok | ||
| Starter | 250 stranok | ||
| Standard | 1 000 stranok | ||
| Pro | 5 000 stranok |
Stranky chranene heslom Starter+
Potrebujete prehladavat stranky za prihlasenim? Povol'te moznost "Stranky chranene heslom" na prehladavanie obsahu iba pre clenov, panelov alebo akychkolvek oblasty vasej webovej stranky chranenych heslom.
Ako pouzivat
- Povol'te prepinac "Stranky chranene heslom" na stranke prehladavania
- Zadajte URL prihlasovacej stranky (napr.
vasastranka.com/prihlasenie) - Zadajte svoje Pouzivatel'ske meno/E-mail a Heslo
- Kliknite na Zacat prehladavanie - system sa najprv prihlasi a potom prehlada chranene stranky
Ako to funguje
Ked povolite ochranu heslom, prehladavac:
- Navstivi vasu prihlasovaciu stranku a automaticky deteguje polia formulara
- Odosle vase prihlasovacie udaje (vratane akychkolvek CSRF tokenov)
- Udrzuje autentifikovanu relaciu pocas prehladavania
- Zacne odtial', kam ste presmerovany po prihlaseni (napr. vas panel)
- Objavi a prehlada vsetky chranene stranky, ktore najde
Tip: Prehladavac automaticky deteguje polia formulara (e-mail, pouzivatel'ske meno, heslo) a bezpecnostne tokeny, takze funguje s vacsinou prihlasovacich formularov bez dalsej konfiguracie.
Pokrocile: Vlastne nazvy poli
Ak vas prihlasovaci formular pouziva nestandarane nazvy poli, rozbal'te sekciu "Pokrocile" a uvedte:
- Nazov pol'a pouzivatel'skeho mena - Nazov pol'a formulara pre pouzivatel'ske meno/e-mail (napr.
user_email) - Nazov pol'a hesla - Nazov pol'a formulara pre heslo (napr.
user_pass)
Obmedzenia: Prehladavanie chranenych heslom funguje so standardnymi HTML prihlasovacimi formularmi. Nemusi fungovat s:
- JavaScript-based logins (React, Vue, Angular single-page apps)
- Prihlasovaniami chrananymi CAPTCHA alebo reCAPTCHA
- Dvojfaktorova autentifikacia (2FA)
- OAuth prihlasovaniami (Google, Facebook atd.)
- Viackrokove prihlasovacie postupy
Tip: Namiesto pouzivania osobneho uctu zvazite vytvorenie specialneho uctu konkretne na prehladavanie. To vam umozni presne kontrolovat, k comu ma prehladavac pristup.
Osvedcene postupy
Pred prehladavanim
- Make sure your website is accessible and pages load correctly
- Check that important pages are linked from your homepage or sitemap
- For password-protected crawls, verify your credentials work
Vyber stranok
- Start with your most important pages - product pages, FAQs, services
- Pouzite manualny rezim, ak potrebujete iba konkretne stranky
- Avoid crawling pages with outdated or inaccurate information
Po prehladavani
- Prezrite si prehladany obsah vo vasej znalostnej baze
- Odstrant akekolvek irelevantne stranky, ktore boli zachytene
- Otestujte svoju AI otazkami o prehladanom obsahu
- Pravidelne opat prehladavajte, aby bol obsah aktualny
Poznámka: Kazde nove prehladanie nahradi predchadzajuce pre danu webovu stranku. Vasa AI bude vzdy pouzivat naposledy prehladany obsah.
Sprava prehladanych stranok
Po dokonceni prehladavania mozete zobrazit nahlad a spravovat jednotlive stranky v sekcii Znalostna baza na vasom Paneli.
Nahlad obsahu stranky
- Prejdite na svoj Panel a otvorte sekciu Znalostna baza
- Kliknite na polozku prehladavania, aby ste ju otvorili — uvidite zoznam vsetkych prehladanych stranok
- Click any page title to preview its extracted content
- Pouzite tlacidlo Spat na stranky na navrat do zoznamu stranok
Tip: Nahlad stranok je skvelym sposobom, ako overit, ze prehladavac extrahoval spravny obsah. Ak stranka vyzera nespravne, mozete ju priamo upravit alebo vymazat a pridat obsah rucne.
Uprava jednotlivych stranok Starter+
Mozete upravit extrahovany obsah akejkolvek prehladanej stranky. To je uzitocne na opravu problemov s formatovanim, odstranenie irelevantnych sekcii alebo pridanie chybajucich informacii.
- Open the crawl item and click a page title to view its content
- Kliknite na tlacidlo Upravit v hornej casti nahladu
- Upravte nazov alebo obsah podla potreby
- Kliknite na Ulozit a znovu vlozit — AI vkladania stranky budu regenerovane s aktualizovanym obsahom
Poznámka: Uprava stranky znovu vlozi iba tu konkretnu stranku, nie cele prehladanie. Vase ostatne prehladane stranky nie su ovplyvnene.
Opakovane prehladavanie jednotlivych stranok Starter+
Ak bola stranka na vasej webovej stranke aktualizovana, mozete prehladat len tu stranku bez prehladavania celej webovej stranky.
- Otvorte polozku prehladavania z vasej Znalostnej bazy
- Click the re-crawl button next to the page you want to update
- Potvrdite — stranka bude znovu stiahnuta a jej embeddingy aktualizovane najnovsim obsahom
Tip: Toto je skvelne pre udrzanie jednotlivych stranok aktualizovanych po zmenach obsahu bez nutnosti opakovaneho prehladania stoviek stranok.
Odstranenie jednotlivych stranok
Mozete odstranit konkretne stranky z prehladavania bez odstranenia celeho prehladavania. To je uzitocne na odstranenie irelevantnych, duplicitnych alebo nespravne prehladanych stranok.
- Otvorte polozku prehladavania z vasej Znalostnej bazy
- Kliknite na tlacidlo vymazat vedla stranky, ktoru chcete odstranit
- Potvrdte odstranenie — stranka a jej vkladania budu trvalo odstranene
Poznámka: Ak odstranite vsetky stranky z prehladavania, cely zaznam prehladavania bude automaticky odstraneny z vasej znalostnej bazy.
Riesenie problemov
Prehladavanie vracia menej stranok, nez sa ocakavalo
- Stranky nemusia byt prepojene z objavitelnych stranok
- Niektore stranky mozu byt blokovane suborom robots.txt
- Cloudflare alebo ine bezpecnostne sluzby mozu blokovat prehladavac
- Riesenie: Pouzite manualny rezim na urcenie presnych URL
Prehladavanie chraneneho heslom zlyhava
- Overte, ze vase prihlasovacie udaje su spravne
- Skontrolujte, ci vase prihlasenie pouziva CAPTCHA alebo 2FA
- Skuste urcit vlastne nazvy poli v Pokrocilych nastaveniach
- Your site might use JavaScript-based authentication (not supported)
Alternativy, ak prehladavanie nefunguje:
- Docasne spristupnite stranky verejnosti, prehladajte ich a potom znovu zapnite ochranu
- Ulozte stranky ako HTML subory a nahrajte ich cez Hromadne nahratie
Obsah sa javi neuplny
- Niektory obsah moze byt nacitany cez JavaScript (nie je extrahovany)
- Obsah moze byt v obrazkoch (nie je extrahovany ako text)
- Riesenie: Pridajte chybajuci obsah rucne cez nahratie textu alebo PDF