Prehľadávanie webu
Automaticky extrahujte obsah z vašich webových stránok
Prehľad
Prehľadávač webu automaticky objavuje a extrahuje obsah z viacerých stránok na vašom webe. Namiesto pridávania stránok jednej po druhej môžete prehľadať celý svoj web (alebo konkrétne sekcie) a mať všetok obsah automaticky pridaný do znalostnej bázy vašej AI.
Prehľadávač sleduje odkazy na objavovanie stránok, extrahuje textový obsah a spracuje všetko, aby vaša AI mohla odpovedať na otázky o vašom webe.
Automatické obohatenie obsahu
Ak je váš web postavený na populárnej platforme ako WordPress, Shopify, WooCommerce, Drupal, Squarespace alebo Strapi, prehľadávač automaticky sťahuje ďalší štruktúrovaný obsah popri bežných stránkach — napríklad celý katalóg produktov, blogové príspevky, kategórie a zoznamy.
Nemusíte nič konfigurovať. Ak je váš web postavený na podporovanej platforme, vaša AI automaticky získa bohatšie a lepšie organizované znalosti.
Režimy prehľadávania
Môžete si vybrať medzi dvoma režimami prehľadávania podľa vašich potrieb:
Automatický režim
Prehľadávač začne z vašej domovskej stránky a automaticky objavuje stránky sledovaním odkazov. Taktiež kontroluje váš sitemap.xml, ak je dostupný. Najlepšie na prehľadávanie celej vašej webovej stránky alebo jej veľkých častí.
Všetky plányManuálny režim
Uvediete presné URL na prehľadávanie (oddelené čiarkou). Prehľadávač navštívi iba tie konkrétne stránky. Najlepšie, keď chcete do znalostnej bázy pridať iba určité stránky.
Starter+Limity prehľadávania podľa plánu
Maximálny počet stránok, ktoré môžete prehľadať, závisí od vášho plánu:
| Plán | Max. stránok | Manuálny režim | Chránené heslom |
|---|---|---|---|
| Free | 50 stranok | ||
| Starter | 250 stranok | ||
| Standard | 1 000 stranok | ||
| Pro | 5 000 stranok |
Stránky chránené heslom Starter+
Potrebujete prehľadávať stránky za prihlásením? Povoľte možnosť "Stránky chránené heslom" na prehľadávanie obsahu iba pre členov, panelov alebo akýchkoľvek oblastí vašej webovej stránky chránených heslom.
Ako používať
- Povoľte prepínač "Stránky chránené heslom" na stránke prehľadávania
- Zadajte URL prihlasovacej stránky (napr.
vasastranka.sk/prihlasenie) - Zadajte svoje Používateľské meno/E-mail a Heslo
- Kliknite na Začať prehľadávanie - systém sa najprv prihlási a potom prehľadá chránené stránky
Ako to funguje
Keď povolíte ochranu heslom, prehľadávač:
- Navštívi vašu prihlasovaciu stránku a automaticky deteguje polia formulára
- Odošle vaše prihlasovacie údaje (vrátane akýchkoľvek CSRF tokenov)
- Udržuje autentifikovanú reláciu počas prehľadávania
- Začne odtiaľ, kam ste presmerovaný po prihlásení (napr. váš panel)
- Objaví a prehľadá všetky chránené stránky, ktoré nájde
Tip: Prehľadávač automaticky deteguje polia formulára (e-mail, používateľské meno, heslo) a bezpečnostné tokeny, takže funguje s väčšinou prihlasovacích formulárov bez ďalšej konfigurácie.
Pokročilé: Vlastné názvy polí
Ak váš prihlasovací formulár používa neštandardné názvy polí, rozbaľte sekciu "Pokročilé" a uveďte:
- Názov poľa používateľského mena - Názov poľa formulára pre používateľské meno/e-mail (napr.
user_email) - Názov poľa hesla - Názov poľa formulára pre heslo (napr.
user_pass)
Obmedzenia: Prehľadávanie chránené heslom funguje so štandardnými HTML prihlasovacími formulármi. Nemusí fungovať s:
- Prihlásenia založené na JavaScript (React, Vue, Angular jednostránkové aplikácie)
- Prihláseniami chránenými CAPTCHA alebo reCAPTCHA
- Dvojfaktorová autentifikácia (2FA)
- OAuth prihláseniami (Google, Facebook atď.)
- Viackrokové prihlasovacie postupy
Tip: Namiesto používania osobného účtu zvážte vytvorenie špeciálneho účtu konkrétne na prehľadávanie. To vám umožní presne kontrolovať, k čomu má prehľadávač prístup.
Osvedčené postupy
Pred prehľadávaním
- Uistite sa, že váš web je prístupný a stránky sa správne načítavajú
- Skontrolujte, či sú dôležité stránky prepojené z vašej domovskej stránky alebo mapy webu
- Pri prehľadávaní chránenom heslom si overte funkčnosť svojich prihlasovacích údajov
Výber stránok
- Začnite s najdôležitejšími stránkami – produktové stránky, často kladené otázky, služby
- Použite manuálny režim, ak potrebujete iba konkrétne stránky
- Vyhnite sa prehľadávaniu stránok s neaktuálnymi alebo nepresnými informáciami
Po prehľadávaní
- Prezrite si prehľadaný obsah vo vašej znalostnej báze
- Odstráňte akékoľvek irelevantné stránky, ktoré boli zachytené
- Otestujte svoju AI otázkami o prehľadanom obsahu
- Pravidelne opäť prehľadávajte, aby bol obsah aktuálny
Poznámka: Každé nové prehľadávanie nahradí predchádzajúce pre danú webovú stránku. Vaša AI bude vždy používať naposledy prehľadaný obsah.
Správa prehľadaných stránok
Po dokončení prehľadávania môžete zobraziť náhľad a spravovať jednotlivé stránky v sekcii Znalostná báza na vašom Paneli.
Náhľad obsahu stránky
- Prejdite na svoj Panel a otvorte sekciu Znalostna baza
- Kliknite na polozku prehladavania, aby ste ju otvorili — uvidite zoznam vsetkych prehladanych stranok
- Kliknite na akýkoľvek názov stránky pre náhľad extrahovaného obsahu
- Pouzite tlacidlo Spat na stranky na navrat do zoznamu stranok
Tip: Nahlad stranok je skvelym sposobom, ako overit, ze prehladavac extrahoval spravny obsah. Ak stranka vyzera nespravne, mozete ju priamo upravit alebo vymazat a pridat obsah rucne.
Úprava jednotlivých stránok Starter+
Mozete upravit extrahovany obsah akejkolvek prehladanej stranky. To je uzitocne na opravu problemov s formatovanim, odstranenie irelevantnych sekcii alebo pridanie chybajucich informacii.
- Otvorte položku prehľadávania a kliknite na názov stránky pre zobrazenie jej obsahu
- Kliknite na tlačidlo Upraviť v hornej časti náhľadu
- Upravte názov alebo obsah podľa potreby
- Kliknite na Save & Re-embed — AI vkladania stránky budú regenerované s aktualizovaným obsahom
Poznámka: Uprava stranky znovu vlozi iba tu konkretnu stranku, nie cele prehladanie. Vase ostatne prehladane stranky nie su ovplyvnene.
Opakovane prehladavanie jednotlivych stranok Starter+
Ak bola stranka na vasej webovej stranke aktualizovana, mozete prehladat len tu stranku bez prehladavania celej webovej stranky.
- Otvorte položku prehľadávania z vašej Znalostnej bázy
- Kliknite na tlačidlo re-crawl vedľa stránky, ktorú chcete aktualizovať
- Potvrdite — stranka bude znovu stiahnuta a jej embeddingy aktualizovane najnovsim obsahom
Tip: Toto je skvelne pre udrzanie jednotlivych stranok aktualizovanych po zmenach obsahu bez nutnosti opakovaneho prehladania stoviek stranok.
Odstránenie jednotlivých stránok
Mozete odstranit konkretne stranky z prehladavania bez odstranenia celeho prehladavania. To je uzitocne na odstranenie irelevantnych, duplicitnych alebo nespravne prehladanych stranok.
- Otvorte položku prehľadávania z vašej Znalostnej bázy
- Kliknite na tlacidlo vymazat vedla stranky, ktoru chcete odstranit
- Potvrdte odstranenie — stranka a jej vkladania budu trvalo odstranene
Poznámka: Ak odstranite vsetky stranky z prehladavania, cely zaznam prehladavania bude automaticky odstraneny z vasej znalostnej bazy.
Riešenie problémov
Prehľadávanie vracia menej stránok, než sa očakávalo
- Stránky nemusia byť prepojené z objaviteľných stránok
- Niektoré stránky môžu byť blokované súborom robots.txt
- Cloudflare alebo iné bezpečnostné služby môžu blokovať prehľadávač
- Riešenie: Použite manuálny režim na určenie presných URL
Prehľadávanie chráneného heslom zlyháva
- Overte, že vaše prihlasovacie údaje sú správne
- Skontrolujte, či vaše prihlásenie používa CAPTCHA alebo 2FA
- Skúste určiť vlastné názvy polí v Pokročilých nastaveniach
- Váš web môže používať autentifikáciu založenú na JavaScript (nie je podporovaná)
Alternatívy, ak prehľadávanie nefunguje:
- Docasne spristupnite stranky verejnosti, prehladajte ich a potom znovu zapnite ochranu
- Ulozte stranky ako HTML subory a nahrajte ich cez Hromadne nahratie
Obsah sa javí neúplný
- Niektorý obsah môže byť načítaný cez JavaScript (nie je extrahovaný)
- Obsah môže byť v obrázkoch (nie je extrahovaný ako text)
- Riesenie: Pridajte chybajuci obsah rucne cez nahratie textu alebo PDF