Späť na panel

Dokumentácia

Naučte sa používať Asyntai

Prehľadávanie webu

Automaticky extrahujte obsah z vašich webových stránok

Začať prechádzanie

Prehľad

Prehľadávač webu automaticky objavuje a extrahuje obsah z viacerých stránok na vašom webe. Namiesto pridávania stránok jednej po druhej môžete prehľadať celý svoj web (alebo konkrétne sekcie) a mať všetok obsah automaticky pridaný do znalostnej bázy vašej AI.

Prehľadávač sleduje odkazy na objavovanie stránok, extrahuje textový obsah a spracuje všetko, aby vaša AI mohla odpovedať na otázky o vašom webe.

Automatické obohatenie obsahu

Ak je váš web postavený na populárnej platforme ako WordPress, Shopify, WooCommerce, Drupal, Squarespace alebo Strapi, prehľadávač automaticky sťahuje ďalší štruktúrovaný obsah popri bežných stránkach — napríklad celý katalóg produktov, blogové príspevky, kategórie a zoznamy.

Nemusíte nič konfigurovať. Ak je váš web postavený na podporovanej platforme, vaša AI automaticky získa bohatšie a lepšie organizované znalosti.

Režimy prehľadávania

Môžete si vybrať medzi dvoma režimami prehľadávania podľa vašich potrieb:

Automatický režim

Prehľadávač začne z vašej domovskej stránky a automaticky objavuje stránky sledovaním odkazov. Taktiež kontroluje váš sitemap.xml, ak je dostupný. Najlepšie na prehľadávanie celej vašej webovej stránky alebo jej veľkých častí.

Všetky plány

Manuálny režim

Uvediete presné URL na prehľadávanie (oddelené čiarkou). Prehľadávač navštívi iba tie konkrétne stránky. Najlepšie, keď chcete do znalostnej bázy pridať iba určité stránky.

Limity prehľadávania podľa plánu

Maximálny počet stránok, ktoré môžete prehľadať, závisí od vášho plánu:

Plán Max. stránok Manuálny režim Chránené heslom
Free 50 stranok
Starter 250 stranok
Standard 1 000 stranok
Pro 5 000 stranok

Stránky chránené heslom

Potrebujete prehľadávať stránky za prihlásením? Povoľte možnosť "Stránky chránené heslom" na prehľadávanie obsahu iba pre členov, panelov alebo akýchkoľvek oblastí vašej webovej stránky chránených heslom.

Ako používať

  1. Povoľte prepínač "Stránky chránené heslom" na stránke prehľadávania
  2. Zadajte URL prihlasovacej stránky (napr. vasastranka.sk/prihlasenie)
  3. Zadajte svoje Používateľské meno/E-mail a Heslo
  4. Kliknite na Začať prehľadávanie - systém sa najprv prihlási a potom prehľadá chránené stránky

Ako to funguje

Keď povolíte ochranu heslom, prehľadávač:

  1. Navštívi vašu prihlasovaciu stránku a automaticky deteguje polia formulára
  2. Odošle vaše prihlasovacie údaje (vrátane akýchkoľvek CSRF tokenov)
  3. Udržuje autentifikovanú reláciu počas prehľadávania
  4. Začne odtiaľ, kam ste presmerovaný po prihlásení (napr. váš panel)
  5. Objaví a prehľadá všetky chránené stránky, ktoré nájde

Tip: Prehľadávač automaticky deteguje polia formulára (e-mail, používateľské meno, heslo) a bezpečnostné tokeny, takže funguje s väčšinou prihlasovacích formulárov bez ďalšej konfigurácie.

Pokročilé: Vlastné názvy polí

Ak váš prihlasovací formulár používa neštandardné názvy polí, rozbaľte sekciu "Pokročilé" a uveďte:

  • Názov poľa používateľského mena - Názov poľa formulára pre používateľské meno/e-mail (napr. user_email)
  • Názov poľa hesla - Názov poľa formulára pre heslo (napr. user_pass)

Obmedzenia: Prehľadávanie chránené heslom funguje so štandardnými HTML prihlasovacími formulármi. Nemusí fungovať s:

  • Prihlásenia založené na JavaScript (React, Vue, Angular jednostránkové aplikácie)
  • Prihláseniami chránenými CAPTCHA alebo reCAPTCHA
  • Dvojfaktorová autentifikácia (2FA)
  • OAuth prihláseniami (Google, Facebook atď.)
  • Viackrokové prihlasovacie postupy

Tip: Namiesto používania osobného účtu zvážte vytvorenie špeciálneho účtu konkrétne na prehľadávanie. To vám umožní presne kontrolovať, k čomu má prehľadávač prístup.

Osvedčené postupy

Pred prehľadávaním

  • Uistite sa, že váš web je prístupný a stránky sa správne načítavajú
  • Skontrolujte, či sú dôležité stránky prepojené z vašej domovskej stránky alebo mapy webu
  • Pri prehľadávaní chránenom heslom si overte funkčnosť svojich prihlasovacích údajov

Výber stránok

  • Začnite s najdôležitejšími stránkami – produktové stránky, často kladené otázky, služby
  • Použite manuálny režim, ak potrebujete iba konkrétne stránky
  • Vyhnite sa prehľadávaniu stránok s neaktuálnymi alebo nepresnými informáciami

Po prehľadávaní

  • Prezrite si prehľadaný obsah vo vašej znalostnej báze
  • Odstráňte akékoľvek irelevantné stránky, ktoré boli zachytené
  • Otestujte svoju AI otázkami o prehľadanom obsahu
  • Pravidelne opäť prehľadávajte, aby bol obsah aktuálny

Poznámka: Každé nové prehľadávanie nahradí predchádzajúce pre danú webovú stránku. Vaša AI bude vždy používať naposledy prehľadaný obsah.

Správa prehľadaných stránok

Po dokončení prehľadávania môžete zobraziť náhľad a spravovať jednotlivé stránky v sekcii Znalostná báza na vašom Paneli.

Náhľad obsahu stránky

  1. Prejdite na svoj Panel a otvorte sekciu Znalostna baza
  2. Kliknite na polozku prehladavania, aby ste ju otvorili — uvidite zoznam vsetkych prehladanych stranok
  3. Kliknite na akýkoľvek názov stránky pre náhľad extrahovaného obsahu
  4. Pouzite tlacidlo Spat na stranky na navrat do zoznamu stranok

Tip: Nahlad stranok je skvelym sposobom, ako overit, ze prehladavac extrahoval spravny obsah. Ak stranka vyzera nespravne, mozete ju priamo upravit alebo vymazat a pridat obsah rucne.

Úprava jednotlivých stránok

Mozete upravit extrahovany obsah akejkolvek prehladanej stranky. To je uzitocne na opravu problemov s formatovanim, odstranenie irelevantnych sekcii alebo pridanie chybajucich informacii.

  1. Otvorte položku prehľadávania a kliknite na názov stránky pre zobrazenie jej obsahu
  2. Kliknite na tlačidlo Upraviť v hornej časti náhľadu
  3. Upravte názov alebo obsah podľa potreby
  4. Kliknite na Save & Re-embed — AI vkladania stránky budú regenerované s aktualizovaným obsahom

Poznámka: Uprava stranky znovu vlozi iba tu konkretnu stranku, nie cele prehladanie. Vase ostatne prehladane stranky nie su ovplyvnene.

Opakovane prehladavanie jednotlivych stranok

Ak bola stranka na vasej webovej stranke aktualizovana, mozete prehladat len tu stranku bez prehladavania celej webovej stranky.

  1. Otvorte položku prehľadávania z vašej Znalostnej bázy
  2. Kliknite na tlačidlo re-crawl vedľa stránky, ktorú chcete aktualizovať
  3. Potvrdite — stranka bude znovu stiahnuta a jej embeddingy aktualizovane najnovsim obsahom

Tip: Toto je skvelne pre udrzanie jednotlivych stranok aktualizovanych po zmenach obsahu bez nutnosti opakovaneho prehladania stoviek stranok.

Odstránenie jednotlivých stránok

Mozete odstranit konkretne stranky z prehladavania bez odstranenia celeho prehladavania. To je uzitocne na odstranenie irelevantnych, duplicitnych alebo nespravne prehladanych stranok.

  1. Otvorte položku prehľadávania z vašej Znalostnej bázy
  2. Kliknite na tlacidlo vymazat vedla stranky, ktoru chcete odstranit
  3. Potvrdte odstranenie — stranka a jej vkladania budu trvalo odstranene

Poznámka: Ak odstranite vsetky stranky z prehladavania, cely zaznam prehladavania bude automaticky odstraneny z vasej znalostnej bazy.

Riešenie problémov

Prehľadávanie vracia menej stránok, než sa očakávalo

  • Stránky nemusia byť prepojené z objaviteľných stránok
  • Niektoré stránky môžu byť blokované súborom robots.txt
  • Cloudflare alebo iné bezpečnostné služby môžu blokovať prehľadávač
  • Riešenie: Použite manuálny režim na určenie presných URL

Prehľadávanie chráneného heslom zlyháva

  • Overte, že vaše prihlasovacie údaje sú správne
  • Skontrolujte, či vaše prihlásenie používa CAPTCHA alebo 2FA
  • Skúste určiť vlastné názvy polí v Pokročilých nastaveniach
  • Váš web môže používať autentifikáciu založenú na JavaScript (nie je podporovaná)

Alternatívy, ak prehľadávanie nefunguje:

  • Docasne spristupnite stranky verejnosti, prehladajte ich a potom znovu zapnite ochranu
  • Ulozte stranky ako HTML subory a nahrajte ich cez Hromadne nahratie

Obsah sa javí neúplný

  • Niektorý obsah môže byť načítaný cez JavaScript (nie je extrahovaný)
  • Obsah môže byť v obrázkoch (nie je extrahovaný ako text)
  • Riesenie: Pridajte chybajuci obsah rucne cez nahratie textu alebo PDF