Vissza az iranyitopultra

Dokumentacio

Ismerje meg az Asyntai hasznalatat

Weboldal feltérképezése

Automatikusan vonja ki a tartalmat weboldala oldalaiból

Feltérképezés indítása

Áttekintés

A weboldal-feltérképező automatikusan felfedezi és kinyeri a tartalmat weboldala több oldaláról. Ahelyett, hogy egyenként adná hozzá az oldalakat, feltérképezheti az egész webhelyet (vagy meghatározott részeket), és az összes tartalom automatikusan bekerül az AI tudásbázisába.

A feltérképező hivatkozásokat követ az oldalak felfedezéséhez, szöveges tartalmat von ki, és mindent feldolgoz, hogy az AI válaszolhasson a weboldalával kapcsolatos kérdésekre.

Feltérképezési módok

Igényeitől függően két feltérképezési mód közül választhat:

Automatikus mód

A feltérképező a kezdőlapjáról indul, és automatikusan felfedezi az oldalakat hivatkozások követésével. Ellenőrzi a sitemap.xml fájlt is, ha elérhető. A legjobb megoldás az egész weboldal vagy nagy részeinek feltérképezéséhez.

Minden csomag

Kézi mód

Pontos URL-eket adhat meg a feltérképezéshez (vesszővel elválasztva). A feltérképező csak azokat az adott oldalakat látogatja meg. A legjobb megoldás, ha csak bizonyos oldalakat szeretne hozzáadni a tudásbázishoz.

Feltérképezési korlátok csomagonként

Az egyszerre feltérképezhető oldalak maximális száma a csomagtól függ:

Csomag Maximális oldalszám Kézi mód Jelszóval védett
Ingyenes 50 oldal
Starter 250 oldal
Standard 1 000 oldal
Pro 5 000 oldal

Jelszóval védett oldalak

Bejelentkezés mögötti oldalakat kell feltérképeznie? Engedélyezze a „Jelszóval védett oldalak" lehetőséget a csak tagok számára elérhető tartalmak, irányítópultok vagy webhelye bármely jelszóval védett területének feltérképezéséhez.

Használati útmutató

  1. Engedélyezze a „Jelszóval védett oldalak" kapcsolót a feltérképezési oldalon
  2. Adja meg a bejelentkezési oldal URL-jét (pl. yoursite.com/login)
  3. Adja meg a felhasználónevét/e-mail-címét és a jelszavát
  4. Kattintson a Feltérképezés indítása gombra – a rendszer először bejelentkezik, majd feltérképezi a védett oldalakat

Hogyan működik

Amikor engedélyezi a jelszavas védelmet, a feltérképező:

  1. Visits your login page and detects the form fields automatically
  2. Elküldi a hitelesítő adatait (beleértve a CSRF tokeneket)
  3. Fenntartja a hitelesített munkamenetet feltérképezés közben
  4. Starts from where you're redirected after login (e.g., your dashboard)
  5. Felfedezi és feltérképezi az összes megtalálható védett oldalt

Tipp: A feltérképező automatikusan érzékeli az űrlapmezőket (e-mail, felhasználónév, jelszó) és a biztonsági tokeneket, így a legtöbb bejelentkezési űrlappal működik további konfiguráció nélkül.

Haladó: egyéni mezőnevek

Ha a bejelentkezési űrlapja nem szabványos mezőneveket használ, bontsa ki a „Haladó" részt, és adja meg:

  • Felhasználónév mező neve – Az űrlap felhasználónév/e-mail mezőjének neve (pl. user_email)
  • Jelszó mező neve – Az űrlap jelszó mezőjének neve (pl. user_pass)

Korlátok: A jelszóval védett feltérképezés szabványos HTML bejelentkezési űrlapokkal működik. Előfordulhat, hogy nem működik a következőkkel:

  • JavaScript-based logins (React, Vue, Angular single-page apps)
  • CAPTCHA vagy reCAPTCHA által védett bejelentkezések
  • Kétfaktoros hitelesítés (2FA)
  • OAuth bejelentkezések (Google, Facebook stb.)
  • Többlépéses bejelentkezési folyamatok

Tipp: Személyes fiókja helyett fontolja meg egy kifejezetten feltérképezésre létrehozott dedikált fiók létrehozását. Ez lehetővé teszi, hogy pontosan szabályozza, mihez férhet hozzá a feltérképező.

Bevált gyakorlatok

Feltérképezés előtt

  • Make sure your website is accessible and pages load correctly
  • Check that important pages are linked from your homepage or sitemap
  • For password-protected crawls, verify your credentials work

Oldalak kiválasztása

  • Start with your most important pages - product pages, FAQs, services
  • Használja a kézi módot, ha csak meghatározott oldalakra van szüksége
  • Avoid crawling pages with outdated or inaccurate information

Feltérképezés után

  • Tekintse át a feltérképezett tartalmat a tudásbázisában
  • Távolítsa el a rögzített irreleváns oldalakat
  • Tesztelje az AI-t a feltérképezett tartalommal kapcsolatos kérdésekkel
  • Rendszeresen végezzen újrafeltérképezést a tartalom naprakészen tartásához

Megjegyzés: Minden új feltérképezés felváltja az előzőt az adott webhelyhez. Az AI mindig a legutóbb feltérképezett tartalmat fogja használni.

Feltérképezett oldalak kezelése

A feltérképezés befejezése után megtekintheti és kezelheti az egyes oldalakat az Irányítópult Tudásbázis részéből.

Oldaltartalom előnézete

  1. Lépjen az Irányítópultra, és nyissa meg a Tudásbázis részt
  2. Kattintson egy feltérképezési elemre a megnyitáshoz – megjelenik az összes feltérképezett oldal listája
  3. Kattintson bármelyik oldal címére a kinyert tartalom előnézetéhez
  4. Használja a Vissza az oldalakhoz gombot az oldallistához való visszatéréshez

Tipp: Az oldalak előnézete remek módszer annak ellenőrzésére, hogy a feltérképező a megfelelő tartalmat vonta-e ki. Ha egy oldal rossznak tűnik, közvetlenül szerkesztheti, vagy törölheti, és manuálisan adhatja hozzá a tartalmat.

Egyes oldalak szerkesztése

Szerkesztheti bármely feltérképezett oldal kinyert tartalmát. Ez hasznos formázási problémák javításához, irreleváns szakaszok eltávolításához vagy hiányzó információk hozzáadásához.

  1. Open the crawl item and click a page title to view its content
  2. Kattintson a Szerkesztés gombra az előnézet tetején
  3. Módosítsa a címet vagy a tartalmat szükség szerint
  4. Kattintson a Mentés és újrabeágyazás gombra – az oldal AI-beágyazásai újragenerálódnak a frissített tartalommal

Megjegyzés: Egy oldal szerkesztése csak azt az adott oldalt ágyazza be újra, nem az egész feltérképezést. A többi feltérképezett oldal érintetlen marad.

Egyes oldalak újbóli bejárása

Ha a weboldala egy oldala frissült, újra bejárhatja csak azt az oldalt anélkül, hogy az egész weboldalt újra kellene járnia.

  1. Nyissa meg a feltérképezési elemet a Tudásbázisából
  2. Click the re-crawl button next to the page you want to update
  3. Megerősítés — az oldal újra lekérdezésre kerül és a beágyazásai frissülnek a legújabb tartalommal

Tipp: Ez kiváló az egyes oldalak naprakészen tartásához a tartalom módosítása után, anélkül hogy százakat kellene újra bejárni.

Egyes oldalak törlése

Eltávolíthat meghatározott oldalakat egy feltérképezésből anélkül, hogy az egész feltérképezést törölné. Ez hasznos irreleváns, duplikált vagy helytelenül feltérképezett oldalak eltávolításához.

  1. Nyissa meg a feltérképezési elemet a Tudásbázisából
  2. Kattintson a törlés gombra az eltávolítani kívánt oldal mellett
  3. Erősítse meg a törlést – az oldal és beágyazásai véglegesen eltávolítódnak

Megjegyzés: Ha törli az összes oldalt egy feltérképezésből, az egész feltérképezési bejegyzés automatikusan eltávolítódik a tudásbázisából.

Hibaelhárítás

A feltérképezés a vártnál kevesebb oldalt ad vissza

  • Pages might not be linked from discoverable pages
  • Egyes oldalakat blokkolhat a robots.txt fájl
  • Cloudflare or other security services might block the crawler
  • Solution: Use Manual mode to specify exact URLs

A jelszóval védett feltérképezés sikertelen

  • Ellenőrizze, hogy a hitelesítő adatai helyesek-e
  • Ellenőrizze, hogy a bejelentkezés CAPTCHA-t vagy 2FA-t használ-e
  • Próbálja meg megadni az egyéni mezőneveket a Haladó beállításokban
  • Webhelye JavaScript-alapú hitelesítést használhat (nem támogatott)

Alternatívák, ha a feltérképezés nem működik:

  • Ideiglenesen tegye nyilvánossá az oldalakat, térképezze fel őket, majd engedélyezze újra a védelmet
  • Mentse az oldalakat HTML-fájlként, és töltse fel őket a Tömeges feltöltésen keresztül

A tartalom hiányosnak tűnik

  • Egyes tartalmak JavaScript-en keresztül töltődhetnek be (nem kinyerhetők)
  • A tartalom képekben lehet (nem nyerhető ki szövegként)
  • Megoldás: Adja hozzá a hiányzó tartalmat manuálisan szöveges vagy PDF feltöltésen keresztül