Weboldal feltérképezése
Automatikusan vonja ki a tartalmat weboldala oldalaiból
Áttekintés
A weboldal-feltérképező automatikusan felfedezi és kinyeri a tartalmat weboldala több oldaláról. Ahelyett, hogy egyenként adná hozzá az oldalakat, feltérképezheti az egész webhelyet (vagy meghatározott részeket), és az összes tartalom automatikusan bekerül az AI tudásbázisába.
A feltérképező hivatkozásokat követ az oldalak felfedezéséhez, szöveges tartalmat von ki, és mindent feldolgoz, hogy az AI válaszolhasson a weboldalával kapcsolatos kérdésekre.
Feltérképezési módok
Igényeitől függően két feltérképezési mód közül választhat:
Automatikus mód
A feltérképező a kezdőlapjáról indul, és automatikusan felfedezi az oldalakat hivatkozások követésével. Ellenőrzi a sitemap.xml fájlt is, ha elérhető. A legjobb megoldás az egész weboldal vagy nagy részeinek feltérképezéséhez.
Minden csomagKézi mód
Pontos URL-eket adhat meg a feltérképezéshez (vesszővel elválasztva). A feltérképező csak azokat az adott oldalakat látogatja meg. A legjobb megoldás, ha csak bizonyos oldalakat szeretne hozzáadni a tudásbázishoz.
Starter+Feltérképezési korlátok csomagonként
Az egyszerre feltérképezhető oldalak maximális száma a csomagtól függ:
| Csomag | Maximális oldalszám | Kézi mód | Jelszóval védett |
|---|---|---|---|
| Ingyenes | 50 oldal | ||
| Starter | 250 oldal | ||
| Standard | 1 000 oldal | ||
| Pro | 5 000 oldal |
Jelszóval védett oldalak Starter+
Bejelentkezés mögötti oldalakat kell feltérképeznie? Engedélyezze a „Jelszóval védett oldalak" lehetőséget a csak tagok számára elérhető tartalmak, irányítópultok vagy webhelye bármely jelszóval védett területének feltérképezéséhez.
Használati útmutató
- Engedélyezze a „Jelszóval védett oldalak" kapcsolót a feltérképezési oldalon
- Adja meg a bejelentkezési oldal URL-jét (pl.
yoursite.com/login) - Adja meg a felhasználónevét/e-mail-címét és a jelszavát
- Kattintson a Feltérképezés indítása gombra – a rendszer először bejelentkezik, majd feltérképezi a védett oldalakat
Hogyan működik
Amikor engedélyezi a jelszavas védelmet, a feltérképező:
- Visits your login page and detects the form fields automatically
- Elküldi a hitelesítő adatait (beleértve a CSRF tokeneket)
- Fenntartja a hitelesített munkamenetet feltérképezés közben
- Starts from where you're redirected after login (e.g., your dashboard)
- Felfedezi és feltérképezi az összes megtalálható védett oldalt
Tipp: A feltérképező automatikusan érzékeli az űrlapmezőket (e-mail, felhasználónév, jelszó) és a biztonsági tokeneket, így a legtöbb bejelentkezési űrlappal működik további konfiguráció nélkül.
Haladó: egyéni mezőnevek
Ha a bejelentkezési űrlapja nem szabványos mezőneveket használ, bontsa ki a „Haladó" részt, és adja meg:
- Felhasználónév mező neve – Az űrlap felhasználónév/e-mail mezőjének neve (pl.
user_email) - Jelszó mező neve – Az űrlap jelszó mezőjének neve (pl.
user_pass)
Korlátok: A jelszóval védett feltérképezés szabványos HTML bejelentkezési űrlapokkal működik. Előfordulhat, hogy nem működik a következőkkel:
- JavaScript-based logins (React, Vue, Angular single-page apps)
- CAPTCHA vagy reCAPTCHA által védett bejelentkezések
- Kétfaktoros hitelesítés (2FA)
- OAuth bejelentkezések (Google, Facebook stb.)
- Többlépéses bejelentkezési folyamatok
Tipp: Személyes fiókja helyett fontolja meg egy kifejezetten feltérképezésre létrehozott dedikált fiók létrehozását. Ez lehetővé teszi, hogy pontosan szabályozza, mihez férhet hozzá a feltérképező.
Bevált gyakorlatok
Feltérképezés előtt
- Make sure your website is accessible and pages load correctly
- Check that important pages are linked from your homepage or sitemap
- For password-protected crawls, verify your credentials work
Oldalak kiválasztása
- Start with your most important pages - product pages, FAQs, services
- Használja a kézi módot, ha csak meghatározott oldalakra van szüksége
- Avoid crawling pages with outdated or inaccurate information
Feltérképezés után
- Tekintse át a feltérképezett tartalmat a tudásbázisában
- Távolítsa el a rögzített irreleváns oldalakat
- Tesztelje az AI-t a feltérképezett tartalommal kapcsolatos kérdésekkel
- Rendszeresen végezzen újrafeltérképezést a tartalom naprakészen tartásához
Megjegyzés: Minden új feltérképezés felváltja az előzőt az adott webhelyhez. Az AI mindig a legutóbb feltérképezett tartalmat fogja használni.
Feltérképezett oldalak kezelése
A feltérképezés befejezése után megtekintheti és kezelheti az egyes oldalakat az Irányítópult Tudásbázis részéből.
Oldaltartalom előnézete
- Lépjen az Irányítópultra, és nyissa meg a Tudásbázis részt
- Kattintson egy feltérképezési elemre a megnyitáshoz – megjelenik az összes feltérképezett oldal listája
- Kattintson bármelyik oldal címére a kinyert tartalom előnézetéhez
- Használja a Vissza az oldalakhoz gombot az oldallistához való visszatéréshez
Tipp: Az oldalak előnézete remek módszer annak ellenőrzésére, hogy a feltérképező a megfelelő tartalmat vonta-e ki. Ha egy oldal rossznak tűnik, közvetlenül szerkesztheti, vagy törölheti, és manuálisan adhatja hozzá a tartalmat.
Egyes oldalak szerkesztése Starter+
Szerkesztheti bármely feltérképezett oldal kinyert tartalmát. Ez hasznos formázási problémák javításához, irreleváns szakaszok eltávolításához vagy hiányzó információk hozzáadásához.
- Open the crawl item and click a page title to view its content
- Kattintson a Szerkesztés gombra az előnézet tetején
- Módosítsa a címet vagy a tartalmat szükség szerint
- Kattintson a Mentés és újrabeágyazás gombra – az oldal AI-beágyazásai újragenerálódnak a frissített tartalommal
Megjegyzés: Egy oldal szerkesztése csak azt az adott oldalt ágyazza be újra, nem az egész feltérképezést. A többi feltérképezett oldal érintetlen marad.
Egyes oldalak újbóli bejárása Starter+
Ha a weboldala egy oldala frissült, újra bejárhatja csak azt az oldalt anélkül, hogy az egész weboldalt újra kellene járnia.
- Nyissa meg a feltérképezési elemet a Tudásbázisából
- Click the re-crawl button next to the page you want to update
- Megerősítés — az oldal újra lekérdezésre kerül és a beágyazásai frissülnek a legújabb tartalommal
Tipp: Ez kiváló az egyes oldalak naprakészen tartásához a tartalom módosítása után, anélkül hogy százakat kellene újra bejárni.
Egyes oldalak törlése
Eltávolíthat meghatározott oldalakat egy feltérképezésből anélkül, hogy az egész feltérképezést törölné. Ez hasznos irreleváns, duplikált vagy helytelenül feltérképezett oldalak eltávolításához.
- Nyissa meg a feltérképezési elemet a Tudásbázisából
- Kattintson a törlés gombra az eltávolítani kívánt oldal mellett
- Erősítse meg a törlést – az oldal és beágyazásai véglegesen eltávolítódnak
Megjegyzés: Ha törli az összes oldalt egy feltérképezésből, az egész feltérképezési bejegyzés automatikusan eltávolítódik a tudásbázisából.
Hibaelhárítás
A feltérképezés a vártnál kevesebb oldalt ad vissza
- Pages might not be linked from discoverable pages
- Egyes oldalakat blokkolhat a robots.txt fájl
- Cloudflare or other security services might block the crawler
- Solution: Use Manual mode to specify exact URLs
A jelszóval védett feltérképezés sikertelen
- Ellenőrizze, hogy a hitelesítő adatai helyesek-e
- Ellenőrizze, hogy a bejelentkezés CAPTCHA-t vagy 2FA-t használ-e
- Próbálja meg megadni az egyéni mezőneveket a Haladó beállításokban
- Webhelye JavaScript-alapú hitelesítést használhat (nem támogatott)
Alternatívák, ha a feltérképezés nem működik:
- Ideiglenesen tegye nyilvánossá az oldalakat, térképezze fel őket, majd engedélyezze újra a védelmet
- Mentse az oldalakat HTML-fájlként, és töltse fel őket a Tömeges feltöltésen keresztül
A tartalom hiányosnak tűnik
- Egyes tartalmak JavaScript-en keresztül töltődhetnek be (nem kinyerhetők)
- A tartalom képekben lehet (nem nyerhető ki szövegként)
- Megoldás: Adja hozzá a hiányzó tartalmat manuálisan szöveges vagy PDF feltöltésen keresztül