-
Fototrend

Új hozzászólás Aktív témák
-
bambano
titán
válasz
Sk8erPeter
#8246
üzenetére
Simán

Ez volt az eredeti link: /direkt nem linkként/
http://ingatlan.com/kutvolgy/elado+lakas/tegla-epitesu-lakas/budapest+12+kerulet+dios+arok/21040926?sid=6ebből, és ha megnézed az oldalt, amire mutat, látszik, hogy a 21040926 a hirdetés azonosítója. így egy próbálkozást megért nekem tegnap este, hogy kigyaluljam belőle a nem fontosnak tűnő adatokat és maradt ez:
http://ingatlan.com/21040926
ezt le lehet tölteni a weblapról, és abban benne van minden. ezek után belenézel a html-be, és megtalálod, hogy így írták le a dolgokat:
<tr><th>Ingatlan állapota</th></td><td>újszerű</td><th>Emelet</th></td><td>2</td></tr>
<tr><th>Épület szintjei</th></td><td>3</td><th>Fűtés</th></td><td>házközponti egyedi méréssel</td></tr>tehát azt a két sort kell kiszedni, amiben az Emelet és a szintjei string szerepel.
ez linuxon kb. ennyi:
wget -O - http://ingatlan.com/21040926 | egrep 'Emelet|szintjei'a többit már csak egy kis seddel vagy awk-kal ki lehet szedni. ha a hozzá tartozó számok egyenlőek, akkor az url-ben levő azonosítót kell letárolni.
értelemszerűen az azonosítót, mint ciklusváltozót kezelve le lehet nyalni a komplett adatbázist. (most nem tekintem, hogy ezért lelőnek)
ha ezt a kérdéskört bedobod a nagy shell script topicban, negyed óra alatt összedobják neked a komplett megoldást

megjegyzem, ezzel a paranccsal csak azt az egy html oldalt tölti le, ami karakteresen tartalmazza az adatot. a sallangokat, képet, css-t, egyebet nem. ennél kevesebből szerintem nem lehet megoldani, feltéve, hogy nincs közvetlen adatbázis hozzáférése.
szerk: arra azért készülj fel lélekben, hogy nem lesz minden oldalon minden adat pontosan kitöltve, tehát lehet, hogy több változat lesz a string keresésre.
Új hozzászólás Aktív témák
● olvasd el a téma összefoglalót!
- TCL LCD és LED TV-k
- Nem indul és mi a baja a gépemnek topik
- Allegro vélemények - tapasztalatok
- Máris elfogytak az idei évre szánt HDD-k a Western Digitalnál
- Luck Dragon: Asszociációs játék. :)
- Kormányok / autós szimulátorok topikja
- Samsung Galaxy Felhasználók OFF topicja
- E-roller topik
- pfSense - Avagy az okosított házirouter
- Google Pixel topik
- További aktív témák...
- ÚJ akksi! GigaAKCIÓ! Lenovo ThinkPad P15 Gen 2 Intel i7-11850H 32GB 512GB Nvidia RTX A3000 1 év gar
- Keresünk iPhone 14/14 Plus/14 Pro/14 Pro Max
- Új könyv: Harrari: Sapiens Rajzolt történelem
- Svájci jellegű bicska eladó
- GYÖNYÖRŰ iPhone 13 Pro 128GB Sierra Blue -1 ÉV GARANCIA - Kártyafüggetlen, MS4403
Állásajánlatok
Cég: Laptopműhely Bt.
Város: Budapest
Cég: PCMENTOR SZERVIZ KFT.
Város: Budapest



