-
Fototrend

Új hozzászólás Aktív témák
-
Domonkos
addikt
-
válasz
total90
#12618
üzenetére
Név Utca Házszám Irányítószám Város
Igazabol ahogy felettem is irtak, a nev meg az utca kb eselytelen, hacsak nem talalsz egy olyan adatbazist, amiben minden varos minden utcaja szerepel, de meg ugy se 100%, bar ugy mar szerintem egy laza 90%-os szures megoldhato lenne.
Amugy az en algo-m ugy nezne ki, hogy jobbrol balra indulunk, igy nezve elso szam utani karaktersor a varos.
Marad az, hogy Név Utca Házszám Irányítószám.
Most balrol jobbra haladva elso szam utani ertek a Házszám Irányítószám.
Iranyitoszam minden esetben 4 karakter, igy az konnyu.
Maradt a Nev es az Utca.
Nevnel a fentebb emlitett ket nev, egy szokoz kombora losz, az a valosag ~90%-at lefedi.
Marad az utca, mint adott.De a nev - utca parost mindenkeppen le kell ellenorizned biorobot modszerrel.
-
Zalanius
tag
válasz
total90
#12618
üzenetére
"Név Utca Házszám Irányítószám Város"
Az eredeti kérdésben is írtad: a probléma az elválasztó karakter, ami ugyanolyan szóköz, amilyenből kis túlzással tetszőleges mennyiség előfordulhat a név, utca, város esetében mezőn belül is. Exceles eszközökkel stabil megoldás erre aligha lesz, még makrókkal sem, legfeljebb egy valamilyen közelítés. Itt az adatmennyiség a kulcs: pár száz sorig egyszerűen nem éri meg bonyolult szabályrendszereket kódolgatni, a humán erőforrás előbb végez. Ha valami nagyságrendekkel nagyobb listáról van szó, értékes adatokkal, amiből ez a katyvasz áll rendelkezésre, akkor meg a teljes folyamat defektes úgy, ahogy van...
Klasszikus adattisztítós / feltáró feladatként úgy ugranék neki, hogy ha nemzetköziek is a címek, azért a vonatkozó országok városainak (talán) teljes listája beszerezhető, ezért az azonosítás könnyű, ugyanígy az irányítószámok szerkezetére vonatkozó helyi szabályok. Utóbbi nyilván számokat is tartalmaz, ezért az utolsó ilyen töredék után már csak a városnevek lehetnek, a házszám szintén kell, hogy számokat tartalmazzon stb. Nyilván a név-utca felbontás a legtrükkösebb, pl. "Horváth Péter Mátyás Király tér".
De nem feltétlen kell ágyúval lőni az ilyen szóközös verébre. Vegyél egy pár soros mintát, nézd meg a tipikus szerkezetet. Ha van valami többségi mintázat, akkor legyen az a fő szabály, és a többit meg nézd át egyenként. Példa: szóközök mentén felbontva (Excelben: szövegből oszlopok) tipikusan 2 mező a név, 2 az utca, 1 a házszám, 1 az irányítószám, 1 a város. Ha az adott sor 7 mező széles, kész vagyunk, minden más esetet meg ki kell szűrni és átnézni. Nyilván a neveknél a prefix, mint Mr., Dr., Özv. stb. a fő veszély, a házszámoknál a külön írt /a vagy 4. em. 15., de ezekre fel lehet készülni.
Új hozzászólás Aktív témák
● olvasd el a téma összefoglalót!
- Háztartási gépek
- Milyen házat vegyek?
- Melyik hordozható audiolejátszót (DAP, MP3, stb.) vegyem?
- Fejhallgató erősítő és DAC topik
- Intel Core i5 / i7 / i9 "Alder Lake-Raptor Lake/Refresh" (LGA1700)
- PlayStation 5
- Okos Otthon / Smart Home
- Mini-ITX
- Arc Raiders
- Nagyrobogósok baráti topikja
- További aktív témák...
- Asus VC239 23 Full HD Monitor 6 hó garancia Házhozszállítás
- BESZÁMÍTÁS! Asus ROG Strix B450F R5 5600 32GB DDR4 512GB SSD RTX 2070 Super 8GB Zalman S2 TG TT 650W
- Xbox One S All Digital 1 TB + kontroller 6 hó garancia, számlával!
- iPhone 14 Pro Max 128GB Eladó
- Mushkin 2x16GB DDR4 3200MHz - Új, bontatlan - Eladó!
- BESZÁMÍTÁS! GIGABYTE B550M R7 5700X 32GB DDR4 512GB SSD RTX 4070 Super 12GB NZXT H510i NZXT 850W
- 196 - Lenovo Legion Pro 5 (16IAX10) - Intel Core U7 255HX, RTX 5070 (ELKELT)
- Lenovo T14S Thinkpad FHD IPS i5-1135G7 16GB RAM 256GB SSD Intel Iris XE Graphics Win11 Pro Garancia
- HP EliteBook 840 G7 i5-10210U 16GB 512GB FHD 400nit 1 év garancia
- LIDL akkumulátor és generátor teszter
Állásajánlatok
Cég: Laptopműhely Bt.
Város: Budapest


