-
Fototrend

Új hozzászólás Aktív témák
-
#05216000
törölt tag
válasz
ngabor2
#12353
üzenetére
Ha még kell segítség és itt nem kapsz, akkor küldj e-mailt a victorsugo@protonmail.com címre. Innen most kiszálltam.
(kinek volt az az idióta ötlete, hogy egy témához több hozzászólást nem lehet írni, míg valaki más nem ír? Ez valami hihetetlenül retardált megoldás, bármi is legyen az oka) -
#05216000
törölt tag
válasz
ngabor2
#12351
üzenetére
Azt hiszem, félreértesz. Az a baj, hogy a szinonima hivatkozása az eredetire nem konzisztens.
Bocs, csak példa, de nem tudom másképp:
Ha lenne egy "Dendrobium Orchidea" nevű növényed, aminek van ezer szinonimája, de a szinonimák hivatkozásaiban hol "Dendrobium Orchidea" van, hol "Dend. Orcihd.", máskor meg "Dendrobium O." akkor automatikusan, a mi eszközeinkkel, ezt nem lehet összepárosítani.
És eredetiként csak az egyik verzió szerepel.Normál körülmények közt csak annyi lenne a feladvány, hogy kiválogatod a neveket, amikre később szinonimák is vannak, majd a szinonima - eredeti párosokat kettéválasztani, field separator "-", kiírod fordított sorrendben, sorba rendezed és talán erre kell egy kis program, ami json-ra konvertálja az egészet.
cat *.htm | gawk 'BEGIN { FS="-" } /<P>~/{ a=$1; b=$2; sub("<P>~[ ]*","",a); sub("^[ ]*See[ ]*","",b); print b,"\t",a}'| sortEz kilistázza a szinonima - eredeti párokat úgy, hogy előre veszi az eredetit, mögé TAB karakterrel elválasztva a szinonimát. A /<P>~/ helyére kellene egy pontos minta a szinonimákat tartalmazó sorokhoz, amit nem sikerült megtalálnom, mert valami mindig kimaradt vagy épp olyan sorokat is felszedett, amik nem feleltek meg a követelményeknek.
Ennek a sort előtti kimenetét kellene összefésülni az eredetiket tartalmazó listákkal és összefűzni az azonos növényhez tartozó sorokat, majd az egészből json-t készíteni.
De nálam ez teli van szeméttel. -
#05216000
törölt tag
válasz
ngabor2
#12348
üzenetére
Keress rá erre: "Ascocentrum ampullaceum"
Nekem úgy tűnik, kénytelen leszel minden frissítésnél újra és újra átbogarászni a letöltött adatok tartalmát, mert csak ennél minimum kétféle elnevezést találtam, látszólag ugyanahhoz a növényhez. Kétféle alatt azt értem, hogy az egyik verzióban teljesen ki van írva a Lindley, a másikban Lindl. szerepel. És ilyenekből van bőven. Ahogy olyanból is, hogy <P>~ karakterekkel indul a sor, de mögötte nem elnevezés van, hanem egy <a href...> tag és csak az.Vagy az ilyen eltérések, hiányosságok még beleférnek?
Meg az is eszembe jutott, hogy ez legális egyáltalán? Úgy értem: szerzői jogokat nem sért ez a feldolgozás?
-
#05216000
törölt tag
válasz
ngabor2
#12346
üzenetére
Néhányszor nekifutottam, de olyan gányolmány az egész oldal, hogy ennek a feldolgozásához jó érzésű ember nem ír programot.

Mást ne mondjak: címlap lejön valami win-12xx kódolással, az aloldalak meg iso-8859-1-nek mondják magukat. (a címlapról úgy látom, lemaradt az encoding a fejlécből)Szóval erre programot írni szerintem nem sok értelme van. Amit én tennék, megpróbálnám manuálisan, szövegfeldolgozó programok segítségével kibányászni a szükséges infókat és abból előállítani a szükséges json formátumot. Túl sok programozással nem jár, a regex használat elég lehet a többséghez.
Az elindulásban tudok segíteni, ha gondolod.
-
Új hozzászólás Aktív témák
● olvasd el a téma összefoglalót!
- Pedzegeti az új Xbox irányát a Microsoft
- Projektor topic
- Automata kávégépek
- AI, GitHub Copilot, Claude, Gemini
- Honor Magic6 Pro - kör közepén számok
- Facebook és Messenger
- NVIDIA GeForce RTX 5080 / 5090 (GB203 / 202)
- EA Sports WRC '23
- Azonnali informatikai kérdések órája
- AMD K6-III, és minden ami RETRO - Oldschool tuning
- További aktív témák...
- GYÖNYÖRŰ iPhone 13 256GB Blue -1 ÉV GARANCIA - Kártyafüggetlen, MS4659, 100% Akksi
- AKCIÓ! Apple iPhone 12 Mini 64GB mobiltelefon garanciával hibátlan működéssel
- Laptop felvásárlás , egy darab, több darab, új , használt ! Korrekt áron !
- BESZÁMÍTÁS! Gigabyte B660M i9 13900KF 64GB DDR4 1TB SSD RTX 3080Ti 12GB Zalman Z10 Plus Seasonic750W
- LENOVO ThinkBook 13s G2 - i5-1135G7, 16GB RAM, 512GB SSD, jó akku, számla, 6 hó gar
Állásajánlatok
Cég: Laptopműhely Bt.
Város: Budapest



