Új hozzászólás Aktív témák

  • bambano

    titán

    Jogszabályt akartam közlöny pdf-ből txt-be konvertálni. A weblapok zöme a pdftotext linuxos cli programot javasolta, kipróbáltam. A kimenete használhatatlan szemét, például a felsorolások jelét elszakítja a szövegtől. (ha van egy felsorolás, a), b), c), stb. betűjellel és szöveggel, akkor a txt-ben felsorolja, hogy a) b) c), stb. és utána ömlesztve a lista tartalmát. Ez így szemét.

    Egyik keresési találat az Adobe webjére mutatott, ahol van lehetőség online pdf->docx konverzióra. Mivel a Közlöny és a törvény publikus, védett információt nem tartalmaz, feltöltöttem, a docx-ez le, libreoffice-vel áttoltam text-be. Az eredmény meglepően jó. Szinte alig kell masszírozni rajta, mire olyan lesz, ami nekem konkrétan kell.

    Thx Adobe. :R

    Egy átlagos héten négy hétfő és egy péntek van (C) Diabolis

Új hozzászólás Aktív témák