1. Liebe Forumsgemeinde,

    aufgrund der Bestimmungen, die sich aus der DSGVO ergeben, müssten umfangreiche Anpassungen am Forum vorgenommen werden, die sich für uns nicht wirtschaftlich abbilden lassen. Daher haben wir uns entschlossen, das Forum in seiner aktuellen Form zu archivieren und online bereit zu stellen, jedoch keine Neuanmeldungen oder neuen Kommentare mehr zuzulassen. So ist sichergestellt, dass das gesammelte Wissen nicht verloren geht, und wir die Seite dennoch DSGVO-konform zur Verfügung stellen können.
    Dies wird in den nächsten Tagen umgesetzt.

    Ich danke allen, die sich in den letzten Jahren für Hilfesuchende und auch für das Forum selbst engagiert haben. Ich bin weiterhin für euch erreichbar unter tti(bei)pcwelt.de.
    Dismiss Notice

PDF automatisch durchsuchen und Ergebniss in Excel ausgeben

Discussion in 'Software allgemein' started by adfr, Jul 23, 2011.

Thread Status:
Not open for further replies.
  1. adfr

    adfr ROM

    Guten Tag

    Im Zusammenhang mit meiner Arbeit muss ich mehrere hundert Geschäftsabschlüsse von Unternehmen, welche mir in PDF vorliegen, nach Non-Financial Information wie bspw. Mitarbeiteranzahl, Marktanteil, Fluktuationsrate durchsuchen. Oft werden diese Informationen in einer Tabelle im Geschäftsabschluss dargestellt.

    Gibt es eine Möglichkeit/ein Programm mit welchem ich sämtliche PDFs nach Tabellen durchsuchen kann, welche ein bestimmtes Stichwort enthalten. Wenn eine Tabelle dieses Wort enthält, soll die Tabelle in Excel ausgegeben werden.

    Wenn nicht nach Tabellen gesucht werden kann, habe ich mir folgende Alternative überlegt. Es soll in sämtlichen PDFs nach einem Stichwort gesucht werden und anschliessend das Stichwort plus die nachfolgenden 20 Zeichen in Excel ausgegeben werden.

    Ich weiss, dass das nicht ganz einfach zu lösen ist. Aber eine Lösunge müsste es doch geben, oder ? :-)

    Vielen Dank für eure Hilfe

    Viele Grüsse Karl
     
  2. Silvester

    Silvester Viertel Gigabyte

    Dazu muß man das PDF Dokument erst mittel OCR Software umsetzen, Dann könnte man weitermachen.
     
  3. adfr

    adfr ROM

    Vielen Dank für die Info.

    Ich habe zwischenzeitlich mal mit der Testversion von Finereader einen Geschäftsabschluss umgewandelt. Das klappt überraschend gut. Vorallem werden die Tabellen erkannt und können eins zu eins in Excel exportiert werden.

    Mein Hauptproblem bleibt jedoch bestehen.

    1. Wenn ich alle PDFs einzeln umwandeln muss, bin ich tagelang damit beschäftigt. Gibt es ein Automatismus, so dass ich sagen kann, folgende 500 PDFs sollen bspw. über Nacht umgewandelt werden und am nächsten Tag habe ich die Dokumente?

    2. Wenn ich die umgewandelte Dokumente habe, würde ich gerne mit einem Befehl die relevanten Tabellen (d.h. alle Tabellen, welche ein bestimmtes Stichwort haben) finden.

    Der zweite Schritt kriege ich vermutlich mit einem Makro hin. Evt. kennt jemand eine Möglichkeit, dass ich von Anfang an nur die relevanten Tabelle umwandeln und exportieren kann.

    Vielen Dank für eure Hilfe
     
Thread Status:
Not open for further replies.

Share This Page