Text aus PDF auslesen (gelöst)

Antwort erstellen


Diese Frage dient dazu, das automatisierte Versenden von Formularen durch Spam-Bots zu verhindern.
Smileys
:) ;) :smile: :lol: :hihi: :D :rofl: :muahah: :( :pff: :kopfstreichel: :ohno: :betruebt: :heulen: :kopfkratz: :duckundweg: :o :? :oops: :psst: :sauer: :-P :daumenrunter: :daumen: :dankeschoen: :thx: :dafür: :gähn:
Mehr Smileys anzeigen

BBCode ist eingeschaltet
[img] ist eingeschaltet
[flash] ist ausgeschaltet
[url] ist eingeschaltet
Smileys sind eingeschaltet

Die letzten Beiträge des Themas

Ich habe die Datenschutzerklärung gelesen und bin damit einverstanden.

   

Ansicht erweitern Die letzten Beiträge des Themas: Text aus PDF auslesen (gelöst)

Re: Text aus PDF auslesen

von Captain_Chris » 06.05.2024, 14:59

Was für ein Wirbel um so ein kleines PDF.

1. (Gesperrtes) PDF herunterladen.
2. z.B. Holgi´s Link nutzen > dort über "Passwortschutz entfernen". Oder hierüber geht´s z.B. auch: http://freemypdf.com/
3. Dann ist das PDF kopierbar/veränderbar ...oder was auch immer mit "auslesen" gemeint ist.

ZUDEM: Das PDF enthält auch vereinzelte Bilder mit Text. Will man auch den Text aus den Bildern zugänglich/kopierbar machen, nutzt man dafür die OCR-Funktion.
(Sofern die Online-OCR-Funktion das vernünftig hinkriegt. Letztendlich sind diese "Online-Funktionen" auch relativ begrenzt in ihren Fähigkeiten. Hab das OCR auch nicht online getestet, sondern mit meinem eigenen PDF-Editor ...der ist allerdings ´ne Kaufversion)

Somit das PDF also einmal durchlaufen lassen um Passwortschutz zu entfernen und dann nochmal um Text in Bildern (per OCR) zugänglich zu machen.

PS: Wenn diese Info´s alle nicht reichen, dann mal sagen was man überhaupt im Einzelnen vorhat. Denn unter "auslesen" verstehe ich persönlich eigentlich nur "lesen".

Re: Text aus PDF auslesen

von moinmoin » 06.05.2024, 13:29

Jetzt mal ein bisschen höflicher, immerhin will Holgi nur helfen. (Ok, hast schon editiert)

Du brauchst nichts installieren. Darunter sind alle Online-Funktionen.
PDF herunterladen und über https://tools.pdf24.org/de/pdf-anzeigen auslesen lassen.

Re: Text aus PDF auslesen

von Andreas Berger » 06.05.2024, 13:19

Holgi hat geschrieben: 06.05.2024, 10:28 mit pdf24 https://www.pdf24.org/de/ konnte ich den Schutz aufheben. Kostet nix.


Welches Tool genau nimmt man da? Ich möchte den gesamten Text auf einmal auslesen. Ich habe OCR ausprobiert, und da kam was mit Encryption database error, ging also nicht.

Re: Text aus PDF auslesen

von Holgi » 06.05.2024, 11:06

es gibt immer Mittel und Wege!

Re: Text aus PDF auslesen

von Gast » 06.05.2024, 11:05

Das wurde sicherlich nicht mit KOFAX gesperrt!

Re: Text aus PDF auslesen

von Holgi » 06.05.2024, 10:46

Gast hat geschrieben: 06.05.2024, 10:33 Wenn das Kopieren von Textinhalten gesperrt ist, dann könnt ihr euch auf den Kopf stellen.
Daraus wird nix, wenn die entsprechenden Dateiberechtigungen vergeben sind.
und wie erklärst du dir dann das:? Siehe mein vorheriger Beitrag
pdf.JPG

Re: Text aus PDF auslesen

von Gast » 06.05.2024, 10:33

Wenn das Kopieren von Textinhalten gesperrt ist, dann könnt ihr euch auf den Kopf stellen.
Daraus wird nix, wenn die entsprechenden Dateiberechtigungen vergeben sind.

Re: Text aus PDF auslesen

von Holgi » 06.05.2024, 10:28

mit pdf24 https://www.pdf24.org/de/ konnte ich den Schutz aufheben. Kostet nix.


Firefox kann ich bestätigen:
LAGE
Ihre Wirtschaftsstärke erhält die ehema-
lige Festungsstadt Glückstadt als zweit-
größte Stadt des Kreises Steinburg durch
ihre günstige Lage: Sie befindet sich in
unmittelbarer Nähe zur Weltstadt Ham-
burg und verfügt dank der Autobahn A 23
sowie der Bundesstraße 431 über eine
gute Verkehrsanbindung. Diese ermög-
licht den Einwohner*innen ein problem-
loses Pendeln. Hinzu kommen die Bahn-
strecke zwischen Hamburg und Wester-
land, die Glückstadt mit Hamburg und
Itzehoe im Stundentakt verbindet, und
die Elbfähre zum niedersächsischen
Wischhafen. Die Elbfähre feierte erst am
24. März 2019 ihren 100. Geburtstag. Mit
ihr werden über 600.000 Fahrzeuge pro
Jahr über die Elbe transportiert.

Re: Text aus PDF auslesen

von Hillbilly » 06.05.2024, 08:48

Ich habe die PDF Datei im Firefox geöffnet.
Man kann dort den Text markieren und kopieren.

Re: Text aus PDF auslesen

von Nikwin » 06.05.2024, 08:41

Hallo,

du brauchst ein Kennwort um die pdf bearbeiten (Text kopieren) zu können.
- Meint Foxit PDF Reader.

Re: Text aus PDF auslesen

von Andreas Berger » 06.05.2024, 07:54

Re: Text aus PDF auslesen

von Holgi » 05.05.2024, 13:05

Andreas Berger hat geschrieben: 05.05.2024, 07:09 Ich möchte Text aus einer PDf auslesen.
Hast du ein Beispiel für so ein PDF? Dann bitte mal hier posten.
Ich schaue mal nach einer Lösung.

Re: Text aus PDF auslesen

von moinmoin » 05.05.2024, 09:18

Es gibt PDFs, da kann man den Text nicht herauskopieren.

Hatte ich letztens gerade. Da blieb nur die PDF maximal einstellen, Screenshot machen und mit OCR (oder Google Bing Suche Bild) als Bild auslesen lassen.

Re: Text aus PDF auslesen

von Andreas Berger » 05.05.2024, 09:11

moinmoin hat geschrieben: 05.05.2024, 08:20 Heute kann doch schon jeder Browser mit PDF umgehen.
Der Edge hat sogar Funktionen vom Acrobat integriert.
Ich habe Edge, und natürlich habe ich probiert, die Daten auszulesen. Leider klappt es nicht. Auch nicht mit der Acrobat Reader-Erweiterung.

Re: Text aus PDF auslesen

von moinmoin » 05.05.2024, 08:20

Heute kann doch schon jeder Browser mit PDF umgehen.
Der Edge hat sogar Funktionen vom Acrobat integriert.

Nach oben