Ich möchte insbesondere Daten von meinem Bild oder pdf

stimmen
-2

Ich möchte insbesondere Daten von meinem Bild oder pdf. Zum Beispiel habe ich Rechnung Rechnung in Scan - Dokument so ich möchte nur extrahieren Rechnungsnummer . Ich bin schon verwendet Tesseract OCR, Apache Tika OCR, OCR Aspose also bitte machen Sie mir bestimmte Daten zu erhalten für Schritt. Vielen Dank im Voraus.

Veröffentlicht am 12/04/2017 um 10:37
quelle vom benutzer
In anderen Sprachen...                            


3 antworten

stimmen
0

Sie können unter Verwendung einiger spezifischer Inhalte von einem Teil des Bildes erhalten / extrahieren individuelle Erkennungsblöcke . Bitte beachten Sie , dass die oben genannte Lösung in Szenario ist nützlich, wenn Sie Dateien / Bilder nach der ähnlichen Struktur, das heißt; der Inhalt gescannt werden sollen , immer auf der gleichen Position für jedes Bild.

Darüber hinaus können Sie OCR - Betrieb auf einer PDF - Datei mit Aspose.OCR in Kombination mit Aspose.Pdf auszuführen. Besuchen Sie den Link Performing OCR auf PDF - Dokumenten für weitere Einzelheiten.

Ich arbeite mit Aspose als Entwickler Evangelist.

Beantwortet am 24/04/2017 um 05:10
quelle vom benutzer

stimmen
0

In der Regel, was Sie suchen ist „zonale OCR“ genannt. Es gibt mehrere Optionen, um die Daten, die Sie erhalten müssen:

  • Verwenden von regulären Ausdrücken ( regex )

  • verwenden , um die von den meisten OCR - Software zurückgegebenen Koordinaten. Sie können es online sehen / testen bei https://ocr.space

  • verwenden , um ein visuelles Werkzeug wie Kantu für pdf Schaben .

Beantwortet am 13/04/2017 um 19:54
quelle vom benutzer

stimmen
-1

Haben Sie sich ABBYY Flexicapture bei Verwendung? Diese Funktion ist eine der wichtigsten Aspekte dessen, was es tut. Bei der Verwendung von Produkten wie Flexicapture wird die Frage, ob das Dokument von festem oder semi-strukturierten Design. Für Dokumente, wie Rechnungen ist die Antwort fast immer halbstrukturierte, weil die Informationen auf der Seite bewegt sich. Auch gibt es in der Regel viele verschiedene Layouts von Rechnungen. ABBYY gelöst, diese Herausforderung durch ihre Flexicapture für die Rechnungs Produkt.

Als Alternative, wenn man nur so etwas wie eine Rechnungsnummer in einem Bereich zu extrahieren, benötigt es gibt Möglichkeiten, in preiswerteren Produkten wie ABBYY Recognition Server, in dem Sie nutzen könnten, was sie über eine Fläche Vorlage nennen, oder Sie können alle von dem OCR-Text extrahieren und entwickelt eine Anwendung einen regulären Ausdruck anzuwenden, um den Feldwert neben den Feldnamen zu suchen. Probleme können entstehen, wenn die Feldbeschriftung und der Feldwert nicht in dem OCR-Ergebnis Text zueinander in der Nähe fallen. Dies kann passieren, wenn nach dem Zeilenumbruch der Feldbezeichnungen ( „Rechnung nicht“ oder „Rechnung #“) gibt es sofort einen anderen Wert in der ersten Position der nächsten Zeile folgt. Dann könnte der OCR-Text so etwas wie „Rechnung Nr Bob Bargain Barn 66422.“ worden Die Regex könnte den Wert sucht unmittelbar nach dem Suchbegriff „Rechnungsnummer“ dann produziert ein Ergebnis für den benachbarten Text „Barn Bob Schnäppchen.“ Schlimmer noch, oft mal der Beschriftungstext und Rechnungsnummer in einer Tabelle sein, es Fragen wie einig OCR-Engines zu verkomplizieren (wenn auch nicht Recognition Server) Insgesamt würde ignorieren. Es ist aus diesen Gründen, die wir recherchiert Flexicapture, weil es Phantasie-Codierung, die für die Datenextraktion eliminiert. Es ist teuer, aber es lohnt sich. Offenlegung, sind wir einen ABBYY Partner. Es ist aus diesen Gründen, die wir recherchiert Flexicapture, weil es Phantasie-Codierung, die für die Datenextraktion eliminiert. Es ist teuer, aber es lohnt sich. Offenlegung, sind wir einen ABBYY Partner. Es ist aus diesen Gründen, die wir recherchiert Flexicapture, weil es Phantasie-Codierung, die für die Datenextraktion eliminiert. Es ist teuer, aber es lohnt sich. Offenlegung, sind wir einen ABBYY Partner.

Beantwortet am 09/06/2017 um 11:53
quelle vom benutzer

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more