[Kitodo] [OCR] Texterkennung mit Kitodo

Uwe Hartwig uwe.hartwig at bibliothek.uni-halle.de
Mi Okt 30 13:15:51 CET 2019


Liebe Community, lieber Herr Gerhardt,

ich hatte die Hoffnung, dass die Einbindung der erstellten OCR-Daten (im 
Format HOCR-xhtml) im Prinzip in Kitodo 2.x möglich ist und es einen 
Fehler in unserer Kitodo-Konfiguration gibt, die dazu führt, dass keine 
Daten angezeigt werden. Nun klingt das für mich leider so, als sei diese 
Funktionalität schon länger verschollen.

Bei unserem derzeitigen Workflow haben die Mitarbeiter im VL-Manager die 
Möglichkeit, anhand der OC-Resultate zusätzliche 
Qualitätssicherungsmaßnahme einzuleiten, z.B. einen Nachscan 
anzufordern. Das wäre also in dieser Form nach derzeitigem Kenntnisstand 
mit Kitodo 2.x nicht möglich, weil keine OCR-Daten im Metadateneditor 
angezeigt werden?


Danke und Grüße!


On 30.10.19 13:02, Henning Gerhardt wrote:
> Liebe Community, lieber Herr Hartwig,
>
> Kitodo.Production 2.x bringt selbst keine Werkzeuge mit, um eine
> Texterkennung direkt durchzuführen und ist auf externe Dienste
> angewiesen. Ein solcher Dienst versteckt sich hinter dem "OCR" Button,
> der eine nicht näher spezifizierte Schnittstelle anspricht und von
> dieser nicht näher spezifizierte Daten zurück bekommt. Damit soll man
> dann wohl die Ergebnisse im Metadateneditor von Kitodo.Production sehen
> können. Ich selbst habe in den vielen Jahren der Nutzung von
> Kitodo.Production 1.x und 2.x niemals eine solche Einbindung gesehen und
> / oder erlebt.
>
> An der SLUB wird die OCR selbst als eigenständiger Schritt / Aufgabe
> nach der Metadaten-Bearbeitung ausgeführt. Über unseren externen OCR
> Dienstleister werden die Ergebnisse als ALTO-XML zurückgeliefert und im
> jeweiligen Vorgangsverzeichnis abgelegt. Beim Export werden neben den
> Bild- und Metadaten auch die vorhandenen OCR Daten exportiert und an die
> Präsentation auf Basis von Kitodo.Presentation übergeben.
> Kitodo.Presentation stellt dann die OCR Ergebnisse dar.
>
>
> Viele Grüße
>
>      Henning Gerhardt
>
> On 10/30/19 11:10 AM, Uwe Hartwig wrote:
>> Liebe Community,
>>
>> mal allgemein in die Runde gefragt: Wer hat Erfahrungen mit den
>> Texterkennungsfunktionalitäten mit Kitodo gesammelt?
>> Und wenn ja, mit welcher Kitodo-Version?
>>
>> Da wir bei der ULB Sachsen-Anhalt auf ALTO-XML setzen, interessiert uns
>> natürlich, ob Kitodo mit diesem Format etwas anfangen kann. Dazu zählt,
>> z.B. ob der "OCR"-Button in der Strukturierungsansicht diese Daten
>> entsprechend darstellen kann und ob dieses Format auch von
>> nachgelagerten Prozessen Richtung DMS-Export (zedExporter) verarbeitet
>> werden kann.
>>
>> Danke!
>>
>>
>
> _______________________________________________
> Kitodo-Community mailing list
> Kitodo-Community at kitodo.org
> https://maillist.slub-dresden.de/cgi-bin/mailman/listinfo/kitodo-community

-- 
Uwe Hartwig
Anwendungsentwickler IT / Digitale Dienste

Universitäts- und Landesbibliothek Sachsen-Anhalt
August-Bebel-Straße 13
D - 06108 Halle (Saale)

Fon: + 49 345 55 22 183
Mail: uwe.hartwig at bibliothek.uni-halle.de

-------------- nächster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: <http://bibservices.biblio.etc.tu-bs.de/pipermail/kitodo/attachments/20191030/2b576d4a/attachment.html>
-------------- nächster Teil --------------
_______________________________________________
Kitodo-Community mailing list
Kitodo-Community at kitodo.org
https://maillist.slub-dresden.de/cgi-bin/mailman/listinfo/kitodo-community


Mehr Informationen über die Mailingliste Kitodo