PAGE

Page Analysis and Ground Truth Elements (PAGE) ist eine Sammlung von XML-basierten Formaten für die Kodierung von Dokumentinhalten um deren automatische Erkennung zu überprüfen. Das Format wird vor allem im wissenschaftlichen Kontext bei der Entwicklung von OCR und anderen Verfahren eingesetzt. Vergleichbare Formate für OCR-Daten sind ALTO und hOCR.

Homepagehttps://github.com/PRImA-Research-Lab/PAGE-XML/wiki
FormatXML
AnwendungDokumentformate
WikidataQ2819247