Kodierungen sind Vorschriften zur Abbildung eines Datenformates oder -Modells in einem anderen Datenformat. Kodierungen deren Zielformat auf einer Zeichenkette oder anderen Art von Reihenfolge basiert werden auch Serialisierung genannt.

Liste von Kodierungen

Die folgenden Kodierungen von Ausgangs-Modell zu Ziel-Format sind auf dieser Seite dokumentiert.

Kodierung Modell Format
Coffescript Object Notation (CSON) JSON Unicode
ISO MARC MARC Bytes
MARC in JSON (mij) MARC JSON
MARCXML MARC XML
MARC JSON MARC JSON
Turbomarc MARC XML
MicroLIF MARC Bytes
MARCMaker MARC Bytes
Encoded Archival Description Syntax (EAD) Encoded Archival Description (EAD) XML
XML Syntax XML Unicode
Encoded Archival Context for Corporate Bodies, Persons, and Families (EAC-CPF) International Standard Archival Authority Record for Corporate Bodies, Persons, and Families (ISAAR(CPF)) XML
JSON Syntax JSON Unicode
Tom's Obvious, Minimal Language Syntax (TOML) Tom's Obvious, Minimal Language (TOML) Unicode
Categories for the Description of Works of Art Lite (CDWA Lite) Categories for the Description of Works of Art (CDWA) XML
UTF-8 Unicode Bytes
Lightweight Information Describing Objects Syntax (LIDO) Lightweight Information Describing Objects (LIDO) XML
Jupyter Notebook Format Syntax (nbformat) Jupyter Notebook Format (nbformat) JSON
Avram Schema Language Syntax (Avram) Avram Schema Language (Avram) JSON
DAIA/XML Document Availability Information API (DAIA) XML
DAIA/JSON Document Availability Information API (DAIA) JSON
Human JSON (Hjson) JSON Unicode
LOM XML Learning Objects Metadata (LOM) XML
Endnote Tagged Format Syntax (ENW) Endnote Tagged Format (ENW) Bytes
Research Information System Format Syntax (RIS) Research Information System Format (RIS) Bytes
Metadata Object Description Schema Syntax (MODS) Metadata Object Description Schema (MODS) XML
RDF/XML RDF XML
Turtle RDF Unicode
JSON-LD RDF JSON
N-Triples RDF Unicode
Human-Optimized Config Object Notation (HOCON) JSON Unicode
museumdat Syntax museumdat XML
SBE Syntax SBE Bytes
JSON5 JSON Unicode
YAML Syntax YAML Unicode
MABxml Maschinelles Austauschformat für Bibliotheken (MAB) XML
JSKOS data format for Knowledge Organization Systems Syntax (JSKOS) JSKOS data format for Knowledge Organization Systems (JSKOS) JSON
DataCite Metadata Schema (DataCite) DataCite XML
MicroXML XML XML, JSON
Metadata Authority Description Schema Syntax (MADS) Metadata Authority Description Schema (MADS) XML
PICA XML PICA-Format (PICA) XML
PICA JSON PICA-Format (PICA) JSON
Normalisiertes PICA PICA-Format (PICA) Bytes
Binäres PICA PICA-Format (PICA) Bytes
PPXML PICA-Format (PICA) XML
PICA Plain PICA-Format (PICA) Bytes
CBOR Syntax CBOR Bytes

Eigenschaften von Kodierungen

Letzendlich basieren alle Kodierungen über eine oder mehrere Ebenen auf Bytes (und damit wiederum auf Bits), denn dies ist die einzige Form in der digitale Daten physikalisch vorliegen.

Kodierungen können in beide Richtungen angewandt werden. Im Englischen wird zwischen encoding (Kodierung, vom Modell zum Format) und decoding (Dekodierung, vom Format zum Modell) unterschieden.

Kodierung sollten für jedes mögliche Dokument des Ausangs-Modells mindestens ein Dokument im Ziel-Format bereitstellen. Anderfalls ist die Kodierung unvollständig.

Während es bei den meisten Kodierung mehrere alternative Möglichkeiten der Abbildung gibt (beispielsweise die mögliche Verwendung oder Auslassung zusätzliche Leerzeichen), sollte die Dekodierung immer eindeutig sein.

Im Mathematischen Sinne (also auch so wie Computer die Daten verarbeiten) ist die Abbildung einer Kodierung eher umgekehrt definiert: als Dekodierungs-Funktion vom Format zum kodierten Modell. Die Funktion ist dabei meist nur partiell, es gibt also Dokumente die sich nicht dekodieren lassen weil sie der Kodierungsvorschrift nach fehlerhaft sind.

Falls eine Kodierung/Dekodierung in beide Richtungen eindeutig ist, wird sie auch als Normalisierung bezeichnet. Eine Folge normalisierender Kodierungen bis zur Ebene von Bytes ist notwendig um bei Bedarf gleiche Dokumente anhand ihrer Prüfsummen identifizieren zu können. In der Praxis ist dies bislang jedoch nur für die wenigsten Formate möglich.