Datenformate lassen sich grob in Strukturierungssprachen, Anwendungsformate, Kodierungen und Schemasprachen unterteilen.
Anwendungsformate legen die Struktur von Daten für konkrete Arten von Inhalte fest. Beispielsweise sind bibliographische Datenformate Anwendungsformate für bibliographische Inhalte.
Kodierung drücken Datenformate und -Modelle in Strukturierungssprachen aus. Beispielsweise ist JSON-LD eine Kodierung von RDF in JSON. Zur Vereinfachung werden Formate oft mit ihrer üblichsten Kodierung gleichgesetzt, beispielsweise das JSON-Format mit der JSON-Syntax.
Jedes Format basiert auf einem Modell von Inhalten, die mit diesem Format ausgedrückt werden sollen. Die Beziehung zwischen Modell und Format wird idealerweise durch einen Standard festgelegt. Zur exakten Beschreibung von Standards dienen in Schemasprachen kodierte Schemas. Beispielsweise können in JSON kodierte Formate mit JSON Schema beschrieben werden. In der Regel lassen sich Standards aber nicht vollständig mit Schemas formalisieren.
Übersicht aller Formate
Metadatenformate
- allegro
- Allgemeines Metadatenprofil für Bildungsressourcen (AMB)
- BibJSON
- BibTeX
- Cataloging Cultural Objects: A Guide to Describing Cultural Works and Their Images (CCO)
- Categories for the Description of Works of Art (CDWA)
- Citation File Format (CFF)
- CodeMeta
- Codex Metadata Model (Codex)
- Common European Research Information Format (CERIF)
- CrossRef Unified XML format (UNIXREF)
- CSL-JSON
- Culture Graph Interchange Format (CGIF)
- Data Resource
- DataCite
- DNB Casual (dnbterms)
- Document Availability Information API (DAIA)
- EN 15907
- Encoded Archival Description (EAD)
- Endnote Tagged Format (ENW)
- Europeana Data Model (EDM)
- Exchangeable Image File Format (Exif)
- Extensible Metadata Platform (XMP)
- Functional Requirements for Bibliographic Records (FRBR)
- Hayagriva YAML File Format (Hayagriva)
- International Standard Bibliographic Description (ISBD)
- Journal Article Tag Suite (JATS)
- Kerndatensatz Forschung (KDSF)
- Knowledge Base And Related Tools (KBART)
- Langzeitarchivierungsmetadaten für elektronische Ressourcen (LMER)
- Learning Objects Metadata (LOM)
- Lightweight Information Describing Objects (LIDO)
- MARC
- Maschinelles Austauschformat für Bibliotheken (MAB)
- Metadata Encoding & Transmission Standard (METS)
- Metadata Object Description Schema (MODS)
- museumdat
- ONline Information eXchange (ONIX)
- PICA-Format (PICA)
- Research Information System Format (RIS)
- Schemas und Schemasprachen (Schemas)
- Spectrum
- VZG Articleformat
Normdatenformate
- allegro
- BIBFRAME
- Codex Metadata Model (Codex)
- Encoded Archival Context for Corporate Bodies, Persons, and Families (EAC-CPF)
- EntityXML
- Functional Requirements for Authority Data (FRAD)
- Functional Requirements for Subject Authority Data (FRSAD)
- International Standard Archival Authority Record for Corporate Bodies, Persons, and Families (ISAAR(CPF))
- JSKOS data format for Knowledge Organization Systems (JSKOS)
- Linked Places format
- Linked Places Interconnection Format (LPIF)
- MARC
- Maschinelles Austauschformat für Bibliotheken (MAB)
- Metadata Authority Description Schema (MADS)
- Pelagios Gazetteer Interconnection Format (PGIF)
- PICA-Format (PICA)
- Simple Knowledge Organisation System (SKOS)
Dokumentformate
- Analyzed Layout and Text Object (ALTO)
- DocBook
- hOCR
- Hypertext Markup Language (HTML)
- IIIF Presentation Model
- Journal Article Tag Suite (JATS)
- Jupyter Notebook Format (nbformat)
- Markdown
- News Industry Text Format (NITF)
- Normal File Format (.NORM)
- Ordered Hierarchy of Content Objects (OHCO)
- PAGE
- Research Articles in Simplified HTML (RASH)
- Scholarly HTML
- Text Encoding Initiative (TEI)
- Universelles Objektformat (UOF)
- ZIP
Strukturierungssprachen
- Aleph Sequential Format (ASEQ)
- BSON
- Bytes
- CBOR
- Comma-separated values (CSV)
- CSVW JSON
- DOT
- GraphML
- INI-Format (INI)
- Internet JSON (I-JSON)
- JSON
- KDL
- MARC
- MessagePack
- PICA-Format (PICA)
- Protocol Buffers (proto)
- RDF
- Simple Binary Encoding (SBE)
- Simple Declarative Language (SDLang)
- Standard Generalized Markup Language (SGML)
- Structured Query Language (SQL)
- Tom's Obvious, Minimal Language (TOML)
- Unicode
- Wikibase Tabular Data
- XML
- YAML
- Zeichenkette
Datenmodelle
- BIBFRAME
- CIDOC Conceptual Reference Model (CIDOC-CRM)
- Codex Metadata Model (Codex)
- Dublin Core (DC)
- EN 15907
- Europeana Data Model (EDM)
- Functional Requirements for Authority Data (FRAD)
- Functional Requirements for Bibliographic Records (FRBR)
- Functional Requirements for Subject Authority Data (FRSAD)
- Zeichenkette
Abfragesprachen
- Data Query Language (DQL)
- JAQL
- JMESPath
- jq
- JSON Pointer
- JSONata
- JSONiq
- JSONPath
- MARCspec
- PICA Path
- Reguläre Ausdrücke (Regex)
- SPARQL Query Language (SPARQL)
- SQL/JSON path
- URI Fragment Identifiers for the text/csv Media Type (RFC 7111)
- XPath
- XPointer
- XQuery
Schemasprachen
- Avram Schema Language (Avram)
- CSV Dialect (CSVDDF)
- CSV Schema
- Document Type Definition (DTD)
- JSON Schema
- JSON Table Schema
- Kwalify
- Metadata Vocabulary for Tabular Data
- RDF Schema (RDFS)
- Reguläre Ausdrücke (Regex)
- RELAX NG
- Rx
- Schematron
- Shape Expression Language (ShEx)
- Shapes Constraint Language (SHACL)
- Web Ontology Language (OWL)
- XML Schema (XSD)