Datenformate lassen sich grob in Strukturierungssprachen, Anwendungsformate, Kodierungen und Schemasprachen unterteilen.
Anwendungsformate legen die Struktur von Daten für konkrete Arten von Inhalte fest. Beispielsweise sind bibliographische Datenformate Anwendungsformate für bibliographische Inhalte.
Kodierung drücken Datenformate und -Modelle in Strukturierungssprachen aus. Beispielsweise ist JSON-LD eine Kodierung von RDF in JSON. Zur Vereinfachung werden Formate oft mit ihrer üblichsten Kodierung gleichgesetzt, beispielsweise das JSON-Format mit der JSON-Syntax.
Jedes Format basiert auf einem Modell von Inhalten, die mit diesem Format ausgedrückt werden sollen. Die Beziehung zwischen Modell und Format wird idealerweise durch einen Standard festgelegt. Zur exakten Beschreibung von Standards dienen in Schemasprachen kodierte Schemas. Beispielsweise können in JSON kodierte Formate mit JSON Schema beschrieben werden. In der Regel lassen sich Standards aber nicht vollständig mit Schemas formalisieren.
Übersicht aller Formate
Metadatenformate
- allegro
- Allgemeines Metadatenprofil für Bildungsressourcen (AMB)
- BibJSON
- BibTeX
- Cataloging Cultural Objects: A Guide to Describing Cultural Works and Their Images (CCO)
- Categories for the Description of Works of Art (CDWA)
- Citation File Format (CFF)
- CodeMeta
- Codex Metadata Model (Codex)
- Common European Research Information Format (CERIF)
- CrossRef Unified XML format (UNIXREF)
- CSL-JSON
- Culture Graph Interchange Format (CGIF)
- Data Package
- Data Resource
- DataCite
- DNB Casual (dnbterms)
- Document Availability Information API (DAIA)
- EN 15907
- Encoded Archival Description (EAD)
- Endnote Tagged Format (ENW)
- Europeana Data Model (EDM)
- Exchangeable Image File Format (Exif)
- Extensible Metadata Platform (XMP)
- Functional Requirements for Bibliographic Records (FRBR)
- Hayagriva YAML File Format (Hayagriva)
- International Standard Bibliographic Description (ISBD)
- Journal Article Tag Suite (JATS)
- Kerndatensatz Forschung (KDSF)
- Knowledge Base And Related Tools (KBART)
- Langzeitarchivierungsmetadaten für elektronische Ressourcen (LMER)
- Learning Objects Metadata (LOM)
- Lightweight Information Describing Objects (LIDO)
- MARC
- Maschinelles Austauschformat für Bibliotheken (MAB)
- Metadata Encoding & Transmission Standard (METS)
- Metadata Object Description Schema (MODS)
- museumdat
- ONline Information eXchange (ONIX)
- PICA-Format (PICA)
- Research Information System Format (RIS)
- Schemas und Schemasprachen (Schemas)
- Spectrum
- VZG Articleformat
Normdatenformate
- allegro
- BIBFRAME
- Codex Metadata Model (Codex)
- EntityXML
- Functional Requirements for Authority Data (FRAD)
- Functional Requirements for Subject Authority Data (FRSAD)
- International Standard Archival Authority Record for Corporate Bodies, Persons, and Families (ISAAR(CPF))
- JSKOS data format for Knowledge Organization Systems (JSKOS)
- Linked Places format
- Linked Places Interconnection Format (LPIF)
- MARC
- Maschinelles Austauschformat für Bibliotheken (MAB)
- Metadata Authority Description Schema (MADS)
- Pelagios Gazetteer Interconnection Format (PGIF)
- PICA-Format (PICA)
- Simple Knowledge Organisation System (SKOS)
Dokumentformate
- Analyzed Layout and Text Object (ALTO)
- DocBook
- hOCR
- Hypertext Markup Language (HTML)
- IIIF Presentation Model
- Journal Article Tag Suite (JATS)
- Jupyter Notebook Format (nbformat)
- Markdown
- News Industry Text Format (NITF)
- Normal File Format (.NORM)
- Ordered Hierarchy of Content Objects (OHCO)
- PAGE
- Research Articles in Simplified HTML (RASH)
- Scholarly HTML
- Text Encoding Initiative (TEI)
- Universelles Objektformat (UOF)
- ZIP
Strukturierungssprachen
- Aleph Sequential Format (ASEQ)
- Bencode
- BSON
- Bytes
- CBOR
- Comma-separated values (CSV)
- CSVW JSON
- DOT
- GraphML
- INI-Format (INI)
- Internet JSON (I-JSON)
- JSON
- KDL
- MARC
- MessagePack
- NDJSON
- PICA-Format (PICA)
- Protocol Buffers (proto)
- RDF
- RFC 4180
- Simple Binary Encoding (SBE)
- Simple Declarative Language (SDLang)
- Standard Generalized Markup Language (SGML)
- Structured Query Language (SQL)
- Tab-separated values (TSV)
- Tom's Obvious, Minimal Language (TOML)
- Unicode
- Wikibase Tabular Data
- XML
- YAML
- Zeichenkette
Datenmodelle
- BIBFRAME
- CIDOC Conceptual Reference Model (CIDOC-CRM)
- Codex Metadata Model (Codex)
- Dublin Core (DC)
- EN 15907
- Europeana Data Model (EDM)
- Functional Requirements for Authority Data (FRAD)
- Functional Requirements for Bibliographic Records (FRBR)
- Functional Requirements for Subject Authority Data (FRSAD)
- Labeled Property Graph
- Zeichenkette
Abfragesprachen
- Data Query Language (DQL)
- JAQL
- JavaScript Regular Expressions
- JMESPath
- jq
- JSON Pointer
- JSONata
- JSONiq
- JSONPath
- MARCspec
- Perl Compatible Regular Expressions (PCRE)
- PICA Path
- POSIX Basic Regular Expressions (BRE)
- POSIX Extended Regular Expressions (ERE)
- Reguläre Ausdrücke (Regex)
- SPARQL
- SPARQL Query Language (SPARQL)
- SQL/JSON path
- URI Fragment Identifiers for the text/csv Media Type (RFC 5147)
- URI Fragment Identifiers for the text/csv Media Type (RFC 7111)
- XPath
- XPointer
- XQuery
Schemasprachen
- Avram Schema Language (Avram)
- CSV Dialect (CSVDDF)
- CSV Schema
- Document Type Definition (DTD)
- JavaScript Regular Expressions
- JSON Schema
- JSON Table Schema
- Kwalify
- Metadata Vocabulary for Tabular Data
- Perl Compatible Regular Expressions (PCRE)
- POSIX Basic Regular Expressions (BRE)
- POSIX Extended Regular Expressions (ERE)
- RDF Schema (RDFS)
- Reguläre Ausdrücke (Regex)
- RELAX NG
- Rx
- Schematron
- Shape Expression Language (ShEx)
- Shapes Constraint Language (SHACL)
- Web Ontology Language (OWL)
- XML Schema (XSD)
Änderungsformate
- Data Modification Language (DML)
- JSON Merge Patch
- JSON Patch
- Linked Data Patch Format (LD Patch)
- PICA Patch
- RDF Patch
- SPARQL
- SPARQL Patch
- SPARQL Update
- Tabular Diff Format
- Unified Diff
- XML Diff Language
- XML Patch