Unicode
Der Unicode-Standard ist eine Zeichenkodierung fast aller in der Praxis
vorkommender Schriftzeichen. Der Code eines in Unicode definierten Zeichens
wird meist hexadezimal und mit dem Präfix U+
angegeben. Beispielsweise hat in
Unicode der Buchstabe Ä
den Code U+00C4
was der Zahl 196 entspricht.
Die häufigste Kodierung von Unicode-Zeichenketten als Folge von Bytes ist UTF-8.
Datenformate
Unicode bildet die Basis folgender Datenformate:
- Coffescript Object Notation (CSON)
- CSV Schema
- Document Type Definition (DTD)
- DOT
- Human JSON (Hjson)
- Human-Optimized Config Object Notation (HOCON)
- JAQL
- JavaScript Regular Expressions
- JMESPath
- jq
- JSON
- JSON5
- Knowledge Base And Related Tools (KBART)
- Linked Data Patch Format (LD Patch)
- Markdown
- N-Triples
- NDJSON
- RDF Patch
- ShEx Compact syntax (ShExC)
- SPARQL
- SPARQL Patch
- SPARQL Query Language (SPARQL)
- SPARQL Update
- SQL/JSON path
- Tom's Obvious, Minimal Language (TOML)
- Turtle
- XML
- XPath
- YAML
Homepage | http://www.unicode.org/ |
Anwendungen | Strukturierungssprachen (Strukturen) Datentypen |
Anwendungsprofil von | Zeichenkette |
Wikidata | Q8819 |