Klartext-Format für strukturierte Daten, aufgebaut als verschachtelte Schlüssel-Wert-Paare und Listen. Für Menschen lesbar, für jede moderne Programmiersprache verarbeitbar. Behält hierarchische Strukturen wie Transkripte mit Sprechern, Zeitstempeln und Kodierungs-Tags, ohne sie in flache Zeilen zu pressen.
Definition: Klartext-Format für strukturierte Daten, aufgebaut als verschachtelte Schlüssel-Wert-Paare und Listen. Für Menschen lesbar, für jede moderne Programmiersprache verarbeitbar. Behält hierarchische Strukturen wie Transkripte mit Sprechern, Zeitstempeln und Kodierungs-Tags, ohne sie in flache Zeilen zu pressen.
JSON speichert Daten als verschachtelte Objekte (Schlüssel-Wert-Paare) und Arrays (geordnete Listen). Ein einzelner Datensatz kann damit eine komplette Hierarchie tragen: ein Interview enthält Metadaten, Sprecher-Turns, Zeitstempel, Code-Tags und Annotationen auf Zitatebene in einer Datei. CSV kann das nur durch Flattening, das den Kontext zerstört.
Für Research-Exporte gewinnt JSON in drei Punkten: nichts wird in eine einheitliche Shape gezwungen, jedes Feld hat einen Namen (kein Raten über Position), und jede moderne Programmiersprache hat einen eingebauten Parser. Der Nachteil: JSON lässt sich nicht so bequem im Tabellen-Programm öffnen; für Tabellen-Ansichten beide Formate exportieren.
Bei großen Datensätzen lohnt sich "newline-delimited JSON" (NDJSON oder JSONL): jede Zeile ist ein Datensatz, was streaming und Filtern erlaubt ohne alles in den Speicher zu laden.
Dieser Begriff wird in den folgenden Artikeln referenziert: