Fortgeschrittene KI-Techniken für Research

Sobald Sie den grundlegenden Workflow der KI-gestützten Analyse beherrschen, können mehrere fortgeschrittene Techniken die Zuverlässigkeit und Qualität der Ergebnisse deutlich verbessern.

Prompting ist strukturierte Kommunikation

"Prompt Engineering" ist ein überbewerteter Begriff. Der Schlüssel zu guten Ergebnissen liegt nicht im Erlernen geheimer Tricks, sondern im Üben klarer Kommunikation.

Stellen Sie sich die Arbeit mit einem LLM vor wie das Onboarding eines sehr fähigen, aber völlig neuen Kollegen. Sie müssen:

Den gesamten notwendigen Kontext liefern: Das Modell weiß nichts über Ihr Projekt
Implizite Anforderungen explizit machen: Was Sie für offensichtlich halten, ist es möglicherweise nicht
Auf spezifische Nuancen hinweisen: "Achten Sie besonders auf die Kommentare dieser Nutzerin zum Preis; ihr Tonfall war zögerlich, obwohl ihre Worte positiv waren"
Daten in strukturierten Formaten bereitstellen: Tidy Data lässt wenig Raum für Fehlinterpretationen

Jenseits des Chatbots: Fortgeschrittene Architekturen

Um eine echte Research-Engine aufzubauen, müssen Sie über das Einfügen von Text in ein Chat-Fenster hinausgehen. Hier sind die drei Architekturen, die zählen:

Architektur	Metapher	Was sie tut	Aufwand
RAG	Die Bibliothekarin	Verankert KI in Ihren Dokumenten	Mittel
Fine-Tuning	Die Spezialistin	Trainiert KI auf Ihren Daten nach	Hoch
*Komitee von Bewerterinnen**	Das Panel	Nutzt mehrere KIs für Konsens	Niedrig

RAG = Die Bibliothekarin

Retrieval-Augmented Generation (RAG) verbindet die KI mit einer spezifischen, kuratierten Bibliothek: Ihrem PDF-Repository, Ihren bisherigen Research-Berichten, Ihrer Insights-Datenbank.

Wie es funktioniert: Bevor eine Antwort generiert wird, durchsucht das System Ihre Wissensbasis nach relevanten Dokumenten und stellt diese als Kontext bereit. Die KI liest Ihre Dokumente, bevor sie antwortet.

Warum es wichtig ist: Dies eliminiert Halluzinationen, indem die KI in Ihren tatsächlichen Daten verankert wird. Anstatt Dinge zu erfinden, zitiert sie Ihre echten Ergebnisse.

Fine-Tuning = Die Spezialistin

Fine-Tuning bedeutet, ein Basismodell auf Tausenden Ihrer bisherigen Berichte nachzutrainieren, um ihm Ihren spezifischen Ton, Ihr Format und Ihren Kategorisierungsstil beizubringen.

Wie es funktioniert: Sie stellen einen großen Datensatz mit Beispielen bereit (z. B. "hier sind 500 korrekt kategorisierte Nutzerzitate"). Das Modell lernt Ihre Muster.

Warum es wichtig ist: Hoher Aufwand, aber es entsteht ein maßgeschneiderter Analyst, der wie Ihr Team denkt. Am besten geeignet für Organisationen mit umfangreichen Research-Archiven und konsistenten Frameworks.

Komitee von Bewerter*innen = Das Panel

Anstatt einer einzelnen KI zu vertrauen, speisen Sie denselben Prompt und dieselben Daten in mehrere Modelle ein (z. B. GPT-4, Claude, Gemini) und vergleichen die Ergebnisse.

Wie es funktioniert: Führen Sie identische Analysen über 2-3 Modelle hinweg durch. Behandeln Sie Übereinstimmung als hohe Konfidenz; behandeln Sie Abweichungen als Signal für menschliche Überprüfung.

Warum es wichtig ist: Geringer Aufwand, hohe Zuverlässigkeit. Abweichungen offenbaren Mehrdeutigkeit, Nuancen und Grenzfälle, bei denen Ihr Expertenurteil am dringendsten benötigt wird.

Sycophancy entgegenwirken

Grundlegende Modelle werden oft darauf trainiert, hilfreich und zustimmend zu sein ^[1]. Das schafft ein Problem: Das Modell sagt Ihnen möglicherweise, was Sie hören wollen, statt was Sie hören müssen.

Das Problem

Wenn Sie ein LLM bitten, Ihre Survey-Fragen zu überprüfen, könnte es antworten:

"Das sind ausgezeichnete Fragen, die die Nutzerstimmung effektiv erfassen werden..."

Selbst wenn mehrere Fragen offensichtliche Mängel aufweisen.

Die Lösung

Experimentieren Sie mit Anweisungen, die das Modell aus seinem standardmäßig zustimmenden Verhalten herausführen:

Rollenbasierte Umrahmung:

"Agieren Sie als skeptische Methodikerin, deren Aufgabe es ist, Schwächen zu finden."

Explizite Anweisung:

"Seien Sie schonungslos ehrlich. Kein Beschönigen, kein Weichzeichnen. Ich muss wissen, was falsch ist."

Strukturierte Kritik:

"Bevor Sie irgendwelche Stärken diskutieren, listen Sie drei spezifische Probleme mit diesem Ansatz auf."

Das Ziel ist, einen zustimmenden Assistenten in einen kritischen Sparringspartner zu verwandeln.

Notizen vs. Transkripte

Ein häufiger Fehler ist es, sich ausschließlich auf automatische Transkription zu verlassen, ohne menschengeführte Synthese durchzuführen.

Obwohl LLMs ganze Transkripte verarbeiten können, beinhaltet ein strategischerer Ansatz die Verwendung Ihrer eigenen detaillierten Notizen als primären Input für die Analyse.

Warum Notizen besser funktionieren

Aspekt	Transkript	Notizen der Forschenden
Umfang	Alles Gesagte	Gefiltert nach Relevanz
Kontext	Nur Worte	Tonfall, Reaktionen, Beobachtungen
Vorverarbeitung	Keine	Expertenurteil angewandt
Signal-Rausch-Verhältnis	Niedrig	Hoch

Durch die Verwendung Ihrer Notizen filtern Sie die Daten vorab durch Ihre professionelle Perspektive und zwingen die KI, mit dem zu arbeiten, was Sie bereits während der Sitzung als bedeutsam identifiziert haben.

KI als Komitee von Bewerter*innen

Eine der leistungsstärksten Techniken ist es, verschiedene LLMs als "Komitee von Bewerter*innen" zu behandeln, anstatt sich auf ein einzelnes Modell zu verlassen.

Wie es funktioniert

Geben Sie denselben Prompt und dieselben Daten an zwei oder drei verschiedene Modelle
Vergleichen Sie deren Ergebnisse
Wo sie übereinstimmen, haben Sie hohe Konfidenz
Wo sie abweichen, haben Sie etwas Interessantes gefunden

Warum Abweichungen wichtig sind

Abweichungen zwischen Modellen weisen oft auf Folgendes hin:

Mehrdeutige Daten, die menschliche Interpretation erfordern
Nuancierte Ergebnisse, die nicht eindeutig sind
Grenzfälle in Ihrer Taxonomy
Besonders wichtige Erkenntnisse, die genauere Untersuchung verdienen

Behandeln Sie Abweichungen nicht als Fehler, sondern als Signale dafür, wo Ihr Expertenurteil am dringendsten benötigt wird.

Für einen praktischen Vier-Schritte-Workflow, der diese Techniken anwendet, siehe KI-gestützte thematische Analyse: Ein praktischer Workflow.

Aufbau von Taxonomies und Ontologies

LLMs sind außergewöhnlich gut darin, Nuancen zwischen verschiedenen Abstraktionsebenen zu finden. Das macht sie wertvoll für den Aufbau von Klassifikationssystemen:

Taxonomy: Ein Klassifikationssystem (eine Menge von Tags)

Beispiel: "Login-Button-Problem" ist eine Art von "Usability-Problem"

Ontology: Die Beziehungen zwischen Klassifikationen

Beispiel: "Login-Button-Problem" betrifft "Onboarding" was sich auswirkt auf "Aktivierungsrate"

Nutzen Sie LLMs, um:

Initiale Taxonomies basierend auf Beispieldaten vorzuschlagen
Lücken in bestehenden Taxonomies zu identifizieren
Beziehungen zwischen Kategorien vorzuschlagen
Konkrete Nutzerprobleme mit übergeordneten strategischen Themen zu verbinden

Validieren und verfeinern Sie die Vorschläge der KI immer, aber lassen Sie sie die Schwerstarbeit des ersten Entwurfs übernehmen.

Für die manuellen Codierungsgrundlagen, auf denen die Taxonomie-Erstellung aufbaut, siehe Qualitative thematische Analyse: Von Codes zu Insights.

Fortgeschrittene Techniken: RAG und Fine-Tuning

Mit fortschreitender Erfahrung werden Sie auf zwei zentrale Techniken stoßen, um einem LLM spezifisches Wissen bereitzustellen:

Retrieval-Augmented Generation (RAG)

RAG ist, als würde man der KI eine spezifische, kuratierte Bibliothek zum Konsultieren geben, bevor sie antwortet ^[2].

Wie es funktioniert: Bevor eine Antwort generiert wird, durchsucht das System Ihre Wissensbasis nach relevanten Dokumenten und stellt diese dem LLM als Kontext bereit.

Am besten geeignet für:

Aufbau von Research-Repositories, die Fragen zu vergangenen Studien beantworten
Sicherstellung, dass Antworten in den spezifischen Daten Ihrer Organisation verankert sind
Reduzierung von Halluzinationen durch Verankerung in echten Dokumenten

Aufwand: Mittel (erfordert die Einrichtung einer Wissensbasis und eines Retrieval-Systems)

Fine-Tuning

Fine-Tuning beinhaltet das Nachtrainieren eines Basismodells auf einem spezialisierten Datensatz, um sein grundlegendes Verhalten zu verändern.

Am besten geeignet für:

Sehr große, spezialisierte Anwendungen
Wenn konsistente Einhaltung bestimmter Stile oder Frameworks erforderlich ist
Aufbau zentraler Research-Repositories mit organisationsspezifischer Terminologie

Aufwand: Hoch (erfordert große Datensätze, erhebliche Rechenleistung, technische Expertise)

Den richtigen Ansatz wählen

Situation	Bester Ansatz
Einmalige Analyse	Einfaches Prompting mit strukturiertem Input
Wiederkehrender Analysetyp	Dokumentierte Prompt-Vorlagen
Bezug auf frühere Arbeiten nötig	RAG mit Research-Repository
Unternehmensweite Konsistenz	Fine-Tuning in Betracht ziehen
Daten explorieren	Komitee von Bewerter*innen
Kritische Entscheidungen	Validierung mit menschlicher Kontrolle

Für eine strukturierte Rubrik zur Bewertung von Tools, die diese Techniken implementieren, siehe KI-Research-Tools bewerten: Ein beständiges Framework.

Referenz: Die Prompt-Bibliothek

Gute Prompts sind wiederverwendbare Ressourcen. Sobald Sie einen Prompt entwickelt haben, der konsistent hochwertige Ergebnisse liefert, speichern Sie ihn. Die Minuten, die Sie heute in die Verfeinerung eines Prompts investieren, sparen Stunden in jedem zukünftigen Projekt, das ihn nutzt.

Nachfolgend finden Sie zwei Vorlagen, die Sie direkt in Ihren Workflow übernehmen können. Jede folgt der Rolle-Kontext-Aufgabe-Output-Struktur, die über verschiedene Modelle hinweg zuverlässige Ergebnisse liefert.

Vorlage 1: Der Instrument-Stresstest

Verwenden Sie diesen Prompt, um kritisches Feedback zu einem Entwurf eines Interviewleitfadens, einer Survey oder eines Diskussionsskripts zu erhalten, bevor Sie Ihre Studie durchführen. Das Ziel ist, Probleme aufzudecken, bevor es die Teilnehmenden tun.

ROLLE:
Sie sind eine erfahrene Research-Methodikerin mit 15 Jahren Erfahrung
in der Gestaltung von Nutzerinterviews. Sie sind von Natur aus
skeptisch. Ihre Aufgabe ist es, Schwächen zu finden, nicht zu loben.

KONTEXT:
Ich bereite Nutzerinterviews zum Thema [THEMA] vor. Das Forschungsziel
ist es, [SPEZIFISCHES ZIEL] zu verstehen. Ich habe den untenstehenden
Interviewleitfaden entworfen und benötige einen Stresstest, bevor die
Feldarbeit beginnt.

AUFGABE:
Überprüfen Sie den folgenden Interviewleitfaden. Ihre Kritik sollte
sich auf drei Bereiche konzentrieren:

1. Suggestivfragen: Identifizieren Sie Fragen, die die teilnehmende
   Person zu einer bestimmten Antwort lenken könnten. Erklären Sie,
   warum jede problematisch ist, und schlagen Sie eine neutrale
   Alternative vor.

2. Mehrdeutigkeit: Identifizieren Sie Begriffe oder Formulierungen,
   die Teilnehmende anders interpretieren könnten als beabsichtigt.
   Markieren Sie Fachjargon, vage Formulierungen oder Annahmen über
   das Vorwissen der Nutzenden.

3. Lücken: Identifizieren Sie basierend auf dem genannten
   Forschungsziel wichtige Themen oder Nachfragebereiche, die der
   Leitfaden nicht abdeckt.

OUTPUT:
Geben Sie Ihr Feedback in einer strukturierten Liste, geordnet nach
den drei oben genannten Kategorien. Fügen Sie für jedes Problem hinzu:
den Originaltext, das Problem und eine Revisionsempfehlung.

---
[FÜGEN SIE IHREN INTERVIEWLEITFADEN HIER EIN]

Vorlage 2: Der Szenario-Transformator

Verwenden Sie diesen Prompt, um technische Use Cases oder Feature-Anforderungen in realistische, zielorientierte Szenarien für Usability-Tests umzuwandeln. Produktteams schreiben oft in systemzentrierter Sprache ("Nutzer erstellt ein Konto"). Dieser Prompt transformiert das in menschenzentrierte Sprache ("Alex muss ihr Profil einrichten, bevor sie morgen ihr erstes Meeting hat").

ROLLE:
Sie sind eine erfahrene UX-Strategin, die die Perspektive der
Nutzenden vertritt. Sie übersetzen systemzentriertes Denken in
menschenzentriertes Design.

KONTEXT:
Mein Team hat eine Liste von "Use Cases" erstellt, die aus der
Systemperspektive geschrieben sind. Ich muss sie als realistische
Nutzerziel-Szenarien für Usability-Tests umschreiben. Das Produkt
ist [PRODUKTBESCHREIBUNG]. Die primäre Nutzerin ist
[NUTZERBESCHREIBUNG].

AUFGABE:
Schreiben Sie für jeden bereitgestellten Use Case ein entsprechendes
Nutzerziel-Szenario. Das Szenario sollte:

- Eine kurze, nachvollziehbare Geschichte sein (2-3 Sätze)
- Einen konkreten Nutzernamen und realistischen Kontext enthalten
- Sich auf das Ziel der nutzenden Person konzentrieren, nicht auf die
  Systemfunktion
- Keine spezifischen UI-Elemente oder Navigationspfade erwähnen
- Eine Motivation enthalten (warum der Person dieses Ziel wichtig ist)

OUTPUT:
Erstellen Sie eine zweispaltige Tabelle mit den Überschriften
"Ursprünglicher Use Case" und "Nutzerziel-Szenario". Nehmen Sie alle
bereitgestellten Use Cases auf.

---
USE CASES:
[FÜGEN SIE IHRE USE CASES HIER EIN]

Was das für die Praxis bedeutet

Das Ziel ist nicht, ein bestimmtes Tool zu beherrschen, sondern eine Denkweise über die Zusammenarbeit von Mensch und KI zu entwickeln:

Strukturieren Sie Ihre Kommunikation, als würden Sie einen fähigen Kollegen einarbeiten
Wirken Sie Sycophancy entgegen, indem Sie explizit um kritisches Feedback bitten
Nutzen Sie Ihre Notizen, um Daten vorab durch Ihr Expertenurteil zu filtern
Setzen Sie mehrere Modelle ein, um Ergebnisse mit hoher Konfidenz und interessante Grenzfälle zu identifizieren
Bauen Sie Taxonomies kollaborativ auf, wobei die KI den ersten Entwurf übernimmt
Wählen Sie RAG statt Fine-Tuning für die meisten praktischen Anwendungen

Diese Prinzipien werden jedes spezifische Modell und jede Plattform überdauern. Lernen Sie sie einmal und wenden Sie sie auf alle zukünftigen Tools an.

Für einen grundlegenden Überblick über KI-Fähigkeiten und -Grenzen in der Forschung, siehe Was KI für UX Research leisten kann und was nicht.

Für eine kritische Einschätzung von KI-Moderation in der Praxis, siehe KI-moderierte Interviews: Das Flickenteppich-Problem.

Sobald Sie den grundlegenden Workflow der KI-gestützten Analyse beherrschen, können mehrere fortgeschrittene Techniken die Zuverlässigkeit und Qualität der Ergebnisse deutlich verbessern.

Prompting ist strukturierte Kommunikation

"Prompt Engineering" ist ein überbewerteter Begriff. Der Schlüssel zu guten Ergebnissen liegt nicht im Erlernen geheimer Tricks, sondern im Üben klarer Kommunikation.

Stellen Sie sich die Arbeit mit einem LLM vor wie das Onboarding eines sehr fähigen, aber völlig neuen Kollegen. Sie müssen:

Den gesamten notwendigen Kontext liefern: Das Modell weiß nichts über Ihr Projekt
Implizite Anforderungen explizit machen: Was Sie für offensichtlich halten, ist es möglicherweise nicht
Auf spezifische Nuancen hinweisen: "Achten Sie besonders auf die Kommentare dieser Nutzerin zum Preis; ihr Tonfall war zögerlich, obwohl ihre Worte positiv waren"
Daten in strukturierten Formaten bereitstellen: Tidy Data lässt wenig Raum für Fehlinterpretationen

Jenseits des Chatbots: Fortgeschrittene Architekturen

Um eine echte Research-Engine aufzubauen, müssen Sie über das Einfügen von Text in ein Chat-Fenster hinausgehen. Hier sind die drei Architekturen, die zählen:

Architektur	Metapher	Was sie tut	Aufwand
RAG	Die Bibliothekarin	Verankert KI in Ihren Dokumenten	Mittel
Fine-Tuning	Die Spezialistin	Trainiert KI auf Ihren Daten nach	Hoch
*Komitee von Bewerterinnen**	Das Panel	Nutzt mehrere KIs für Konsens	Niedrig

RAG = Die Bibliothekarin

Retrieval-Augmented Generation (RAG) verbindet die KI mit einer spezifischen, kuratierten Bibliothek: Ihrem PDF-Repository, Ihren bisherigen Research-Berichten, Ihrer Insights-Datenbank.

Warum es wichtig ist: Dies eliminiert Halluzinationen, indem die KI in Ihren tatsächlichen Daten verankert wird. Anstatt Dinge zu erfinden, zitiert sie Ihre echten Ergebnisse.

Fine-Tuning = Die Spezialistin

Fine-Tuning bedeutet, ein Basismodell auf Tausenden Ihrer bisherigen Berichte nachzutrainieren, um ihm Ihren spezifischen Ton, Ihr Format und Ihren Kategorisierungsstil beizubringen.

Wie es funktioniert: Sie stellen einen großen Datensatz mit Beispielen bereit (z. B. "hier sind 500 korrekt kategorisierte Nutzerzitate"). Das Modell lernt Ihre Muster.

Komitee von Bewerter*innen = Das Panel

Anstatt einer einzelnen KI zu vertrauen, speisen Sie denselben Prompt und dieselben Daten in mehrere Modelle ein (z. B. GPT-4, Claude, Gemini) und vergleichen die Ergebnisse.

Warum es wichtig ist: Geringer Aufwand, hohe Zuverlässigkeit. Abweichungen offenbaren Mehrdeutigkeit, Nuancen und Grenzfälle, bei denen Ihr Expertenurteil am dringendsten benötigt wird.

Sycophancy entgegenwirken

Das Problem

Wenn Sie ein LLM bitten, Ihre Survey-Fragen zu überprüfen, könnte es antworten:

"Das sind ausgezeichnete Fragen, die die Nutzerstimmung effektiv erfassen werden..."

Selbst wenn mehrere Fragen offensichtliche Mängel aufweisen.

Die Lösung

Experimentieren Sie mit Anweisungen, die das Modell aus seinem standardmäßig zustimmenden Verhalten herausführen:

Rollenbasierte Umrahmung:

"Agieren Sie als skeptische Methodikerin, deren Aufgabe es ist, Schwächen zu finden."

Explizite Anweisung:

"Seien Sie schonungslos ehrlich. Kein Beschönigen, kein Weichzeichnen. Ich muss wissen, was falsch ist."

Strukturierte Kritik:

"Bevor Sie irgendwelche Stärken diskutieren, listen Sie drei spezifische Probleme mit diesem Ansatz auf."

Das Ziel ist, einen zustimmenden Assistenten in einen kritischen Sparringspartner zu verwandeln.

Notizen vs. Transkripte

Ein häufiger Fehler ist es, sich ausschließlich auf automatische Transkription zu verlassen, ohne menschengeführte Synthese durchzuführen.

Obwohl LLMs ganze Transkripte verarbeiten können, beinhaltet ein strategischerer Ansatz die Verwendung Ihrer eigenen detaillierten Notizen als primären Input für die Analyse.

Warum Notizen besser funktionieren

Aspekt	Transkript	Notizen der Forschenden
Umfang	Alles Gesagte	Gefiltert nach Relevanz
Kontext	Nur Worte	Tonfall, Reaktionen, Beobachtungen
Vorverarbeitung	Keine	Expertenurteil angewandt
Signal-Rausch-Verhältnis	Niedrig	Hoch

KI als Komitee von Bewerter*innen

Eine der leistungsstärksten Techniken ist es, verschiedene LLMs als "Komitee von Bewerter*innen" zu behandeln, anstatt sich auf ein einzelnes Modell zu verlassen.

Wie es funktioniert

Geben Sie denselben Prompt und dieselben Daten an zwei oder drei verschiedene Modelle
Vergleichen Sie deren Ergebnisse
Wo sie übereinstimmen, haben Sie hohe Konfidenz
Wo sie abweichen, haben Sie etwas Interessantes gefunden

Warum Abweichungen wichtig sind

Abweichungen zwischen Modellen weisen oft auf Folgendes hin:

Mehrdeutige Daten, die menschliche Interpretation erfordern
Nuancierte Ergebnisse, die nicht eindeutig sind
Grenzfälle in Ihrer Taxonomy
Besonders wichtige Erkenntnisse, die genauere Untersuchung verdienen

Behandeln Sie Abweichungen nicht als Fehler, sondern als Signale dafür, wo Ihr Expertenurteil am dringendsten benötigt wird.

Für einen praktischen Vier-Schritte-Workflow, der diese Techniken anwendet, siehe KI-gestützte thematische Analyse: Ein praktischer Workflow.

Aufbau von Taxonomies und Ontologies

LLMs sind außergewöhnlich gut darin, Nuancen zwischen verschiedenen Abstraktionsebenen zu finden. Das macht sie wertvoll für den Aufbau von Klassifikationssystemen:

Taxonomy: Ein Klassifikationssystem (eine Menge von Tags)

Beispiel: "Login-Button-Problem" ist eine Art von "Usability-Problem"

Ontology: Die Beziehungen zwischen Klassifikationen

Beispiel: "Login-Button-Problem" betrifft "Onboarding" was sich auswirkt auf "Aktivierungsrate"

Nutzen Sie LLMs, um:

Initiale Taxonomies basierend auf Beispieldaten vorzuschlagen
Lücken in bestehenden Taxonomies zu identifizieren
Beziehungen zwischen Kategorien vorzuschlagen
Konkrete Nutzerprobleme mit übergeordneten strategischen Themen zu verbinden

Validieren und verfeinern Sie die Vorschläge der KI immer, aber lassen Sie sie die Schwerstarbeit des ersten Entwurfs übernehmen.

Für die manuellen Codierungsgrundlagen, auf denen die Taxonomie-Erstellung aufbaut, siehe Qualitative thematische Analyse: Von Codes zu Insights.

Fortgeschrittene Techniken: RAG und Fine-Tuning

Mit fortschreitender Erfahrung werden Sie auf zwei zentrale Techniken stoßen, um einem LLM spezifisches Wissen bereitzustellen:

Retrieval-Augmented Generation (RAG)

RAG ist, als würde man der KI eine spezifische, kuratierte Bibliothek zum Konsultieren geben, bevor sie antwortet ^[2].

Wie es funktioniert: Bevor eine Antwort generiert wird, durchsucht das System Ihre Wissensbasis nach relevanten Dokumenten und stellt diese dem LLM als Kontext bereit.

Am besten geeignet für:

Aufbau von Research-Repositories, die Fragen zu vergangenen Studien beantworten
Sicherstellung, dass Antworten in den spezifischen Daten Ihrer Organisation verankert sind
Reduzierung von Halluzinationen durch Verankerung in echten Dokumenten

Aufwand: Mittel (erfordert die Einrichtung einer Wissensbasis und eines Retrieval-Systems)

Fine-Tuning

Fine-Tuning beinhaltet das Nachtrainieren eines Basismodells auf einem spezialisierten Datensatz, um sein grundlegendes Verhalten zu verändern.

Am besten geeignet für:

Sehr große, spezialisierte Anwendungen
Wenn konsistente Einhaltung bestimmter Stile oder Frameworks erforderlich ist
Aufbau zentraler Research-Repositories mit organisationsspezifischer Terminologie

Aufwand: Hoch (erfordert große Datensätze, erhebliche Rechenleistung, technische Expertise)

Den richtigen Ansatz wählen

Situation	Bester Ansatz
Einmalige Analyse	Einfaches Prompting mit strukturiertem Input
Wiederkehrender Analysetyp	Dokumentierte Prompt-Vorlagen
Bezug auf frühere Arbeiten nötig	RAG mit Research-Repository
Unternehmensweite Konsistenz	Fine-Tuning in Betracht ziehen
Daten explorieren	Komitee von Bewerter*innen
Kritische Entscheidungen	Validierung mit menschlicher Kontrolle

Für eine strukturierte Rubrik zur Bewertung von Tools, die diese Techniken implementieren, siehe KI-Research-Tools bewerten: Ein beständiges Framework.

Referenz: Die Prompt-Bibliothek

Vorlage 1: Der Instrument-Stresstest

ROLLE:
Sie sind eine erfahrene Research-Methodikerin mit 15 Jahren Erfahrung
in der Gestaltung von Nutzerinterviews. Sie sind von Natur aus
skeptisch. Ihre Aufgabe ist es, Schwächen zu finden, nicht zu loben.

KONTEXT:
Ich bereite Nutzerinterviews zum Thema [THEMA] vor. Das Forschungsziel
ist es, [SPEZIFISCHES ZIEL] zu verstehen. Ich habe den untenstehenden
Interviewleitfaden entworfen und benötige einen Stresstest, bevor die
Feldarbeit beginnt.

AUFGABE:
Überprüfen Sie den folgenden Interviewleitfaden. Ihre Kritik sollte
sich auf drei Bereiche konzentrieren:

1. Suggestivfragen: Identifizieren Sie Fragen, die die teilnehmende
   Person zu einer bestimmten Antwort lenken könnten. Erklären Sie,
   warum jede problematisch ist, und schlagen Sie eine neutrale
   Alternative vor.

2. Mehrdeutigkeit: Identifizieren Sie Begriffe oder Formulierungen,
   die Teilnehmende anders interpretieren könnten als beabsichtigt.
   Markieren Sie Fachjargon, vage Formulierungen oder Annahmen über
   das Vorwissen der Nutzenden.

3. Lücken: Identifizieren Sie basierend auf dem genannten
   Forschungsziel wichtige Themen oder Nachfragebereiche, die der
   Leitfaden nicht abdeckt.

OUTPUT:
Geben Sie Ihr Feedback in einer strukturierten Liste, geordnet nach
den drei oben genannten Kategorien. Fügen Sie für jedes Problem hinzu:
den Originaltext, das Problem und eine Revisionsempfehlung.

---
[FÜGEN SIE IHREN INTERVIEWLEITFADEN HIER EIN]

Vorlage 2: Der Szenario-Transformator

ROLLE:
Sie sind eine erfahrene UX-Strategin, die die Perspektive der
Nutzenden vertritt. Sie übersetzen systemzentriertes Denken in
menschenzentriertes Design.

KONTEXT:
Mein Team hat eine Liste von "Use Cases" erstellt, die aus der
Systemperspektive geschrieben sind. Ich muss sie als realistische
Nutzerziel-Szenarien für Usability-Tests umschreiben. Das Produkt
ist [PRODUKTBESCHREIBUNG]. Die primäre Nutzerin ist
[NUTZERBESCHREIBUNG].

AUFGABE:
Schreiben Sie für jeden bereitgestellten Use Case ein entsprechendes
Nutzerziel-Szenario. Das Szenario sollte:

- Eine kurze, nachvollziehbare Geschichte sein (2-3 Sätze)
- Einen konkreten Nutzernamen und realistischen Kontext enthalten
- Sich auf das Ziel der nutzenden Person konzentrieren, nicht auf die
  Systemfunktion
- Keine spezifischen UI-Elemente oder Navigationspfade erwähnen
- Eine Motivation enthalten (warum der Person dieses Ziel wichtig ist)

OUTPUT:
Erstellen Sie eine zweispaltige Tabelle mit den Überschriften
"Ursprünglicher Use Case" und "Nutzerziel-Szenario". Nehmen Sie alle
bereitgestellten Use Cases auf.

---
USE CASES:
[FÜGEN SIE IHRE USE CASES HIER EIN]

Was das für die Praxis bedeutet

Das Ziel ist nicht, ein bestimmtes Tool zu beherrschen, sondern eine Denkweise über die Zusammenarbeit von Mensch und KI zu entwickeln:

Strukturieren Sie Ihre Kommunikation, als würden Sie einen fähigen Kollegen einarbeiten
Wirken Sie Sycophancy entgegen, indem Sie explizit um kritisches Feedback bitten
Nutzen Sie Ihre Notizen, um Daten vorab durch Ihr Expertenurteil zu filtern
Setzen Sie mehrere Modelle ein, um Ergebnisse mit hoher Konfidenz und interessante Grenzfälle zu identifizieren
Bauen Sie Taxonomies kollaborativ auf, wobei die KI den ersten Entwurf übernimmt
Wählen Sie RAG statt Fine-Tuning für die meisten praktischen Anwendungen

Diese Prinzipien werden jedes spezifische Modell und jede Plattform überdauern. Lernen Sie sie einmal und wenden Sie sie auf alle zukünftigen Tools an.

Für einen grundlegenden Überblick über KI-Fähigkeiten und -Grenzen in der Forschung, siehe Was KI für UX Research leisten kann und was nicht.

Für eine kritische Einschätzung von KI-Moderation in der Praxis, siehe KI-moderierte Interviews: Das Flickenteppich-Problem.

Fortgeschrittene KI-Techniken für Research

Zusammenfassung

Prompting ist strukturierte Kommunikation

Jenseits des Chatbots: Fortgeschrittene Architekturen

RAG = Die Bibliothekarin

Fine-Tuning = Die Spezialistin

Komitee von Bewerter*innen = Das Panel

Sycophancy entgegenwirken

Das Problem

Die Lösung

Notizen vs. Transkripte

Warum Notizen besser funktionieren

KI als Komitee von Bewerter*innen

Wie es funktioniert

Warum Abweichungen wichtig sind

Aufbau von Taxonomies und Ontologies

Fortgeschrittene Techniken: RAG und Fine-Tuning

Retrieval-Augmented Generation (RAG)

Fine-Tuning

Den richtigen Ansatz wählen

Referenz: Die Prompt-Bibliothek

Vorlage 1: Der Instrument-Stresstest

Vorlage 2: Der Szenario-Transformator

Was das für die Praxis bedeutet

Quellenverzeichnis

Kostenloses Research-Handbuch

Verwandte Resources

KI-gestützte thematische Analyse: Ein praktischer Workflow

Was KI für UX Research leisten kann und was nicht

Qualitative thematische Analyse: Von Codes zu Insights

Bereit für den nächsten Schritt?

Fortgeschrittene KI-Techniken für Research

Zusammenfassung

Prompting ist strukturierte Kommunikation

Jenseits des Chatbots: Fortgeschrittene Architekturen

RAG = Die Bibliothekarin

Fine-Tuning = Die Spezialistin

Komitee von Bewerter*innen = Das Panel

Sycophancy entgegenwirken

Das Problem

Die Lösung

Notizen vs. Transkripte

Warum Notizen besser funktionieren

KI als Komitee von Bewerter*innen

Wie es funktioniert

Warum Abweichungen wichtig sind

Aufbau von Taxonomies und Ontologies

Fortgeschrittene Techniken: RAG und Fine-Tuning

Retrieval-Augmented Generation (RAG)

Fine-Tuning

Den richtigen Ansatz wählen

Referenz: Die Prompt-Bibliothek

Vorlage 1: Der Instrument-Stresstest

Vorlage 2: Der Szenario-Transformator

Was das für die Praxis bedeutet

Quellenverzeichnis

Kostenloses Research-Handbuch

Verwandte Resources

KI-gestützte thematische Analyse: Ein praktischer Workflow

Was KI für UX Research leisten kann und was nicht

Qualitative thematische Analyse: Von Codes zu Insights

Bereit für den nächsten Schritt?