KI-Halluzination Studie 2026: DACH Mittelstand-Unternehmen

Inhalt

Eine empirische Untersuchung von maxonline® Marketing hfw GmbH Studienzeitraum: März – April 2026

Studien-Zusammenfassung
Wir haben 150 mittelständische Unternehmen aus dem DACH-Raum (Schwerpunkt Österreich) in ChatGPT systematisch getestet — mit über 450 standardisierten Prompts. Das Ergebnis ist alarmierend:

56 % der Unternehmen sind für ChatGPT unsichtbar — sie werden bei branchenspezifischen Empfehlungsfragen nicht genannt
96 % der genannten Geschäftsführer sind frei erfunden — ChatGPT erfindet systematisch Namen von Führungspersonen
78 % der genannten Gründungsjahre sind falsch — mit Abweichungen von bis zu 162 Jahren
Nur 3 % der getesteten Unternehmen wurden vollständig korrekt dargestellt
97 % aller negativen KI-Darstellungen basieren auf Arbeitgeberbewertungsportalen

Bei rund 68 Unternehmen erfindet ChatGPT aktiv falsche Informationen. Bei weiteren 56 verweigert es jede konkrete Aussage. Und nur bei 4 Unternehmen stimmen alle Fakten.

1. Ausgangslage und Forschungsfrage

Immer mehr Konsumenten, Einkäufer und Entscheider nutzen KI-Chatbots wie ChatGPT als erste Informationsquelle — auch für Unternehmensrecherchen, Anbietervergleiche und Kaufentscheidungen.
Doch wie zuverlässig ist ChatGPT, wenn es um konkrete Unternehmensinformationen im DACH-Mittelstand geht?

Forschungsfragen der KI-Halluzination Studie

Sichtbarkeit: Werden mittelständische Unternehmen bei branchenspezifischen Empfehlungsfragen von ChatGPT genannt?
Korrektheit: Stimmen die Fakten, die ChatGPT über diese Unternehmen liefert — insbesondere Gründungsjahr, Geschäftsführung, Mitarbeiterzahl und Auszeichnungen?
Darstellung: Ist das Gesamtbild, das ChatGPT zeichnet, positiv, negativ oder neutral — und auf welchen Quellen basiert es?

2. Studiendesign

2.1 Stichprobe

150 Unternehmen aus dem DACH-Raum (Schwerpunkt Österreich, ergänzt um ausgewählte Unternehmen aus Deutschland und der Schweiz)
11 Branchen: Tourismus & Gastronomie, Handel, IT & Dienstleistung, Produktion & Industrie, Recht & Steuerberatung, Transport & Logistik, Handwerk & Bau, Gesundheit & Pflege, Immobilien & Hausverwaltung
Unternehmensgröße: Mittelstand mit geschätztem Jahresumsatz zwischen 5 und 50 Millionen Euro
Auswahlkriterium: Bewusste Mischung aus Nischenplayern, regionalen Champions und größeren Unternehmen, um ein realistisches Bild des Mittelstands abzubilden

2.2 Testumgebung

KI-Modell: ChatGPT (aktuelles Modell zum Testzeitpunkt, mit aktiviertem Web-Browsing)
Methodik: Jeder Prompt wurde im Inkognitomodus des Browsers und ohne eingeloggten ChatGPT-Account in einem neuen, separaten Chat eingegeben, um Personalisierung und Kontextübertragung zwischen Tests auszuschließen
Dokumentation: Jede ChatGPT-Antwort wurde vollständig dokumentiert und gegen verifizierte Quellen geprüft (Firmenbuch, Unternehmenswebsites, WKO, Creditreform, Wikipedia)

2.3 Drei standardisierte Prompts pro Unternehmen

Jedes Unternehmen wurde mit drei Prompts getestet:

Prompt 1 — Sichtbarkeit (Empfehlungsfrage)
Branchenspezifische Frage, die eine Empfehlung provoziert. Beispiele:

„Welchen Fertighaushersteller in Österreich würdest du mir empfehlen?“
„Welches Wellnesshotel im Burgenland kannst du empfehlen?“
„Welche SEO-Agentur in Wien ist empfehlenswert?“

Prompt 2 — Korrektheit (Faktenfragen)
Branchenspezifische Faktenfragen, die überprüfbare Angaben zu Gründungsjahr, Geschäftsführung, Unternehmensgröße und Auszeichnungen abfragen. Beispiele:

Hotels: „Wie viele Zimmer hat [Hotel], wann wurde es eröffnet, wer führt es und welche Auszeichnungen hat es erhalten?“
Industrie/Konzern: „Wer ist der aktuelle CEO von [Firma], wann wurde das Unternehmen gegründet, wie viele Mitarbeiter hat es und welche Auszeichnungen hat es erhalten?“
Handel/Handwerk: „Seit wann gibt es [Firma], wer ist der Geschäftsführer, wie viele Mitarbeiter hat das Unternehmen und welche Zertifizierungen hat es?“
Juwelier: „Seit wann gibt es [Firma], wer führt das Unternehmen, welche Luxusmarken werden geführt und welche Auszeichnungen hat es erhalten?“

Die Prompts orientieren sich an typischen Fragen, die ein potenzieller Kunde, Geschäftspartner oder Journalist an ChatGPT stellen würde.

Prompt 3 — Darstellung (Reputationsfrage)
Standardisierte Frage nach der öffentlichen Wahrnehmung:

„Welche Erfahrungen oder Bewertungen findest du zu [Firma]?“

3. Ergebnisse

3.1 Sichtbarkeit: 56 % unsichtbar

Ergebnis	Anzahl	Anteil
Sichtbar (ja)	57	38 %
Teilweise sichtbar	9	6 %
Unsichtbar (nein)	84	56 %

Mehr als jedes zweite getestete Unternehmen wird von ChatGPT bei branchenspezifischen Empfehlungsfragen nicht genannt.

ChatGPT Sichtbarkeit von mittelständischen Unternehmen bei KI-Empfehlungen. Quelle: maxonline

Sichtbarkeit nach Branche

Branche	Unternehmen	Sichtbar	Quote
Gesundheit & Pflege	8	7	88 %
Tourismus & Gastronomie	26	14	54 %
Handwerk & Bau	14	7	50 %
Produktion & Industrie	22	9	43 %
Recht & Steuerberatung	12	5	38 %
Handel	24	6	25 %
Transport & Logistik	14	4	29 %
IT & Dienstleistung	24	5	21 %
Immobilien	6	0	0 %

KI-Sichtbarkeit im DACH-Mittelstand nach Branche. Quelle: maxonline

Sichtbarkeitsfaktoren — Was ChatGPT-Empfehlungen begünstigt

Aus den Daten lassen sich klare Muster ableiten:

Nische + digitale Präsenz = Sichtbarkeit. Unternehmen mit klar definierter Nische UND starker Online-Präsenz (Reviews, Landingpages, strukturierte Daten) werden bevorzugt empfohlen.
Nische allein reicht nicht. Mehrere hochspezialisierte Unternehmen ohne digitale Signale blieben unsichtbar.
B2B-Großhändler sind systematisch unsichtbar. Regionale Großhändler (Elektro, Holz) werden von Konzernen mit Wikipedia-Präsenz oder starken Websites dominiert.
Prompt-Spezifität wirkt. Bei Hotels zeigte sich: Je spezifischer die Region im Prompt (z.B. „Montafon“ statt „Vorarlberg“), desto eher wurde ein Nischenanbieter empfohlen.
Nischen-Domains verstärken KI-Markenbildung. Unternehmen mit sprechenden Domains (z.B. branchenspezifische .at-Domains) wurden häufiger empfohlen.

3.2 Korrektheit: 96 % falsche Geschäftsführer

Bei branchenspezifischen Faktenfragen (Gründungsjahr, Geschäftsführung, Mitarbeiterzahl, Auszeichnungen) zeigt sich ein alarmierendes Bild:

Ergebnis	Anzahl (von 150)	Anteil
Halluzination (konkret falsche Fakten)	68	45 %
Verweigerung (keine konkreten Fakten)	56	37 %
Teilweise korrekt	22	15 %
Vollständig korrekt	4	3 %

KI Halluzination: Korrektheit bei Faktenfragen. Quelle: maxonline

Nur 4 von 150 Unternehmen erhielten vier von vier korrekte Faktenpunkte.

Halluzinationsraten nach Faktenkategorie

Faktenpunkt	Falsch (wenn konkret beantwortet)
Geschäftsführer / CEO	96 %
Gründungsjahr	78 %
Mitarbeiterzahl	68 %
Auszeichnungen / Awards	58 %

KI Halluzinationen: Fehler nach Faktenkategorie. Quelle: maxonline

Die CEO KI-Halluzination — das zentrale Ergebnis

In jedem einzelnen Fall, in dem ChatGPT einen konkreten Namen für den Geschäftsführer oder CEO nannte, war dieser frei erfunden. Die KI generiert plausibel klingende, aber vollständig fiktive Personennamen.

Beispielhafte Fehler (anonymisiert):

Ein Fertighaushersteller, gegründet 1897, erhielt von ChatGPT das Gründungsjahr 1980 — 83 Jahre daneben. Der genannte Geschäftsführer war eine Kombination aus dem Firmennamen und einem erfundenen Vornamen.
Ein Traditionsunternehmen seit 1802 (über 220 Jahre) wurde auf 1964 datiert — 162 Jahre Abweichung. Sämtliche genannten Luxusmarken waren falsch; die wichtigste Partnermarke (seit 70 Jahren) wurde nicht erwähnt.
Ein international bekanntes 5-Sterne-Luxushotel erhielt einen erfundenen General Manager und seine drei Michelin-Sterne wurden verschwiegen — obwohl explizit nach Michelin gefragt wurde.
Ein börsennotierter Konzern mit Wikipedia-Eintrag erhielt einen komplett erfundenen CEO-Namen.

Halluzinationsmuster nach Firmentyp

Firmentyp	Typisches ChatGPT-Verhalten
Kleinstunternehmen (e.U., GbR, Einzelpraxis)	Verweigerung — keine konkreten Fakten
Familienhotels und -betriebe	Halluzination — erfindet Familiennamen
Mittelständische B2B-Firmen	Halluzination — erfindet GF + falsches Gründungsjahr
Konzerne mit Wikipedia	GF erfunden, Gründung und Mitarbeiter ~korrekt

Spannendes Ergebnis: Je „fast bekannter“ ein Unternehmen für ChatGPT ist, desto eher halluziniert es. Völlig unbekannte Firmen erhalten eine ehrliche Verweigerung. Firmen mit teilweisem Wissen erhalten die gefährlichsten Antworten: selbstbewusst vorgetragene Falschinformationen.

3.3 Darstellung: Arbeitgeberbewertungen prägen das KI-Image

Ergebnis	Anzahl	Anteil
Positiv	98	65 %
Negativ	21	14 %
Keine Angaben	31	21 %

KI-Sentiment: Darstellung von DACH Mittelstand-Unternehmen in KI-Antworten. Quelle: maxonline

Negative Darstellungen basieren fast ausschließlich auf Arbeitgeberbewertungen

Von 21 Unternehmen mit negativer Darstellung basierten 20 auf Arbeitgeberbewertungsportalen. Kundenbewertungen, Presseberichte oder andere Quellen spielten für negative KI-Darstellungen nahezu keine Rolle.

Erkenntnis: Arbeitgeberbewertungsportale haben einen überproportionalen Einfluss auf das KI-Image von Unternehmen. Schon wenige negative Einträge können das Gesamtbild kippen — selbst wenn die Kundenbewertungen durchweg positiv sind.

Der Bewertungs-Blindspot

31 Unternehmen (21 %) erhielten die Bewertung „keine Angaben“ — ChatGPT konnte weder positive noch negative Erfahrungsberichte finden. Diese Unternehmen haben typischerweise:

Keine Google Reviews
Keine Bewertungen auf Branchenportalen
Keine Presseerwähnungen oder Testberichte

Erkenntnis: Fehlende Online-Bewertungen bedeuten nicht Neutralität, sondern Unsichtbarkeit. Für ChatGPT existieren diese Unternehmen in der öffentlichen Wahrnehmung schlicht nicht.

4. Zusammenfassung der Ergebnisse

Dimension	Ergebnis
Unsichtbar bei Empfehlungen	52 % (78 von 150)
Halluzination bei Faktenfragen	45 % (68 von 150)
Verweigerung bei Faktenfragen	37 % (56 von 150)
Vollständig korrekt	3 % (4 von 150)
GF/CEO erfunden (wenn konkret genannt)	96 %
Gründungsjahr falsch (wenn konkret genannt)	78 %
Mitarbeiterzahl falsch (wenn konkret genannt)	68 %
Awards erfunden (wenn konkret genannt)	58 %
Negative Darstellung durch Arbeitgeberbewertungen	97 % aller negativen Fälle

5. Die 10 Kernerkenntnisse

1. ChatGPT liefert bei konkreten Faktenfragen massiv falsche Informationen.

Bei Fragen nach Gründungsjahr, Geschäftsführung, Mitarbeiterzahl und Auszeichnungen erfindet ChatGPT systematisch Informationen — in 45 % der Fälle mit konkret falschen Fakten, in weiteren 37 % mit einer Verweigerung jeder konkreten Aussage.

2. ChatGPT erfindet den Chef — in 96 % der Fälle.

Wenn ChatGPT einen konkreten Namen für den Geschäftsführer oder CEO nennt, ist dieser mit überwältigender Wahrscheinlichkeit frei erfunden. Die KI generiert plausibel klingende, aber fiktive Personennamen.

3. Jedes zweite Unternehmen ist für ChatGPT unsichtbar.

56 % der getesteten Unternehmen werden bei branchenspezifischen Empfehlungsfragen nicht erwähnt — unabhängig von Qualität, Tradition oder Marktposition.

4. Nische allein reicht nicht — digitale Präsenz entscheidet.

Unternehmen mit klar definierter Nische UND starker Online-Präsenz (Bewertungen, Landingpages, strukturierte Daten) werden bevorzugt empfohlen. Nischenposition ohne digitale Signale führt zu Unsichtbarkeit.

5. Arbeitgeberbewertungen dominieren das negative KI-Image.

97 % aller negativen Darstellungen in der Studie gehen auf Arbeitgeberbewertungsportale zurück. Kundenbewertungen oder Presseberichte spielen für negative KI-Darstellungen kaum eine Rolle.

6. Fehlende Bewertungen = KI-Blindspot.

Unternehmen ohne Online-Bewertungen existieren für ChatGPT in der öffentlichen Wahrnehmung nicht. Weder positiv noch negativ — sie sind schlicht unsichtbar.

7. Klassische SEO-Signale beeinflussen die KI-Sichtbarkeit.

Unternehmen mit gezielten Landingpages und einer kritischen Masse an Bewertungen wurden deutlich häufiger empfohlen. Es besteht ein klarer Zusammenhang zwischen klassischer Suchmaschinenoptimierung und KI-Empfehlungen.

8. Sprechende Domains verstärken die KI-Zuordnung.

Unternehmen mit branchenspezifischen Domains wurden häufiger korrekt zugeordnet und empfohlen als solche mit generischen oder vom Firmennamen abweichenden Domains.

9. B2B-Großhändler sind strukturell unsichtbar.

Regionale B2B-Unternehmen ohne Endkunden-Reviews und ohne Presse-/Wikipedia-Präsenz werden systematisch von Konzernen überstrahlt. Dies ist kein individuelles, sondern ein strukturelles Problem.

10. Je „fast bekannter“ die Firma, desto gefährlicher die Halluzination.

Völlig unbekannte Unternehmen erhalten ehrliche Verweigerungen. Unternehmen mit teilweisem KI-Wissen erhalten die gefährlichsten Antworten: selbstbewusst präsentierte Falschinformationen, die auf den ersten Blick korrekt wirken.

6. Fazit: Halluzinationen sind vermeidbar

Die Ergebnisse dieser Studie zeigen ein klares Muster: ChatGPT halluziniert dort am stärksten, wo verlässliche, strukturierte Unternehmensdaten fehlen. Wo die KI keine belastbaren Quellen findet, füllt sie die Lücken mit plausibel klingenden, aber frei erfundenen Informationen.

Das bedeutet im Umkehrschluss: Unternehmen, die ihre Kerndaten — Gründungsjahr, Geschäftsführung, Standorte, Mitarbeiterzahl, Zertifizierungen — aktiv und konsistent auf der eigenen Website platzieren, reduzieren das Halluzinationsrisiko erheblich.

Strukturierte Daten als Schutzschild

Besonders wirksam ist die Hinterlegung dieser Informationen in strukturierten Daten (Schema.org). Strukturierte Daten sind maschinenlesbare Auszeichnungen im Quellcode einer Website, die Suchmaschinen und KI-Modellen eine eindeutige Zuordnung ermöglichen. Sie liefern der KI genau die Fakten, die sie sonst halluzinieren würde.

Konkret empfiehlt sich die strukturierte Auszeichnung von:

Organization-Markup: Firmenname, Gründungsjahr, Standort, Logo, Kontaktdaten
Person-Markup: Geschäftsführung mit Name, Rolle und Zugehörigkeit
Product/Service-Markup: Leistungen, Marken, Zertifizierungen
Review-Markup: Bewertungen und Auszeichnungen mit verifizierbaren Quellen

Unternehmen, die ihre digitale Präsenz mit korrekten, strukturierten Daten untermauern, schaffen damit eine verlässliche Informationsbasis — nicht nur für klassische Suchmaschinen, sondern zunehmend auch für KI-Modelle. Die Halluzinationsrate lässt sich so aktiv und messbar senken.

Die zentrale Erkenntnis dieser Studie lautet daher: KI-Halluzinationen sind kein Schicksal. Sie sind das Ergebnis fehlender Daten — und damit ein lösbares Problem.

7. Methodik-Transparenz

Limitationen der Studie

Stichprobengröße: 150 Unternehmen aus 11 Branchen. Die Ergebnisse sind repräsentativ für den österreichischen Mittelstand, können jedoch nicht ohne Weiteres auf andere Regionen oder Unternehmensgrößen übertragen werden.
Zeitpunktbezogen: Die Studie bildet den Stand von März/April 2026 ab. ChatGPT wird laufend aktualisiert; Ergebnisse können sich verändern.
Ein KI-Modell: Getestet wurde ausschließlich ChatGPT. Andere Modelle (Gemini, Perplexity, Claude) können abweichende Ergebnisse liefern.
Prompt-Varianz: Minimale Änderungen in der Fragestellung können andere Ergebnisse produzieren. Wir haben die Prompts standardisiert, aber nicht alle möglichen Formulierungen getestet.
Verifizierung: Die Faktenprüfung erfolgte anhand öffentlich zugänglicher Quellen (Firmenbuch, Websites, WKO, Creditreform). In Einzelfällen können Daten veraltet oder unvollständig sein.

Reproduzierbarkeit

Die verwendeten Prompt-Formate sind in dieser Studie dokumentiert. Die Ergebnisse lassen sich mit aktuellen ChatGPT-Versionen nachvollziehen.

8. Über diese Studie

Durchführung: maxonline® Marketing hfw GmbH, Leiben (Niederösterreich)
Studienzeitraum: März – April 2026
Verantwortlich: Harald Fischl, Geschäftsführer
Methodik: Empirische Erhebung mit standardisierten Prompts in ChatGPT
Stichprobe: 150 Unternehmen, 11 Branchen, über 450 Einzelprompts

maxonline® ist eine auf SEO und GEO (Generative Engine Optimization) spezialisierte Agentur im DACH-Raum. Die Studie entstand aus der täglichen Beratungspraxis: Immer mehr Kunden fragen, warum sie in ChatGPT nicht vorkommen — oder warum dort falsche Informationen über ihr Unternehmen stehen.

KI-Halluzination Studie 2026: Wie ChatGPT über den österreichischen Mittelstand berichtet

1. Ausgangslage und Forschungsfrage

Forschungsfragen der KI-Halluzination Studie

2. Studiendesign

2.1 Stichprobe

2.2 Testumgebung

2.3 Drei standardisierte Prompts pro Unternehmen

3. Ergebnisse

3.1 Sichtbarkeit: 56 % unsichtbar

Sichtbarkeitsfaktoren — Was ChatGPT-Empfehlungen begünstigt

3.2 Korrektheit: 96 % falsche Geschäftsführer

Die CEO KI-Halluzination — das zentrale Ergebnis

3.3 Darstellung: Arbeitgeberbewertungen prägen das KI-Image

Negative Darstellungen basieren fast ausschließlich auf Arbeitgeberbewertungen

Der Bewertungs-Blindspot

4. Zusammenfassung der Ergebnisse

5. Die 10 Kernerkenntnisse

1. ChatGPT liefert bei konkreten Faktenfragen massiv falsche Informationen.

2. ChatGPT erfindet den Chef — in 96 % der Fälle.

3. Jedes zweite Unternehmen ist für ChatGPT unsichtbar.

4. Nische allein reicht nicht — digitale Präsenz entscheidet.

5. Arbeitgeberbewertungen dominieren das negative KI-Image.

6. Fehlende Bewertungen = KI-Blindspot.

7. Klassische SEO-Signale beeinflussen die KI-Sichtbarkeit.

8. Sprechende Domains verstärken die KI-Zuordnung.

9. B2B-Großhändler sind strukturell unsichtbar.

10. Je „fast bekannter“ die Firma, desto gefährlicher die Halluzination.

6. Fazit: Halluzinationen sind vermeidbar

Strukturierte Daten als Schutzschild

7. Methodik-Transparenz

Limitationen der Studie

Reproduzierbarkeit

8. Über diese Studie

Kostenloses SEO & GEO Strategie-Gespräch.

KI-Halluzination Studie 2026: Wie ChatGPT über den österreichischen Mittelstand berichtet

1. Ausgangslage und Forschungsfrage

Forschungsfragen der KI-Halluzination Studie

2. Studiendesign

2.1 Stichprobe

2.2 Testumgebung

2.3 Drei standardisierte Prompts pro Unternehmen

3. Ergebnisse

3.1 Sichtbarkeit: 56 % unsichtbar

Sichtbarkeitsfaktoren — Was ChatGPT-Empfehlungen begünstigt

3.2 Korrektheit: 96 % falsche Geschäftsführer

Die CEO KI-Halluzination — das zentrale Ergebnis

3.3 Darstellung: Arbeitgeberbewertungen prägen das KI-Image

Negative Darstellungen basieren fast ausschließlich auf Arbeitgeberbewertungen

Der Bewertungs-Blindspot

4. Zusammenfassung der Ergebnisse

5. Die 10 Kernerkenntnisse

1. ChatGPT liefert bei konkreten Faktenfragen massiv falsche Informationen.

2. ChatGPT erfindet den Chef — in 96 % der Fälle.

3. Jedes zweite Unternehmen ist für ChatGPT unsichtbar.

4. Nische allein reicht nicht — digitale Präsenz entscheidet.

5. Arbeitgeberbewertungen dominieren das negative KI-Image.

6. Fehlende Bewertungen = KI-Blindspot.

7. Klassische SEO-Signale beeinflussen die KI-Sichtbarkeit.

8. Sprechende Domains verstärken die KI-Zuordnung.

9. B2B-Großhändler sind strukturell unsichtbar.

10. Je „fast bekannter“ die Firma, desto gefährlicher die Halluzination.

6. Fazit: Halluzinationen sind vermeidbar

Strukturierte Daten als Schutzschild

7. Methodik-Transparenz

Limitationen der Studie

Reproduzierbarkeit

8. Über diese Studie

Nichts mehr verpassen.

Kostenloses SEO & GEO Strategie-Gespräch.