KI-Halluzination Studie 2026: Wie ChatGPT über den österreichischen Mittelstand berichtet

Letzte Aktualisierung: April 7, 2026
Harald Fischl
-
Lesedauer: 8 min
Inhalt

Eine empirische Untersuchung von maxonline® Marketing hfw GmbH Studienzeitraum: März – April 2026

Studien-Zusammenfassung
Wir haben 150 mittelständische Unternehmen aus dem DACH-Raum (Schwerpunkt Österreich) in ChatGPT systematisch getestet — mit über 450 standardisierten Prompts. Das Ergebnis ist alarmierend:

  • 56 % der Unternehmen sind für ChatGPT unsichtbar — sie werden bei branchenspezifischen Empfehlungsfragen nicht genannt
  • 96 % der genannten Geschäftsführer sind frei erfunden — ChatGPT erfindet systematisch Namen von Führungspersonen
  • 78 % der genannten Gründungsjahre sind falsch — mit Abweichungen von bis zu 162 Jahren
  • Nur 3 % der getesteten Unternehmen wurden vollständig korrekt dargestellt
  • 97 % aller negativen KI-Darstellungen basieren auf Arbeitgeberbewertungsportalen

Bei rund 68 Unternehmen erfindet ChatGPT aktiv falsche Informationen. Bei weiteren 56 verweigert es jede konkrete Aussage. Und nur bei 4 Unternehmen stimmen alle Fakten.

1. Ausgangslage und Forschungsfrage

Immer mehr Konsumenten, Einkäufer und Entscheider nutzen KI-Chatbots wie ChatGPT als erste Informationsquelle — auch für Unternehmensrecherchen, Anbietervergleiche und Kaufentscheidungen.
Doch wie zuverlässig ist ChatGPT, wenn es um konkrete Unternehmensinformationen im DACH-Mittelstand geht?

Forschungsfragen der KI-Halluzination Studie

  1. Sichtbarkeit: Werden mittelständische Unternehmen bei branchenspezifischen Empfehlungsfragen von ChatGPT genannt?
  2. Korrektheit: Stimmen die Fakten, die ChatGPT über diese Unternehmen liefert — insbesondere Gründungsjahr, Geschäftsführung, Mitarbeiterzahl und Auszeichnungen?
  3. Darstellung: Ist das Gesamtbild, das ChatGPT zeichnet, positiv, negativ oder neutral — und auf welchen Quellen basiert es?

2. Studiendesign

2.1 Stichprobe

  • 150 Unternehmen aus dem DACH-Raum (Schwerpunkt Österreich, ergänzt um ausgewählte Unternehmen aus Deutschland und der Schweiz)
  • 11 Branchen: Tourismus & Gastronomie, Handel, IT & Dienstleistung, Produktion & Industrie, Recht & Steuerberatung, Transport & Logistik, Handwerk & Bau, Gesundheit & Pflege, Immobilien & Hausverwaltung
  • Unternehmensgröße: Mittelstand mit geschätztem Jahresumsatz zwischen 5 und 50 Millionen Euro
  • Auswahlkriterium: Bewusste Mischung aus Nischenplayern, regionalen Champions und größeren Unternehmen, um ein realistisches Bild des Mittelstands abzubilden

2.2 Testumgebung

  • KI-Modell: ChatGPT (aktuelles Modell zum Testzeitpunkt, mit aktiviertem Web-Browsing)
  • Methodik: Jeder Prompt wurde im Inkognitomodus des Browsers und ohne eingeloggten ChatGPT-Account in einem neuen, separaten Chat eingegeben, um Personalisierung und Kontextübertragung zwischen Tests auszuschließen
  • Dokumentation: Jede ChatGPT-Antwort wurde vollständig dokumentiert und gegen verifizierte Quellen geprüft (Firmenbuch, Unternehmenswebsites, WKO, Creditreform, Wikipedia)

2.3 Drei standardisierte Prompts pro Unternehmen

Jedes Unternehmen wurde mit drei Prompts getestet:


Prompt 1 — Sichtbarkeit (Empfehlungsfrage)
Branchenspezifische Frage, die eine Empfehlung provoziert. Beispiele:

  • „Welchen Fertighaushersteller in Österreich würdest du mir empfehlen?“
  • „Welches Wellnesshotel im Burgenland kannst du empfehlen?“
  • „Welche SEO-Agentur in Wien ist empfehlenswert?“

Prompt 2 — Korrektheit (Faktenfragen)
Branchenspezifische Faktenfragen, die überprüfbare Angaben zu Gründungsjahr, Geschäftsführung, Unternehmensgröße und Auszeichnungen abfragen. Beispiele:

  • Hotels: „Wie viele Zimmer hat [Hotel], wann wurde es eröffnet, wer führt es und welche Auszeichnungen hat es erhalten?“
  • Industrie/Konzern: „Wer ist der aktuelle CEO von [Firma], wann wurde das Unternehmen gegründet, wie viele Mitarbeiter hat es und welche Auszeichnungen hat es erhalten?“
  • Handel/Handwerk: „Seit wann gibt es [Firma], wer ist der Geschäftsführer, wie viele Mitarbeiter hat das Unternehmen und welche Zertifizierungen hat es?“
  • Juwelier: „Seit wann gibt es [Firma], wer führt das Unternehmen, welche Luxusmarken werden geführt und welche Auszeichnungen hat es erhalten?“

Die Prompts orientieren sich an typischen Fragen, die ein potenzieller Kunde, Geschäftspartner oder Journalist an ChatGPT stellen würde.


Prompt 3 — Darstellung (Reputationsfrage)
Standardisierte Frage nach der öffentlichen Wahrnehmung:

  • „Welche Erfahrungen oder Bewertungen findest du zu [Firma]?“

3. Ergebnisse

3.1 Sichtbarkeit: 56 % unsichtbar

Ergebnis Anzahl Anteil
Sichtbar (ja) 57 38 %
Teilweise sichtbar 9 6 %
Unsichtbar (nein) 84 56 %

Mehr als jedes zweite getestete Unternehmen wird von ChatGPT bei branchenspezifischen Empfehlungsfragen nicht genannt.

ChatGPT Sichtbarkeit von mittelständischen Unternehmen bei KI-Empfehlungen. Quelle: maxonline

ChatGPT Sichtbarkeit von mittelständischen Unternehmen bei KI-Empfehlungen. Quelle: maxonline

Sichtbarkeit nach Branche

Branche Unternehmen Sichtbar Quote
Gesundheit & Pflege 8 7 88 %
Tourismus & Gastronomie 26 14 54 %
Handwerk & Bau 14 7 50 %
Produktion & Industrie 22 9 43 %
Recht & Steuerberatung 12 5 38 %
Handel 24 6 25 %
Transport & Logistik 14 4 29 %
IT & Dienstleistung 24 5 21 %
Immobilien 6 0 0 %
KI-Sichtbarkeit im DACH-Mittelstand nach Branche. Quelle: maxonline

KI-Sichtbarkeit im DACH-Mittelstand nach Branche. Quelle: maxonline

Sichtbarkeitsfaktoren — Was ChatGPT-Empfehlungen begünstigt

Aus den Daten lassen sich klare Muster ableiten:

  • Nische + digitale Präsenz = Sichtbarkeit. Unternehmen mit klar definierter Nische UND starker Online-Präsenz (Reviews, Landingpages, strukturierte Daten) werden bevorzugt empfohlen.
  • Nische allein reicht nicht. Mehrere hochspezialisierte Unternehmen ohne digitale Signale blieben unsichtbar.
  • B2B-Großhändler sind systematisch unsichtbar. Regionale Großhändler (Elektro, Holz) werden von Konzernen mit Wikipedia-Präsenz oder starken Websites dominiert.
  • Prompt-Spezifität wirkt. Bei Hotels zeigte sich: Je spezifischer die Region im Prompt (z.B. „Montafon“ statt „Vorarlberg“), desto eher wurde ein Nischenanbieter empfohlen.
  • Nischen-Domains verstärken KI-Markenbildung. Unternehmen mit sprechenden Domains (z.B. branchenspezifische .at-Domains) wurden häufiger empfohlen.

3.2 Korrektheit: 96 % falsche Geschäftsführer

Bei branchenspezifischen Faktenfragen (Gründungsjahr, Geschäftsführung, Mitarbeiterzahl, Auszeichnungen) zeigt sich ein alarmierendes Bild:

Ergebnis Anzahl (von 150) Anteil
Halluzination (konkret falsche Fakten) 68 45 %
Verweigerung (keine konkreten Fakten) 56 37 %
Teilweise korrekt 22 15 %
Vollständig korrekt 4 3 %
KI Halluzination: Korrektheit bei Faktenfragen. Quelle: maxonline

KI Halluzination: Korrektheit bei Faktenfragen. Quelle: maxonline

Nur 4 von 150 Unternehmen erhielten vier von vier korrekte Faktenpunkte.

Halluzinationsraten nach Faktenkategorie

Faktenpunkt Falsch (wenn konkret beantwortet)
Geschäftsführer / CEO 96 %
Gründungsjahr 78 %
Mitarbeiterzahl 68 %
Auszeichnungen / Awards 58 %
KI Halluzinationen: Fehler nach Faktenkategorie. Quelle: maxonline

KI Halluzinationen: Fehler nach Faktenkategorie. Quelle: maxonline

Die CEO KI-Halluzination — das zentrale Ergebnis

In jedem einzelnen Fall, in dem ChatGPT einen konkreten Namen für den Geschäftsführer oder CEO nannte, war dieser frei erfunden. Die KI generiert plausibel klingende, aber vollständig fiktive Personennamen.

Beispielhafte Fehler (anonymisiert):

  • Ein Fertighaushersteller, gegründet 1897, erhielt von ChatGPT das Gründungsjahr 1980 — 83 Jahre daneben. Der genannte Geschäftsführer war eine Kombination aus dem Firmennamen und einem erfundenen Vornamen.
  • Ein Traditionsunternehmen seit 1802 (über 220 Jahre) wurde auf 1964 datiert — 162 Jahre Abweichung. Sämtliche genannten Luxusmarken waren falsch; die wichtigste Partnermarke (seit 70 Jahren) wurde nicht erwähnt.
  • Ein international bekanntes 5-Sterne-Luxushotel erhielt einen erfundenen General Manager und seine drei Michelin-Sterne wurden verschwiegen — obwohl explizit nach Michelin gefragt wurde.
  • Ein börsennotierter Konzern mit Wikipedia-Eintrag erhielt einen komplett erfundenen CEO-Namen.

Halluzinationsmuster nach Firmentyp

Firmentyp Typisches ChatGPT-Verhalten
Kleinstunternehmen (e.U., GbR, Einzelpraxis) Verweigerung — keine konkreten Fakten
Familienhotels und -betriebe Halluzination — erfindet Familiennamen
Mittelständische B2B-Firmen Halluzination — erfindet GF + falsches Gründungsjahr
Konzerne mit Wikipedia GF erfunden, Gründung und Mitarbeiter ~korrekt

Spannendes Ergebnis: Je „fast bekannter“ ein Unternehmen für ChatGPT ist, desto eher halluziniert es. Völlig unbekannte Firmen erhalten eine ehrliche Verweigerung. Firmen mit teilweisem Wissen erhalten die gefährlichsten Antworten: selbstbewusst vorgetragene Falschinformationen.

3.3 Darstellung: Arbeitgeberbewertungen prägen das KI-Image

Ergebnis Anzahl Anteil
Positiv 98 65 %
Negativ 21 14 %
Keine Angaben 31 21 %
KI-Sentiment: Darstellung von DACH Mittelstand-Unternehmen in KI-Antworten. Quelle: maxonline

KI-Sentiment: Darstellung von DACH Mittelstand-Unternehmen in KI-Antworten. Quelle: maxonline

Negative Darstellungen basieren fast ausschließlich auf Arbeitgeberbewertungen

Von 21 Unternehmen mit negativer Darstellung basierten 20 auf Arbeitgeberbewertungsportalen. Kundenbewertungen, Presseberichte oder andere Quellen spielten für negative KI-Darstellungen nahezu keine Rolle.

Erkenntnis: Arbeitgeberbewertungsportale haben einen überproportionalen Einfluss auf das KI-Image von Unternehmen. Schon wenige negative Einträge können das Gesamtbild kippen — selbst wenn die Kundenbewertungen durchweg positiv sind.

Der Bewertungs-Blindspot

31 Unternehmen (21 %) erhielten die Bewertung „keine Angaben“ — ChatGPT konnte weder positive noch negative Erfahrungsberichte finden. Diese Unternehmen haben typischerweise:

  • Keine Google Reviews
  • Keine Bewertungen auf Branchenportalen
  • Keine Presseerwähnungen oder Testberichte
Erkenntnis: Fehlende Online-Bewertungen bedeuten nicht Neutralität, sondern Unsichtbarkeit. Für ChatGPT existieren diese Unternehmen in der öffentlichen Wahrnehmung schlicht nicht.

4. Zusammenfassung der Ergebnisse

Dimension Ergebnis
Unsichtbar bei Empfehlungen 52 % (78 von 150)
Halluzination bei Faktenfragen 45 % (68 von 150)
Verweigerung bei Faktenfragen 37 % (56 von 150)
Vollständig korrekt 3 % (4 von 150)
GF/CEO erfunden (wenn konkret genannt) 96 %
Gründungsjahr falsch (wenn konkret genannt) 78 %
Mitarbeiterzahl falsch (wenn konkret genannt) 68 %
Awards erfunden (wenn konkret genannt) 58 %
Negative Darstellung durch Arbeitgeberbewertungen 97 % aller negativen Fälle

5. Die 10 Kernerkenntnisse

1. ChatGPT liefert bei konkreten Faktenfragen massiv falsche Informationen.

Bei Fragen nach Gründungsjahr, Geschäftsführung, Mitarbeiterzahl und Auszeichnungen erfindet ChatGPT systematisch Informationen — in 45 % der Fälle mit konkret falschen Fakten, in weiteren 37 % mit einer Verweigerung jeder konkreten Aussage.

2. ChatGPT erfindet den Chef — in 96 % der Fälle.

Wenn ChatGPT einen konkreten Namen für den Geschäftsführer oder CEO nennt, ist dieser mit überwältigender Wahrscheinlichkeit frei erfunden. Die KI generiert plausibel klingende, aber fiktive Personennamen.

3. Jedes zweite Unternehmen ist für ChatGPT unsichtbar.

56 % der getesteten Unternehmen werden bei branchenspezifischen Empfehlungsfragen nicht erwähnt — unabhängig von Qualität, Tradition oder Marktposition.

4. Nische allein reicht nicht — digitale Präsenz entscheidet.

Unternehmen mit klar definierter Nische UND starker Online-Präsenz (Bewertungen, Landingpages, strukturierte Daten) werden bevorzugt empfohlen. Nischenposition ohne digitale Signale führt zu Unsichtbarkeit.

5. Arbeitgeberbewertungen dominieren das negative KI-Image.

97 % aller negativen Darstellungen in der Studie gehen auf Arbeitgeberbewertungsportale zurück. Kundenbewertungen oder Presseberichte spielen für negative KI-Darstellungen kaum eine Rolle.

6. Fehlende Bewertungen = KI-Blindspot.

Unternehmen ohne Online-Bewertungen existieren für ChatGPT in der öffentlichen Wahrnehmung nicht. Weder positiv noch negativ — sie sind schlicht unsichtbar.

7. Klassische SEO-Signale beeinflussen die KI-Sichtbarkeit.

Unternehmen mit gezielten Landingpages und einer kritischen Masse an Bewertungen wurden deutlich häufiger empfohlen. Es besteht ein klarer Zusammenhang zwischen klassischer Suchmaschinenoptimierung und KI-Empfehlungen.

8. Sprechende Domains verstärken die KI-Zuordnung.

Unternehmen mit branchenspezifischen Domains wurden häufiger korrekt zugeordnet und empfohlen als solche mit generischen oder vom Firmennamen abweichenden Domains.

9. B2B-Großhändler sind strukturell unsichtbar.

Regionale B2B-Unternehmen ohne Endkunden-Reviews und ohne Presse-/Wikipedia-Präsenz werden systematisch von Konzernen überstrahlt. Dies ist kein individuelles, sondern ein strukturelles Problem.

10. Je „fast bekannter“ die Firma, desto gefährlicher die Halluzination.

Völlig unbekannte Unternehmen erhalten ehrliche Verweigerungen. Unternehmen mit teilweisem KI-Wissen erhalten die gefährlichsten Antworten: selbstbewusst präsentierte Falschinformationen, die auf den ersten Blick korrekt wirken.

6. Fazit: Halluzinationen sind vermeidbar

Die Ergebnisse dieser Studie zeigen ein klares Muster: ChatGPT halluziniert dort am stärksten, wo verlässliche, strukturierte Unternehmensdaten fehlen. Wo die KI keine belastbaren Quellen findet, füllt sie die Lücken mit plausibel klingenden, aber frei erfundenen Informationen.

Das bedeutet im Umkehrschluss: Unternehmen, die ihre Kerndaten — Gründungsjahr, Geschäftsführung, Standorte, Mitarbeiterzahl, Zertifizierungen — aktiv und konsistent auf der eigenen Website platzieren, reduzieren das Halluzinationsrisiko erheblich.

Strukturierte Daten als Schutzschild

Besonders wirksam ist die Hinterlegung dieser Informationen in strukturierten Daten (Schema.org). Strukturierte Daten sind maschinenlesbare Auszeichnungen im Quellcode einer Website, die Suchmaschinen und KI-Modellen eine eindeutige Zuordnung ermöglichen. Sie liefern der KI genau die Fakten, die sie sonst halluzinieren würde.

Konkret empfiehlt sich die strukturierte Auszeichnung von:

  • Organization-Markup: Firmenname, Gründungsjahr, Standort, Logo, Kontaktdaten
  • Person-Markup: Geschäftsführung mit Name, Rolle und Zugehörigkeit
  • Product/Service-Markup: Leistungen, Marken, Zertifizierungen
  • Review-Markup: Bewertungen und Auszeichnungen mit verifizierbaren Quellen

Unternehmen, die ihre digitale Präsenz mit korrekten, strukturierten Daten untermauern, schaffen damit eine verlässliche Informationsbasis — nicht nur für klassische Suchmaschinen, sondern zunehmend auch für KI-Modelle. Die Halluzinationsrate lässt sich so aktiv und messbar senken.

Die zentrale Erkenntnis dieser Studie lautet daher: KI-Halluzinationen sind kein Schicksal. Sie sind das Ergebnis fehlender Daten — und damit ein lösbares Problem.

7. Methodik-Transparenz

Limitationen der Studie

  • Stichprobengröße: 150 Unternehmen aus 11 Branchen. Die Ergebnisse sind repräsentativ für den österreichischen Mittelstand, können jedoch nicht ohne Weiteres auf andere Regionen oder Unternehmensgrößen übertragen werden.
  • Zeitpunktbezogen: Die Studie bildet den Stand von März/April 2026 ab. ChatGPT wird laufend aktualisiert; Ergebnisse können sich verändern.
  • Ein KI-Modell: Getestet wurde ausschließlich ChatGPT. Andere Modelle (Gemini, Perplexity, Claude) können abweichende Ergebnisse liefern.
  • Prompt-Varianz: Minimale Änderungen in der Fragestellung können andere Ergebnisse produzieren. Wir haben die Prompts standardisiert, aber nicht alle möglichen Formulierungen getestet.
  • Verifizierung: Die Faktenprüfung erfolgte anhand öffentlich zugänglicher Quellen (Firmenbuch, Websites, WKO, Creditreform). In Einzelfällen können Daten veraltet oder unvollständig sein.

Reproduzierbarkeit

Die verwendeten Prompt-Formate sind in dieser Studie dokumentiert. Die Ergebnisse lassen sich mit aktuellen ChatGPT-Versionen nachvollziehen.

8. Über diese Studie

Durchführung: maxonline® Marketing hfw GmbH, Leiben (Niederösterreich)
Studienzeitraum: März – April 2026
Verantwortlich: Harald Fischl, Geschäftsführer
Methodik: Empirische Erhebung mit standardisierten Prompts in ChatGPT
Stichprobe: 150 Unternehmen, 11 Branchen, über 450 Einzelprompts

maxonline® ist eine auf SEO und GEO (Generative Engine Optimization) spezialisierte Agentur im DACH-Raum. Die Studie entstand aus der täglichen Beratungspraxis: Immer mehr Kunden fragen, warum sie in ChatGPT nicht vorkommen — oder warum dort falsche Informationen über ihr Unternehmen stehen.


© 2026 maxonline® Marketing hfw GmbH. Alle Rechte vorbehalten. Zitate und Verweise auf diese Studie sind unter Nennung der Quelle gestattet.

Nichts mehr verpassen.

Mit unserem Newsletter halten wir dich rund um SEO, GEO und KI-Sichtbarkeit immer auf dem Laufenden. Melde dich jetzt kostenlos an und verpasse nichts mehr.
Harald Fischl
Head of SEO & GEO, Geschäftsführender Gesellschafter bei maxonline. Ich beschäftige mich täglich mit den aktuellen News und Trends aus der SEO-Welt und entwickle Strategien, die unsere Kunden wirklich nach vorne bringen.

Kostenloses SEO & GEO Strategie-Gespräch.

Ob Google, ChatGPT oder Claude – wir bringen dein Unternehmen dorthin, wo es gefunden wird. Buche dir jetzt ein kostenloses Strategie-Gespräch und entdecke dein volles Online-Potenzial.

maxonline® Marketing hfw GesmbH

Coronablick 7A
3652 Leiben, Österreich
office@max-online.at

maxonline® ist eine spezialisierte SEO- und GEO-Agentur (Generative Engine Optimization) aus der DACH-Region mit Sitz in Leiben, Österreich. Die Agentur optimiert mittelständische B2B- und B2C-Unternehmen für Google sowie für KI-basierte Antwortsysteme wie ChatGPT und Gemini.

Kostenlosen Beratungstermin mit Harald Fischl buchen.