Persönlichkeitstests: Aus der Mottenkiste der Diagnostik

unsplash Koushik Roy

DISG, MBTI, Insights MDI und Persolog sind bei der Personalauswahl und Personalentwicklung noch immer weit verbreitet. Dabei ist längst bewiesen, dass sie unwissenschaftlich und daher untauglich sind.

Ob im Spiegel, in der Welt oder in HR-Magazinen – selbst renommierte Medien veröffentlichen immer wieder Artikel über die Persönlichkeitstests DISG, MBTI, Insights MDI und Persolog. Dabei ist man dann ein roter, blauer, grüner oder gelber Typ oder kann sich mit Kürzeln wie ISTJ oder ENFJ beschreiben.

Dabei gehören Tests, die Menschen in Typen einteilen, längst in die Mottenkiste der Diagnostik. Schließlich ist der Mensch viel zu komplex, um sich in ein paar Typen einteilen zu lassen. „Kein Mensch forscht heute mehr mit solchen Typen“, sagt Matthias Ziegler, Professor für Psychologische Diagnostik an der Humboldt-Universität zu Berlin.

Längst hat sich das Persönlichkeitsmodell der Big Five durchgesetzt, bei dem sich die Persönlichkeit eines Menschen auf fünf Dimensionen einordnen lässt: Offenheit, Gewissenhaftigkeit, Extraversion, Verträglichkeit und Neurotizismus, wobei letzteres auch oft mit seiner positiven Ausprägung als emotionale Stabilität bezeichnet wird. Die Big Five sind internationaler Standard in Wissenschaft und Forschung. Typentests gelten dagegen als theoretisch veraltet und unwissenschaftlich.

Ihrer Beliebtheit tut das jedoch keinen Abbruch. Ob MBTI (Myers-Briggs-Typenindikator), DISG, Insights MDI, Insights Discovery, Golden Profiler of Personality – typologische Verfahren scheinen beliebter denn je zu sein.

Als weltweit meist eingesetzter Typentest gilt der MBTI. Mehr als 2,5 Millionen Menschen sollen ihn pro Jahr absolvieren. 89 der Fortune-100-Unternehmen, also der umsatzstärksten Unternehmen, sollen ihn einsetzen, aber auch Behörden, Universitäten und Sportteams. Laut MBTI-Website nützte die Hotelkette Marriott das Verfahren für die Mitarbeiterentwicklung.

An der „EY Academy of Business“ des Wirtschaftsprüfers EY half er bei Führungskräfteentwicklung. Das US-Militär identifizierte damit Führungskräfte und das Canadian Police College trainierte so Polizisten, besser mit Stresssituationen umgehen zu können. Auch an etlichen Universitäten, wie der kanadischen University of Alberta oder dem britischen Imperial College in London, setzte man auf den Typentest.

 In Deutschland gilt dagegen der Typentest DISG laut Branchenblatt Training aktuell (4/17) als das am meisten angewendete Persönlichkeitsverfahren. 70 Prozent der Fortune 500 sollen den Test im Personalbereich, Training und Coaching anwenden.

Überholte Grundmodelle

Theoretischen Grundlage des MBTI ist die Persönlichkeitstypologie des Psychoanalytikers Carl Gustav Jung. Erfunden hat ihn Anfang des 20. Jahrhunderts die Hausfrau und Hobbypsychologin Katharine Briggs zusammen mit ihrer Tochter Isabel Myers. Die abenteuerlich-absurde Entstehungsgeschichte des Typenindikators hat die Autorin Merve Emre in ihrem 2018 erschienenen Buch „The Personality Brokers“ beschrieben.

Der MBTI arbeitet mit den vier Präferenzpaaren Extraversion (E) vs. Introversion (I), sensitives Empfinden (S) vs. Intuition (N), Entscheidungen durch Denken (T) oder Fühlen (F), Urteilen (J) vs. Wahrnehmen (P). Daraus ergeben sich dann 16 Persönlichkeitstypen. So steht ISTJ für einen vernünftigen und zuverlässigen Typ mit einem Auge fürs Detail. Ein ENFJ-Typ ist fürsorglich, inspirierend, motivierend und mitfühlend.

Neben dem MBTI basieren auch Insights MDI, Insights Discovery und der Golden Profiler of Personality (GPOP) auf der Typenlehre von C. G. Jung.

Andere Tests berufen sich auf die Typologie des US-Psychologen William Moulton Marston aus dem Jahr 1928. Aus seinen Überlegungen entwickelte der Psychologe John G. Geier den Persönlichkeitstest DISG (englisch DISC) mit den vier Verhaltensdimensionen Dominanz, Initiative, Stetigkeit und Gewissenhaftigkeit.

Geiers Firma war auch Lizenzgeber der deutschen Firma Persolog, die DISG anfangs in Deutschland vermarktete. Nach einem Rechtsstreit verzichtete Persolog auf die Bezeichnung und vermarktet seine Tests heute unter dem Namen Persolog. Basis ist nach wie vor das DISG-Modell. Rechteinhaber und Lizenzgeber der Marke DISG bzw. DiSC (mit kleinem i) ist heute der Wissenschaftsverlag John Wiley & Sons Inc.

Allerdings ist das Grundmodell nicht geschützt. „Jeder kann mit ein paar beliebigen Fragen einen Fragebogen erstellen, der die vier Grundrichtungen beinhaltet“, sagte Karl Kaiblinger von disgprofil.eu in Wien, einem der drei Lizenzgeber im deutschsprachigen Raum. Auf dem DISG-Modell basiert auch die Verhaltens-Profil-Analyse (PPA) von Thomas.

Kritiker bemängeln, dass beide Grundmodelle auf wissenschaftlich ungesicherten Modellen basieren. So heißt es in einer 2013 veröffentlichten Rezension des Testkuratoriums, einer Art Stiftung Warentest für psychologische Testverfahren, zu dem Persolog Persönlichkeits-Profil, es beruhe auf „einem Modell, das – gemessen am aktuellen Stand der Persönlichkeitsforschung – heute von eher wissenschaftshistorischer Bedeutung ist. Dieses Modell ist typologisch; jedoch wird die Validität dieser Typen beziehungsweise deren Messung empirisch nicht abgesichert.“

Dabei sollten psychologische Test stets drei Gütekriterien erfüllen: Objektivität, Validität und Reliabilität. Objektiv ist ein Verfahren dann, wenn die Messung und das Ergebnis unabhängig vom Testleiter und Auswerter sind. Valide ist ein Test, wenn er auch wirklich das misst, was er zu messen vorgibt. Reliabel oder zuverlässig ist ein Test, wenn bei einer Wiederholung dasselbe oder ein ähnliches Ergebnis erzielt wird.

Gerade letzteres ist aber bei Typentests oft nicht der Fall. Bereits 1964 belegten empirische Befunde von Lawrence J. Stricker und John Ross, dass Typisierungen zeitlich nicht stabil sind. Eine 2019 erschienene Arbeit von Jan-Philipp Freudenstein und Kollegen zeigt, dass die Kategorisierung von Personen in Typen auch unter den besten Voraussetzungen (riesige Datensätze und modernste Analyseverfahren) kaum zutreffend ist. „Lediglich 42 Prozent der Testpersonen konnten überhaupt einem Typ zugeordnet werden“, erklärt Co-Autor Professor Ziegler. Erschwerend komme hinzu, dass die Zuordnung lediglich eine Wahrscheinlichkeit von .51 erreichte und damit so zutreffend wie die Vorhersage des Ergebnisses bei einem Münzwurf sei.

Ein Grund dafür ist das Fragebogenformat. Bei ihren Antworten haben die Testpersonen die Auswahl aus jeweils zwei Optionen (Forced Choice), wobei jede eine Persönlichkeitsdimension (beispielsweise Extraversion vs. Introversion) verkörpert. Bei der Auswertung werden die jeweiligen Punkte zusammengezählt und so die Zuordnungen vorgenommen. Wiederholt man den Test und kreuzt bei ein paar Fragen eine andere Antwort an, ist man schnell ein neuer Typ.

2014 kritisierte der Psychologe Todd Essig im US-Magazin Forbes in seinem Artikel „The Mysterious Popularity Of The Meaningless Myers-Briggs“, dass der MBTI laut seriöser Forschung keine größere Reliabilität und Validität habe als das Lesen von Tarotkarten.

Dabei nützt er ein schönes Beispiel. „Stellen Sie sich einen Myers-Briggs Weight Indicator vor, bei dem Sie sich auf die Waage stellen und einem der beiden Typen zugeordnet werden: Übergewichtig oder magersüchtig. Würden Sie das ernst nehmen? Das ist nicht nur nicht valide, das ist auch ziemlich absurd.“ Und genau so absurd sei der MBTI mit seinen vier Paaren gegensätzlicher Präferenzen. Persönlichkeitszüge passten genauso wenig in die Entweder-oder-Struktur des MBTI wie das Gewicht.

Denn die meisten Menschen liegen irgendwo in der Mitte zwischen den beiden Polen. Doch Typentests erfassen keine Ausprägungen. Sie ordnen eine Person jeweils einem Pol zu. Damit ließen sich auch keine Vergleiche zwischen Personen oder mit festgelegten Grenzwerten anstellen, was gerade im Personalbereich oftmals wichtig ist, so Professor Ziegler.

Emotionale Stabilität fehlt

In einem Artikel in Psychology Today im September 2013 kritisierte der renommierte Organisationspsychologe Adam Grant zudem, dass dem MBTI ein wesentliches Kernelement der Persönlichkeit fehle, nämlich die emotionale Stabilität (Neurotizismus), also die Tendenz, auch unter Stress ruhig zu bleiben, und das sei einer der wichtigsten Prädiktoren für Denk-, Gefühls- und Handlungsmuster.

Gerade im Job und in der Personalentwicklung sei es wichtig zu wissen, wie emotional stabil ein Mitarbeiter ist und welche Trainingsangebote er daher brauche, bestätigt Prof.essor Ziegler. Allerdings sei es auch unangenehm, wenn man einer Person im Auswertungsgespräch mitteilen müsse, dass sie emotional weniger stabil ist. Solche eher negativen Rückmeldungen gebe es bei den Typentests nicht. Da sei immer alles positiv.

Das sei auch ein Grund, warum so viele Berater und Trainer mit den Typentests gute Erfahrungen machen. „Das geht einfach und schnell und man tut keinem weh“, so der Psychologe. Dabei wüssten viele durchaus, dass Typentests nicht valide sind, setzen sie aber trotzdem ein.

In der Tat sind psychologische Testverfahren eine komplizierte und komplexe Materie. Da geht es zum Beispiel um Konstruktvalidität oder die Interkorrelationen der Dimensionen. Erstere umfasst die theoretische Klärung, was ein Test überhaupt misst. Letztere zeigen die Zusammenhänge der einzelnen Dimensionen. Sind diese stark, bedeutet das, dass die Abgrenzung eher fließend, vielleicht auch willkürlich ist. Für den Laien ist das nicht oder nur schwer verständlich.

„Gute Verkäufer erreichen in vielen Fällen mehr als gute Validierungsdaten“, resümierte bereits der renommierte Diagnostik-Experte Professor Heinz Schuler. „Nicht die wissenschaftlichen Belege sind ausschlaggebend, sondern das geschickte Marketing.“

Und darin sind die Anbieter der Typentest teils nahezu perfekt. Sie liefern anschaulich aufbereitetes und leicht verständliches Material mit bunten Bildern. Ihre Auswertungsberichte sind gut aufgemacht, tun keinem weh und jeder findet sich dort wieder.

Das liegt auch an dem sogenannten Barnum-Effekt. Die Ergebnisse sind so vage und allgemein („Meist vertrauen Sie auf ihren gesunden Menschenverstand”) oder zweideutig (“Sie sind selten risikobereit, probieren aber gerne Neues“) formuliert, dass sie auf die meisten Menschen zutreffen. Der Begriff geht auf den Zirkusdirektor P. T. Barnum zurück, der damit warb, für jeden etwas im Angebot zu haben.

Der kognitive Fehler ist auch unter dem Begriff Forer-Effekt bekannt. Er beschreibt die Neigung vieler Personen, allgemeingültige positive Aussagen über die eigene Person als zutreffend zu akzeptieren. Diesen Effekt machen sich auch die Verfasser von Horoskopen zunutze. Viele Personalmanager und Journalisten haben noch nie etwas davon gehört und glauben daher, wenn das Testergebnis auf sie selbst zutrifft, muss der Test auch gut sein.

„Diagnostische oder pseudodiagnostische Verfahren, die es verstehen, die Intuition der Kunden anzusprechen, die vertraut wirken und die Komplexität drastisch reduzieren, werden wir nicht aus der Welt schaffen können“, resümierte Professor Schuler.

Das bestätigte auch DiSG-Vertreter Kaiblinger. „Je weniger Informationen, desto mehr Umsetzung.“ Wesentlich sei es, dass die Anwender das Verfahren schnell verstehen.

Aufrüstung mit Studien

Doch nicht nur im Marketing, auch was Informationen zu den Gütekriterien angeht, haben die meisten Testanbieter längst aufgerüstet und bieten Interessenten umfangreiche Studien zur Validität oder Reliabilität, in denen teils sogar Professoren die Testqualität belegen sollen. Das beeindruckt den Laien, auch wenn er nicht abschätzen kann, wie ernst zu nehmen diese Studien sind.

Das sei manchmal wie bei der Zahnpasta-Werbung, sagt Diagnostik-Experte Ziegler. „Da heißt es dann, klinische Studien haben gezeigt und in Wirklichkeit wurde an Gebissen von toten Kühen geforscht.“ Das sei zwar nicht falsch, aber auch nicht aussagekräftig. Und für die „neueste Forschung“ speise man ein paar Datensätze von Kunden ein und schon habe man eine neue Studie. Wie aussagekräftig diese ist, lässt sich oft nicht prüfen, da die Studien nicht öffentlich zugängig sind.

Anwender sollten daher möglichst einen neutralen Experten befragen, wenn sie selbst nicht über ausreichende Kenntnisse verfügen. Eine Checkliste dafür bietet auch der Din-Screen des Diagnostik-Professor Martin Kersting auf seiner Website.

Dass ihre Tests eigentlich nichts taugen, dürfte den meisten Testanbietern durchaus bekannt sein. Aber schließlich lassen sich damit gute Geschäfte machen. Denn um sie anwenden zu dürfen, verlangen die Anbieter in der Regel eine Zertifizierung, die schon mal ein paar tausend Euro kostet. Dazu kommen die Kosten pro eingesetzten Test.

Personalauswahl mit Typen

Eingesetzt werden die Typentests vor allem im Training, Coaching, in der Teamentwicklung und Karriereberatung, aber auch – und da wird es besonders kritisch – in der Personalauswahl. Persolog eigne sich gut für die Personalauswahl, erklärte Verkaufsmitarbeiter Jonathan Selinger. Dafür gebe es verschiedene Produkte, wie etwa einen Fragebogen für den Personaler, in den er die Fähigkeiten eintrage, die er von einem Mitarbeiter erwarte. Dieses Sollprofil könne er dann mit dem Testergebnis des Bewerbers vergleichen.

„DiSG ist klar kein Personalauswahltool“, betonte dagegen Kaiblinger. Allerdings könne ein ergänzender Einsatz sinnvoll sein. „Wenn Sie ein Team zusammensetzen müssen, ist es gut zu wissen, welchen Typ Sie noch brauchen“, so der DiSG-Vertreter. Der ergänzende Einsatz bei der Personalauswahl sei seit Jahren der am stärksten wachsende Bereich.

Beim MBTI heißt es dagegen, dass er nicht für die Bewerberauswahl oder interne Stellenbesetzungen gedacht sei oder dafür, Menschen bestimmte Teams, Rollen oder Funktionen in einer Organisation zuzuweisen. Er erfasse auch keine Fähigkeiten und Kompetenzen oder sei für die Vorhersage der beruflichen Leistung tauglich. Der MBTI beschreibe auch nicht die komplette Persönlichkeit oder Identität. Er schaue auf Persönlichkeitspräferenzen und sei vor allem für das individuelle Wachstum geeignet.

Harald Ackerschott findet das erstaunlich ehrlich. „Wenn man sich das durchliest, fragt man sich, welche Einsatzbereiche eigentlich noch übrigbleiben, sagt der Psychologe, der zu den führenden Experten für psychologische Beurteilung und Eignungsdiagnostik gehört. Nur leider lese das vermutlich keiner. „Das ist letztlich ein projektives Verfahren, um ein Gespräch in Gang zu bringen“, resümiert der Psychologe. „Statt Probleme zu lösen, erfährt man, dass der andere halt anders tickt.“ Typentests arbeiteten mit einer extremen Vereinfachung des Menschen. „Das reicht vielleicht für einen ersten Impuls, hat aber keine Tiefe“, so Ackerschott, „Und genau deshalb sind sie auch so erfolgreich.“

Weitere Literatur

Essig, T : The Mysterious Popularity Of The Meaningless Myers-Briggs (MBTI), verfügbar unter https://www.forbes.com/sites/toddessig/2014/09/29/the-mysterious-popularity-of-the-meaningless-myers-briggs-mbti/, abgerufen am 5. März 2025

Freudenstein JP, Strauch C, Mussel P, Ziegler M.: Four personality types may be neither robust nor exhaustive. Nature Human Behavior. 2019 Oct;3(10):1045-1046. doi: 10.1038/s41562-019-0721-4

Grant, A.: Myers-Briggs Goodbye to MBTI, the Fad That Won’t Die, verfügbar unter https://www.psychologytoday.com/us/blog/give-and-take/201309/goodbye-mbti-the-fad-won-t-die, abgerufen am  5. März 2025

Kersting, M.: Beurteilung der Qualität von Tests und Fragebogen, verfügbar unter http://kersting-internet.de/qualitaetssicherung/testbeurteilung/, abgerufen am 5. März 2025

König, C.J.; Marcus, B.:TBS-TK Rezension: Persolog Persönlichkeits-Profil, verfügbar unter https://www.bdp-verband.de/fileadmin/user_upload/BDP/website/dokumente/PDF/Profession/Testrezensionen/L-P/ppp.pdf, abgerufen 5. März 2025

MBTI Facts. Answering your questions about the Myers-Briggs Type Indicator, verfügbar unter https://www.themyersbriggs.com/en-US/Support/MBTI-Facts, abgerufen am 5. März 2025

MBTI Manual Supplements Series for the Global Step I and Step II Assessments, verfügbar unter https://www.themyersbriggs.com/en-US/Products-and-Services/MBTI-Manual-Supplements, abgerufen am 5. März 2025

Schaper S.: Persönlichkeitstest von Stefanie Stahl: Die passende Gebrauchsanweisung für jeden Persönlichkeitstyp, verfügbar unter https://www.spiegel.de/psychologie/persoenlichkeitstest-von-stefanie-stahl-die-passende-gebrauchsanweisung-fuer-jeden-typ-a-d27056d7-af1c-41bc-a24e-9a3cd5e5af44, abgerufen am 5. März 2025

Stahl S.: Warum wir unsere Persönlichkeit besser kennen sollten, verfügbar unter https://www.thepioneer.de/originals/der-achte-tag/podcasts/175-stefanie-stahl-warum-wir-unsere-persoenlichkeit-besser-kennen-sollten, abgerufen am 5. März 2025

Der Artikel ist eine aktuelle Version des Artikels im Skeptiker 2/2021.

Bärbel Schwertfeger Bild

Bärbel Schwertfeger ist Diplom-Psychologin, seit 1985 freie Journalistin und Chefredakteurin von WIRTSCHAFTSPSYCHOLOGIE HEUTE.

Diskutieren Sie mit