Ich schreib jetzt mal wieder was fürchterlich Langweiliges. Wenn man im Fachbereich Qualitässicherung bewegt, dann ist das Basiswissen, und auch dort ein eher ungeliebtes Thema.
Schlupf bei Prüfungen durch Menschen
Dabei werden hauptsächlich vier Faktoren betrachtet:
Art der Prüfung
Dabei wird grundsätzlich zwischen quantitativen Prüfungen und qualitativen Prüfungen entschieden.
Quantitativ bedeutet, es gibt eine Messgrösse und festgelegte Grenzen. Man kann formulieren, dass der Messwert zwischen Minimum und Maximum liegen muss, sonst schlecht. Dabei unterscheidet man dann noch zwischen lehrende Prüfungen, die einfach >Ja< oder >Nein< liefern. Der Name kommt von der mechanischen Lehre, die die Grenzen verkörpert. Gut-Dorn passt, Ausschuss-Dorn passt nicht, dann o.k. Und die messende Prüfung, bei der man selber Zahlen vergleichen muss. Wenn der Gang auf der Zeitwaage weniger als 10 Sekunden vom Mittelwert abweicht, dann ist die Uhr o.k.
Qualitativ bedeutet, dass es Ermessensspielräume gibt, es also eine Gefühlssache ist, was <noch gut< und was <schon schlecht< ist. Kratzerfreiheit ist da ein ganz heftiges Extrem. Nichts ist ohne Kratzer. Die Frage ist nur >wie gross?< und >wie viele?<. Selbst wenn man es versucht zu messen: Man misst 0,3 µm und es sieht sch**** aus, das mit 0,7µm (= tiefere Riefen) aber gut
Umfang der Prüfung
Selbst die Lehrenprüfung hat schon den Umfang 2 Merkmale, weil man Gut~ und Ausschussseite betrachten muss. Ein Würfel hat 6 Seiten, 8 Ecken, 12 Kanten, Soll man den kontrollieren, also 26 Merkmale. Bei der Endprüfung eines etwas komplexeren Gegenstandes explodiert die Anzahl Merkmale. Bei der Aussenseite der Karosserie eines Autos wird die Liste mehrere DIN A 4 Seiten lang.
Häufigkeit der Mängel
Ein Kriterium, das oft vergessen wird: Wie oft kommt ein Mangel überhaupt vor? Bei Aschenbrödel mussten die Guten ins Töpfchen und die Schlechten ins Kröpfchen. Das Funktionier, solange die tauben überhaupt noch was essen könne. Irgendwann sind die nicht nur satt, sondern einfach voll. Aber es waren offensichtlich immerhin so viel Schlechte dabei, dass mehrere Tauben satt wurden.
Der Prüfer
Ein ganz heikles Thema. Muss man Prüfungen oft machen, in Serie, dann ermüden Menschen. Wie schnell das geht ist sehr individuell unterschiedlich. Hängt auch von der Tagesform ab, aber noch mehr eine Veranlagungssache. Bei schwierigen Sachen geht oft nicht mehr als 1½ bis 2 Stunden pro Arbeitstag, vielleicht noch einmal 2 h vormittags und dann was anders und dann später noch 2 h nachmittags. Nachtschicht ist immer Sch****! Ziemlich krass, aber so ist es halt: je intellektueller ein Mensch ist, desto weniger kommt er mit der Stupidität einer Serienprüfung zurecht. Sein Gehirn ist unterfordert und beginnt wegzudämmern oder zu träumen.
Aus der Zusammenfassung dieser vier Faktoren entsteht ein Schlupf. Schlupf wird in Prozenten angeben: Wie viele von 100 Fehlern werden nicht erkannt?
- Quantitative Fehler werden mit einem geringeren Schlupf erkannt als qualitative.
- Lehrende Prüfungen haben einen geringeren Schlupf als messende.
- Mehr Merkmale pro Prüfung sind günstiger als ein einziges (weil weniger stupide)
- Bei mehr als 5 Merkmalsarten pro Prüfung brauchen normale Menschen eine Unterstützung (eine Checkliste o.ä.)
- Je seltener ein Fehler ist, desto höher wird der Schlupf.
Am meisten tut der letzte Punkt weh. Fehler, die nicht wenigstens einmal pro Woche vorkommen sind grausam, in doppelter Hinsicht. Dem Prüfer fehlt ein Erfolgserlebnis, er denkt sich >wofür mach ich das überhaupt?<, das demotiviert. Der Anblick der Gut Situation brennt sich so in das Hirn ein, das er ihn auch dann noch sieht, wenn er gar nicht mehr da ist.
Der Schlupf kann dann leicht bis zu 10% betragen, wenns ganz dumm läuft und noch ein paar andere negative Faktoren mitspielen sogar noch mehr. Wenn eine nennenswerte Fehlerrate vorliegt, also er immer mal wieder auftritt, dann rechnet man bei einfachen Prüfungen mit unter 1% Schlupf. Auch wenn es ein hinreichend komplexe Prüfung ist, die Endabnahme einer Armbanduhr gehört da sicherlich dazu, dann muss man die 1% nicht pro Merkmal ansetzen, sondern darf hier einen besseren Wert voraussetzen. Kommt also bei z.B. 20 Merkmalen nicht auf 20%, sondern eher auf deutlich unter 10% Schlupf. 5 % wären ja 0,25% 250 ppm bei 20 Merkmalen. 0,1% = 100 ppm gilt als Grenze, die man mit Menschen nicht unterschreiten kann (Savants mal ausgenommen, aber die findet man nicht so oft).
Ein weiteres Problem neben dem Schlupf (Statistiker nenne das Fehler 1. Ordnung) sind die Fehler 2. Ordnung. Prüfer sortieren Teile als fehlerhaft aus, obwohl sie gut sind. Kommt auch vor, nicht so oft wie Fehler erster Ordnung. Auch hier wieder das Problem der seltenen Fehler. Nehmen wir mal als Beispiel an, einer von 200 wäre schlecht, 0,5%. Und er prüft 10000 Stück. , also sollte er 50 schlecht finden. 2% Schlupf bedeutet, das ihm einer davon durch die Lappen geht. Ein Fehler 2. Ordnung von 100 ppm = 0,1% bedeute das er 10 Gute aussortiert. In der Fehlerkiste liegen also 59 Stück, davon sind 10 gut und 49 schlecht. Das ist ein nicht zu vernachlässigender Kostenfaktor, der oft dazu führt, dass der Schlupf leider ansteigt, um Fehler 2. Ordnung zu vermeiden. Die Fehler 2. Ordnung sieht man unmittelbar, die Fehler 1. Ordnung erst viel später und ganz wo anders.
Es ist falsch davon auszugehen, wenn man einen Fehler auffindet, dass keine Prüfung stattgefunden hat. Wo Menschen arbeiten, da passieren Fehler. Die kann man nicht zu 100% rausprüfen, das geht nicht. Wenn ich diesen Text hier schreibe, dann sind garantiert Tippfehler drin, typischerweise mindestens 2 Stück pro Zeile, also ungefähr 3% bis 5%. Ich prüfe den Text so rund drei Mal, bevor ich ihn absende. Beim ersten Mal finde ich wohl so 90% der Fehler, auch dank Software-Korrekturfunktion. Danach wird’s hart, es sind garantiert noch welche drin, aber die finde ich selber frühestens morgen, denke mir dann >wieso hast Du DEN nicht gesehen?<, aber so ist es halt.