FAQ: Wie genau war Harrisons Chronometer H4?

Was immer wieder gefragt wird, hier kurz und bündig
Antworten
Benutzeravatar
Ralf
Beiträge: 13620
Registriert: 15 Feb 2006, 12:07
Wohnort: Im Wiesental zwischen Basel und Feldberg
Tätigkeit: Rentner aka Rentier aka Privatier aka Pensionär
Kontaktdaten:

FAQ: Wie genau war Harrisons Chronometer H4?

Beitrag von Ralf »

Prolog:
Ob das eine FAQ ist oder nicht, das hängt vom Blickwinkel ab. Im Forum hat es wohl noch niemand so gefragt. Aber es wird seit 350 Jahren an verschiedenen Stellen heiss diskutiert. Hier kommt er rein, weil er ein anschauliches, praktisches Beispiel für den Unterschied zwischen mittlerem Gang und der (Un-)Genauigkeit einer Uhr ist.

Fazit:
Gleich zum Anfang die Kurzzusammenfassung der Antwort: Man weiss es nicht wirklich, die im >longitude act< gestellte Anforderung war so gestellt, dass man die Frage mit den vorliegenden Ergebnissen nicht ordentlich beantworten kann. Wohlwollende Schätzungen sagen, dass er die Anforderung um den Faktor 4 übertroffen hat (Quelle: Prof. Dr. Claudia Linnhoff-Popien, Florian Dorfmeister, Philipp Marcus; Ludwig-Maximilians-Universität, München)

Die Anforderung:
Ursprünglich kam die Anforderung von der Marine, und die haben es sehr pragmatisch formuliert: Ein halbes Längengrad Unsicherheit auf einer 40tägigen Atlantiküberquerung von England zu den Westindischen Inseln (Karibik). Weil man allgemein der Meinung war, es handle sich um ein astronomisches Problem, hat man die mit der Prüfung beauftragt, die haben ganz stocksimpel gerechnet:
360 Grad sind 24 Stunden, also sind 15 Grad ein Stunde, also ist ein Grad 4 Minuten, also sind ein halbes Grad 2 Minuten. Es geht also eigentlich um einen Winkel, den man in verschiedenen Einheiten ausgedrückt hat. Erst in Bogengrad, dann als Winkel der Himmelsbewegung.

Und dann ging der Ärger richtig los. Darüber ist schon jede Menge geschrieben worden. Dava Sobel hat wohl das derzeit bekannteste und erfolgreichste Buch darüber geschrieben: >Longitude: The True Story of a Lone Genius Who Solved the Greatest Scientific Problem of His Time<. Den Ärger beschreibt sie sehr gut, aber um das Thema Genauigkeit drückt sie sich. Wohl auch besser so, denn sie ist Journalistin und keine Metrologin. Ilan Vardi, ein kanadischer Mathematiker, hat das Problem in einem Artikel namens >Should Harrison have won the Longitude Prize?< in watch around sehr gut behandelt. Auf diesen Artikel stützt sich dieser Beitrag stark ab.

Die Ergebnisse:
Der erste offizielle Test fand im Winter 1761/62 statt. Die Deptford segelte vom 18.11.1761 bis zum 19.01.1762 nach Jamaika, an Bord die H4 und John Harrisons Sohn William. Der kam mit sensationellen 5,1 Sekunden Abweichung zurück. Jetzt hatte man zwei Probleme:
  1. Der Sohn des Herstellers war nun nicht gerade das, was man als neutralen Beobachter bezeichnen konnte. Hätte man auch vorher wissen können, aber John war auch so ein etwas eigenbrödlerischer Dickkopf, der seine Uhren niemandem Fremden in die Hand geben wollte.
  2. Man wusste damals gar nicht so genau, wo Jamaika eigentlich liegt. Zumindest nicht genau genug, Dass halbe Winkelgrad entspricht am Äquator 40 Seemeilen. Die 5,1 Sekunden waren umgerechnet 1,7 Seemeilen, und das war viel weniger als die Ungenauigkeit der Position von Jamaika.
Mit anderen Worten: das Ergebnis was eigentlich sehr gut, aber auch zu gut, um auch nur ansatzweise korrekt zu sein. Die Messunsicherheit war ein Mehrfaches des Messwerts.

Deswegen gab es einen zweiten Test. Am 28.03.1764 segelte die Tartar nach Barbados, nach 47 Tagen ging die Uhr 168 Sekunden nach. Das sind mehr als zwei Minuten. Aber Harrison hatte den mittleren Gang mit -2 2/3 s/d spezifiziert. Multipliziert man das mit Reisedauer, und zieht es von den -168 Sekunden ab, dann bekommt man -40 Sekunden (Nachkommastellen lass ich weg). Und das ist besser als zwei Minuten. Dazu muss man wissen, dass die Position von Barbados immerhin auf ± 10 Sekunden genau bekannt war, also der wahre Wert wohl irgendwas zwischen -30 und -50 Sekunden war. Also eigentlich eindeutig besser als gefordert.

Welcher Wert war nun der für die Entscheidung anzuwendende? Nevil Maskelyne, der Chefastronom, war für die -168 Sekunden. Ob er für den Wert war, weil er den Unterschied zwischen mittlerem Gang und Ganggenauigkeit nicht verstanden hatte, oder weil er als Astronom keine mechanisch, sondern eine astronomische Lösung wollte ist nicht so eindeutig festlegbar. Carl Friedrich Gauß war noch nicht mal geboren, und die Wissenschaft kannte sich mit dem Unterschied zwischen zufälligen und systematischen Fehlern noch nicht aus, damit begann man erst ein Jahrhundert später sich auseinanderzusetzen. Selbst heute ist das Verständnis des Unterschieds noch nicht Allgemeingut.

Will man anhand dieser Fakten eine Angabe zur Genauigkeit machen, dann stösst man auf viele Schwierigkeiten. Die Toleranzen bei der Wahl der Referenzzeit wurden ja schon genannt. Die Angaben sind aber auch zu wenige, um wirklich belastbare, exakte Rechnungen anstellen zu können. Dazu waren die Bedingungen viel zu schlecht gewählt. Der Stand der Wissenschaft war damals einfach noch nicht so weit. Man hätte schon ein Genie beauftragen müssen und nicht einen zerstritten Haufen aus Militär, Astronomen und Politikern, die teilweise auch noch deutliche Eigeninteressen am Projekt hatten. Man kann aber einige begründete Annahmen treffen und so einen groben Eindruck gewinnen, welche Grössenordnung damals erreicht wurde.
Ilan Vardi hat geschrieben:However the same degree of uncertainty, when applied to Harrison’s claim that H4 lost only 5.1 seconds on its first voyage to Jamaica in 1761, makes this oft-quoted result meaningless. In this case the result is simply under the precision level of the test, so the error of the H4 watch cannot be declared more explicitly.
Ich beschränke mich deswegen auch gleich auf die zweite Reise.

WARNUNG: Jetzt kommt Mathematik. Wer darauf keinen Bock hat, soll besser hier aufhören zu lesen.
Die Abschätzung:
Zurück zum tatsächlichen mittleren Gang von -40 s. Die Unsicherheit hat Vardi mit 10 Sekunden angenommen, das erscheint sinnvoll. Bedeute, wir haben drei Fälle:
  • best case: -30 Sekunden
  • Istwert: -40 Sekunden
  • worst case -50 Sekunden
Irgendwo da dazwischen wird der wahre Wert wahrscheinlich gelegen haben. Als nächste muss man eine Annahme darüber treffen, wie sich die Gesamtabweichung in zufällige und systematische Fehler aufteilt. Das ist notwendig, weil sich der Gesamtabweichung folgendermassen zusammensetzt:
Gesamtabweichung = Summe der systematischen Fehler ± Wurzel aus der Summe der Quadrate der zufälligen Fehler
Wieso muss man die beiden Fehlerarten unterschiedlich addieren, und warum so? Kann man herleiten, aber ich mach lieber hier ein praktisches Beispiel. Der hat 6 Seiten mit 1 bis 6 Augen. Die Wahrscheinlichkeit, eine 1 zu Würfeln beträgt 1/6, alle andern Augenzahlen sind genauso wahrscheinlich. Nennt sich Gleichverteilung. Die Wahrscheinlichkeit irgendwas zwischen 2 und 5 zu würfeln beträgt also 4/6 = 2/3, Mathematisch formuliert sind das 3,5 ± 1,5 mit einer Wahrscheinlichkeit von 0,667.

Würfelt man dann ein zweites Mal und addiert die beiden Augenzahlen (Paschs zählen nicht doppelt!), dann ergibt sich folgendes Bild:
  • 2 ist die kleinstmögliche Summe: kann man nur mit 1+1 erreichen, also Wahrscheinlichkeit 1/6 x 1/6 = 1/36.
  • 3 kann man sowohl mit 1+2, als auch mit 2+1 erreichen, zwei Möglichkeiten, also Wahrscheinlichkeit 2/36.
  • 4 geht mit 1+3, 2+2, 3+1, also 3/36.
  • u.s.w.
  • bis zur 7, die tritt mit 1+6, 2+5, 3+4, 4+3, 5+2, 6+1 mit 6/36 an häufigsten auf.
  • dann gehts bis zur 12 wieder auf 1/36 zurück, wegen 12 geht nur mit einmal, mit 6+6
Wahrscheinlichkeit 0,667 mal 36 ist 24, Welche Augenzahlen liefern die Summe 24? 5: 4/36, 6: 5/36, 7: 6/36, 8: 5/36, 9: 4/36, macht 4+5+6+5+4+ = 24, also 5 bis 9, mathematisch 7 ±2. Die 7 ist offensichtlich, das ist zweimal die 3,5 von einem Wurf. Aber die Spanne, die steigt von 1,5 auf 2, das ist nicht das Doppelte, noch nicht mal näherungsweise. Theoretisch sagt ja die o.g. Formel, dass es sich von 1,41 auf 2 vergrössern müsste, von wegen Wurzel aus 2. Dass es nicht so ist liegt daran, dass die Formel von einer Normalverteilung, auch Gaußsche Glockenkurve genannt, ausgeht. Würfel ist aber Gleichverteilung, also einfach ein Rechteck.

Ilan Vardi schreibt dazu:
Analysis of the Greenwich test data was a further scientific challenge, since watch error does not generally have a normal statistical distribution and is similar to a random walk.
Da es keine Einzelwerte für die Fahrten gibt, sondern nur die Abschlusswerte können wir nichts über die tatsächliche Verteilung sagen. Danach kommt aber der Punkt, an dem ich nicht so ganz einer Meinung mit ihm bin. Auch wenn Uhren nicht wirklich normalverteilt sind, Normalverteilungen haben zwei Wendepunkte bei – 1 und +1 mal der Standardabweichung, Uhren haben diese Wendepunkte eher nicht und der Median sind gerne etwas in Richtung schneller als der Mittelwert gelegen (Schiefe), so sind doch die Unterschied doch so gering, dass es angesichts der andern Annahmen eine eher untergeordnete Abweichung ist. Der Unterschied von 1,5 zu 2 zu 1,41 zu 2 zeigt schon, das die Auswirkung der Form der Verteilung nun nicht so gewaltig ist.

BTW: Random Walk ist eine lustige Sache, die erst im 20 Jahrhundert diskutiert wurde. Karl Pearson, Lord Rayleigh, vor allem George Polya haben da viel dazu beigetragen. Ein Stockbesoffener verlässt sein Haus. Er ist so weggetreten, dass er die Richtungen nicht mehr auseinderhalten kann. Im simpelsten Fall gibt es nur ein Strasse, und er kann sich bei jedem Schritt entweder 1 vor oder 1 zurück bewegen. Dann kann man ausrechnen, wie wahrscheinliche s es ist, dass er jemals bei einem bestimmten Ziel ankommt. Dazu muss man auch annahmen treffen wie wahrscheinlich vor und zurück sind, im einfachsten Fall 50/50 (Für eine genügend hohe Anzahl Schritte mit 50/50 auf einer einzige Strasse nähert man sich dann doch wieder genau der Normalverteilung!)

Ausgangspunkt für die Abschätzung des systematischen Fehlers ist die Vorgabe von John Harrison selber. Er hat ihn mit Minus 2 2/3 Sekunden pro Tag angeben. Anstatt Nachkommastellen ein Bruch anzugeben war damals üblich und ist es in verschieden Gegenden auch heute noch, so von wegen Uhrzeit 3/4 9 und so.
Nehmen wir an Harrsion wollte nur signifikante Zahlen angeben, dann wäre die Auflösung 1/ s/d. Damit wären wir bei
  • good case -3 s/d
  • Istwert -2 2/3 s/d
  • bad case -2 1/3 s/d
Das ist ein sehr optimistische Sicht, deswegen auch zusätzlich
  • best case -3 2/3 s/d
  • worst case -1 2/3 s/d
Damit haben wir 3 Fälle für die Toleranz der Referenzzeit, und 5 Fälle für den systematischen Fehleranteil, macht 15 Rechnungen.

Code: Alles auswählen

s/d      best     ist   worst
worst     -78     -88     -98
bad       -46     -56     -66
ist       -30     -40     -50
good      -14     -24     -34
best       18       8      -2 
Das nun alles im Extrem zusammenkommt lasse ich mal der Übersichtlichkeit halber weg und beschränke mich auf drei Fälle: - 66 s/d, -40 s/d und -14 s/d, die Minus 40 s/d war der offizielle Wert, die beiden anderen so was ähnliches wie die 1,5 des Würfels. Das waren 66,67% Wahrscheinlichkeit, Mediziner arbeiten z.B. mit dem Signifikanzniveau von 70% für ihre Tests, ein ähnliches Niveau dürfen wir uns hier auch gönnen.

Ich rechne dabei mit 48 Tagen, weil das Problem ist immer, wie soll man den ersten und letzten Tag ansetzen, 2 mal ein halber oder 2 mal ein ganzer? Uhrzeiten hab ich nicht und mit 48 sind wir ganz nah an den 39,2 s für die Summe der zufälligen Fehler, die in der Literatur an verschiedenen Stellen auftauchen.

Diese drei Werte muss man jetzt quadrieren, dann durch die Anzahl der Tage teilen, dann die Wurzel ziehen, damit auf die Werte des wahrscheinlichen maximalen zufälligen Fehlers pro Tag zu kommen. Heraus kommt also die Ganggenauigkeit pro Tag, aka Unsicherheit:
  • ±9,5 s/d
  • ±5,8 s/d
  • ±2,0 s/d
Das war verdammt gut, eine herausragende, phänomenale, fast kosmische Leistung. Allerdings aber auch weit entfernt von den oft vorgetragenen 5,1 durch was auch immer gleich 0,084 s/d, die sind eine falsche Rechnung, Geschichtsklitterung und haben mit der Realität nichts zu tun.

Die Ganggenauigkeit vieler Armbanduhren liegt heute in ähnlichen Grössenordnungen.

Nachtrag:
James Cook bekam den ersten Nachbau der H4, die K1, auf seine 2. Reise um die Welt mit (1772–1775). Er hat sie dabei wenn immer möglich mit der lokalen astronomischen Referenz verglichen und bestätigt dieser Uhr eine Unsicherheit von maximal ±8 Sekunden. Allerdings war auch er ein Kind seiner Zeit und so ist auch hier nicht ganz klar, was er damit genau meint.

Edit 5.9.2013: Rechtschreibkorrekturen
Man liest sich!

Ralf
Antworten