Rubriken

FernUni-News - Forschung und Entwicklung

Nicht alles Gute kommt von oben: Kurzschlüsse in PC-Bauteilen durch Partikel aus dem All

Prozessor kontrolliert sich mit Programm-Echo selbst

Minimaler Aufwand, maximaler Schutz: Einen Prozessor, der sich unter anderem durch ein Echo des auf ihm laufenden Programms selbst kontrolliert, entwickelt das Lehrgebiet Parallelität und VLSI (Prof. Dr. Jörg Keller) der FernUniversität in Hagen. Die Hardware-Lösung soll mit minimalen Veränderungen im Prozessor auskommen, um kostengünstig und schnell in der Praxis einsetzbar zu sein. Grund ist, dass Sicherungsmaßnahmen wie sich gegenseitig kontrollierende Bauteile zunehmend wegfallen. Dabei werden Rechner gleichzeitig sogar immer anfälliger für die elektronischen Partikel, die ständig aus dem Weltall auf die Erde regnen.

Nicht alles Gute kommt von oben: Modernen, leistungsfähigen Computern kann durchaus Gefahr aus dem Weltraum drohen. Elektrisch geladene Teilchen aus dem All sind in der Lage, in die immer schmaleren Leiterbahnen von Mikroprozessoren einzuschlagen und eines der Bits durch eine Art Kurzschluss „umzuschalten“. Die Falsch-Ladung kann sich ausbreiten, evtl. durch den ganzen Chip. Gerade schnelle Rechner gefährdet der ständige Partikelregen aus Neutronen, selbst Mauern passiert diese Strahlung problemlos. Strahlung durch Alpha-Teilchen findet sich sogar in der Verpackung von Computerchips: „Wir müssen damit leben, schutzlos zu sein – es werden immer mehr Fehler auftauchen“, meint FernUni-Prof. Dr. Jörg Keller. Sein Lehrgebiet Parallelität und VLSI geht der Frage nach, wie man mit vertretbarem Aufwand Mikroprozessoren toleranter gegen die zwangsläufig auftretenden Fehler machen kann, einen Aufwand, den man bisher vorwiegend nur bei Speicherchips getrieben hat.

Je schmaler die Leiterbahnen auf Chips werden und je höher die Integrationsdichte von Transistoren, desto größer wird die Anfälligkeit der Bauteile. Mit jeder neuen Chip-Generation werden sie kompakter gepackt – immer schneller, immer mehr Funktionen sind das Ziel. Dadurch haben elektrisch geladene Partikel immer bessere Chancen, gleich mehrere Bauteile mit einem „Treffer“ zu beschädigen.

Weil die Leiterbahnen immer schmaler werden, bleibt dem elektrischen Strom immer weniger Platz, wenn ein Bahn-Bit durch den Beschuss umgepolt worden ist und eine „Engstelle“ entsteht. Mit der Laufzeit steigt die Fehlergefahr: „In Eisenbahnzügen bleiben die Rechner fast ununterbrochen an!“ Auch andere Fahrzeuge rücken in Kellers Blickfeld: In Autos werden Antiblockiersysteme, elektronische Lenksysteme, automatische Abstandsregelungen u. v. a. durch mehr und immer leistungsfähigere Rechner gesteuert.

Solange ein Programm nicht länger läuft als etwa eine Stunde, ist die Gefahr aber auch bei schnellen Computern noch gering. „Und wenn bei einer Bildbearbeitung in einem Foto ein Pixel kippt, ist das nicht dramatisch“, beruhigt er.

Dennoch: Die Gefahr ist nicht nur latent. Als IT-Unternehmen um das Jahr 2000 herum Prozessoren einsetzten, bei denen an der Fehlerkorrektor gespart worden war, kam es in Dutzenden von Firmen zu Server-Abstürzen: „Eindeutig waren Partikel aus dem All die Verursacher“, betont Kellers Mitarbeiter Dipl.-Inform. Bernhard Fechner. Auch ein Supercomputer mit 2.048 Knoten fiel mehrmals durch Fehler aus, die solche Weltraum-Vagabunden verursachten.

Nun könnte man – wie es in der Raumfahrt gemacht wird, die mit enormen Strahlungsdichten zu tun hat – die Bauteile ganz besonders schützen. Wichtige Hardware drei- oder vierfach einzubauen dient als Schutz vor einem Ausfall, ebenso aber auch zur gegenseitigen Kontrolle. „Auf dem Massenmarkt sind Rechner, die dadurch einige hundert Euro teurer würden, aber nicht absetzbar“, weiß Jörg Keller.

Angesichts des enormen Kostendrucks, der auf Elektronik lastet, will das FernUni-Lehrgebiet mit billigen Bauteilen das gleiche Sicherheitsniveau erreichen. Sogar mit nur einem Prozessor ist das möglich, sofern er sich selbst kontrollieren kann. Eine Softwarelösung scheidet aus: „Keine Software schafft das in so kurzer Zeit“, unterstreicht Fechner.

Die Lösung der Hagener Informatiker: Die Hardware muss so wenig geändert werden, dass die Programme davon gar nichts merken, der Prozessor bleibt „so normal wie möglich“. Größere Änderungen von Chips stoßen auch bei den Herstellern auf Widerstand, weil dies wegen der Gefahr von Fehlern im Entwurf zu hohen Zusatzkosten führt. An bestimmten Prozessorstellen sollen spezielle Schaltungen eingebaut werden, um Fehler sicher zu erkennen. Dafür wollen die FernUni-Wissenschaftler unter anderem ein Programm mit geringem zeitlichem Abstand als „Echo“ ein zweites Mal auf dem Prozessor laufen lassen. Der zeitliche Versatz zwischen Programm und Echo soll im Durchschnitt etwa fünf Takte betragen, bei einer Taktfrequenz von 1 Gigahertz also 5 Nanosekunden.

Bernhard Fechner untersucht in seiner Dissertation, wie diese Schaltungen zu realisieren sind, um sie ohne Aufwand in einen Chip einbauen zu können, ohne dass die Performance in Mitleidenschaft gezogen wird, bzw. diese noch gesteigert werden kann.

Gerd Dapprich | 31.01.2007
FernUni-Logo FernUniversität in Hagen, 58084 Hagen, Telefon: +49 2331 987-01, E-Mail: fernuni@fernuni-hagen.de