Fejl tolerance
tilgængelighed er den vigtigt aspekt af High Performance Computing. Tilgængelighed er et mål for det system, hvor meget tid, som systemet er til rådighed. Et system er måske ikke i tilgængelig tilstand på grund af hardware eller software fejl. Løsningen på fejl i systemet, vi er nødt til at gøre systemet fejltolerant.
For at undgå hardwarefejl, kan vi opbygge fejltolerant hardware hvor systemer nedbrydes i moduler; ved at dividere systemet i moduler fejl er isoleret til moduler, og vi kan forhindre aktiveringen af andre fejl, også overflødige hardware kan anvendes. For at gøre software fejltolerant, kan wrapper og foryngelse teknikker anvendes [5].
Programmering for parallelle computere
Som Høj performance computing har en kompleks arkitektur, som gør programmering mere kompleks. Vi kan løse dette problem ved at indføre nye programmerings-modeller.
Disse programmering modeller kan spille en rolle for bro mellem programmering og hardware. Balancen mellem produktivitet og effektivitet er nøglen, mens gennemførelsen af disse programmering modeller [6] [7]
Referencer
[1] ML Fisher, "optimale løsning for Planlægning problemer ved hjælp Lagrange multiplikatorer.: Del I, " operationsanalyse , bd. 21, nr. 5, s. 1114-1127, september 1973. [2] M. Naiouf, L. De Giusti, F. Chichizola, og A. De Giusti, "Dynamisk Load Balancing om ikke-homogene klynger, "i Frontiers of Netværk-ISPA 2006 Workshops High Performance Computing og, 2006, s. 65-73. [3] C. Kopparapu, load balancing Servere, Firewalls, og cache . New York: John Wiley & Sons, Inc., 2002. [4] OB Wheeler, "Sikker Programmering til Linux og Unix HOWTO", s. 00, 2003. [5] F. Piedad, Høj Tilgængelighed: Design, teknikker og processer . 2001. [6] WD Gropp, "Præstationer drevet Programmimg modeller," i Massively Parallel programmering Modeller, 1997. Proceedings. Tredje Working konference om , 1997, pp 61-67 [7] K. Asanović et al, andre, Landskabet i parallel computing forskning:... En visning fra Berkeley
. CiteSeer, 2006. Problemer i High Availability