High performance clusters en grids
Er bestaan op operating system niveau twee cluster architecturen: High performance clusters en High availability clusters.
Clusters
High performance clusters zijn bedoeld om met meerdere systemen een grote reken- of verwerkingskracht te krijgen. Hiervoor worden een groot aantal meestal goedkope PC's via een snel netwerk (gigabit Ethernet of Infiniband) samengevoegd tot 1 grote supercomputer. Deze clusters worden veel gebruikt bij rekenintensieve taken, zoals weersvoorspellingen, geologisch, nucleair, of farmaceutisch onderzoek. De kunst bij deze architectuur is om de software en de infrastructuur zo in te richten dat de systemen zoveel mogelijk aan het werk zijn, zonder dat er teveel tijd verloren gaat aan de communicatie tussen de systemen.
Op www.top500.org staat een lijst van de 500 krachtigste supercomputers ter wereld. Het grootste deel van deze systemen bestaat eigenlijk uit een cluster van kleinere systemen. Veel van die systemen draaien Linux. Een bekend high-performance open source project voor Linux is Beowulf.
Grids
Indien een high-performance cluster bestaat uit systemen die geografisch verspreid zijn, spreken we van een Grid. Bij grid architectuur is de beperkte bandbreedte tussen de systemen vaak de bottleneck. Grids kunnen daarom alleen voor specifieke taken worden ingezet.
Het bekendste (en al een vrij oud) voorbeeld van een grid is het SETI@HOME project, waarbij een groot aantal privé PC's van internet gebruikers op zoek zijn naar buitenaards leven. Dit soort grids gebruikt ongebruikte computertijd van PC's (bijvoorbeeld als een computer op de screensaver springt) om computertijd aan het grid ter beschikking te stellen. De taken die worden uitgevoerd worden dan van het internet opgehaald. Als een stukje rekenwerk klaar is, dan wordt het resultaat terug gestuurd en wordt een nieuw pakketje werk opgehaald.
Toepassingen
Een meer serieus voorbeeld van een grid is een project dat op zoek is naar een genezing voor kanker of de ontrafeling van het menselijk DNA.
Tegenwoordig zijn ook grids beschikbaar met een hogere bandbreedte, zoals het Almere grid. De rekenkracht wordt hierbij ter beschikking gesteld aan onderzoekers.
Er zijn ook initiatieven die de donateurs van computertijd een vergoeding geven voor de beschikbaar gestelde computertijd. In dat geval wordt meestal de computertijd in het grid aan commerciële partijen verkocht.
Security
Uiteraard is security van grids een belangrijk aspect. De systemen waar de rekentaken op draaien dienen beveiligd te zijn tegen ongeoorloofd gebruik door anderen. Ook de gegevens die verwerkt worden dienen niet te kunnen worden gemanipuleerd.
This entry was posted on Zaterdag 30 December 2006