High Availability clusters

Er bestaan op operating system niveau twee cluster architecturen: High performance clusters en High availability clusters. Dit artikel gaat over High availability clusters.

Zie hier voor High performance clusters.

High availability clusters zijn groepen aan elkaar gekoppelde computers die in geval van uitval elkaars taken kunnen overnemen (nodes in een cluster).

Cluster software

Om applicatie failover te realiseren is speciale cluster software nodig. De bekendste producten voor Operating systems zijn:

Bovenstaande software is bedoeld om applicaties die op een node in het cluster draaien in korte tijd te laten "failoveren" op een andere node in het cluster.

Er wordt door deze software periodiek (bijvoorbeeld elke minuut) gecontroleerd of een applicatie nog goed werkt op een node. Indien dit niet het geval is, volgt een failover: de applicatie wordt gestopt op de originele node (als dit nog mogelijk is) en gestart op een andere node.

Er wordt gestreefd dat de eindgebruikers na een minimale onderbreking gewoon kunnen doorwerken.

Cluster-aware applicaties

Bovenstaande beschrijving gaat ervan uit dat de applicaties niet weten dat ze op een cluster draaien. Er bestaan echter ook cluster-aware applicaties.

Een voorbeeld hiervan is Oracle RAC (Real Application Cluster). Hierbij kan Oracle tegelijkertijd draaien op meerdere nodes van het cluster, en is de applicatie in staat zelf met uitval van een node om te gaan.

Bij uitval van een node in het cluster, is hooguit de performance van het geheel wat lager. maar de eindgebruikers merken er verder niets van.

Testen

Cruciaal voor het gebruik van High Availability Clusters is dat ze regelmatig getest moeten worden. Ik ben in de praktijk eens tegengekomen dat een 2-node HP-UX Serviceguard cluster ooit eens was ingericht door een leverancier en daarna nooit meer was getest! Iedereen was in de veronderstelling dat men met het cluster uitval van hardware kon opvangen. Toen echter enkele jaren later een node daadwerkelijk uitviel, bleek het cluster niet goed te kunnen failoveren. Er volgde een (aanzienlijke) downtime, die voorkomen had kunnen worden als het cluster tenminste twee maal per jaar was getest.


This entry was posted on Donderdag 05 April 2007

Earlier articles

Quantum computing

My Book

Security bij cloudproviders wordt niet beter door overheidsregulering

Passend Europees cloudinitiatief nog ver weg

Data Nederlandse studenten in cloud niet grootschalig toegankelijk voor bedrijven VS

VS kan nog steeds Europese data Microsoft opeisen ondanks nieuwe regels

The cloud is as insecure as its configuration

Infrastructure as code

DevOps for infrastructure

Infrastructure as a Service (IaaS)

(Hyper) Converged Infrastructure

Object storage

Software Defined Networking (SDN) and Network Function Virtualization (NFV)

Software Defined Storage (SDS)

What's the point of using Docker containers?

Identity and Access Management

Using user profiles to determine infrastructure load

Public wireless networks

Supercomputer architecture

Desktop virtualization

Stakeholder management

x86 platform architecture

Midrange systems architecture

Mainframe Architecture

Software Defined Data Center - SDDC

The Virtualization Model

What are concurrent users?

Performance and availability monitoring in levels

UX/UI has no business rules

Technical debt: a time related issue

Solution shaping workshops

Architecture life cycle

Project managers and architects

Using ArchiMate for describing infrastructures

Kruchten’s 4+1 views for solution architecture

The SEI stack of solution architecture frameworks

TOGAF and infrastructure architecture

The Zachman framework

An introduction to architecture frameworks

How to handle a Distributed Denial of Service (DDoS) attack

Architecture Principles

Views and viewpoints explained

Stakeholders and their concerns

Skills of a solution architect architect

Solution architects versus enterprise architects

Definition of IT Architecture

What is Big Data?

How to make your IT "Greener"

What is Cloud computing and IaaS?

Purchasing of IT infrastructure technologies and services

IDS/IPS systems

IP Protocol (IPv4) classes and subnets

Introduction to Bring Your Own Device (BYOD)

IT Infrastructure Architecture model

Fire prevention in the datacenter

Where to build your datacenter

Availability - Fall-back, hot site, warm site

Reliabilty of infrastructure components

Human factors in availability of systems

Business Continuity Management (BCM) and Disaster Recovery Plan (DRP)

Performance - Design for use

Performance concepts - Load balancing

Performance concepts - Scaling

Performance concept - Caching

Perceived performance

Ethical hacking

Computer crime

Introduction to Cryptography

Introduction to Risk management

The history of UNIX and Linux

The history of Microsoft Windows

Engelse woorden in het Nederlands

Infosecurity beurs 2010

The history of Storage

The history of Networking

The first computers

Cloud: waar staat mijn data?

Tips voor het behalen van uw ITAC / Open CA certificaat

Ervaringen met het bestuderen van TOGAF

De beveiliging van uw data in de cloud

Proof of concept

Een consistente back-up? Nergens voor nodig.

Measuring Enterprise Architecture Maturity

The Long Tail

Open group ITAC /Open CA Certification

Human factors in security

Google outage

SAS 70

De Mythe van de Man-Maand

TOGAF 9 - wat is veranderd?

Landelijk Architectuur Congres LAC 2008

InfoSecurity beurs 2008

Spam is big business

De zeven eigenschappen van effectief leiderschap

Een ontmoeting met John Zachman

Persoonlijk Informatie Eigendom

Archivering data - more than backup

Sjaak Laan


Recommended links

Genootschap voor Informatie Architecten
Ruth Malan
Gaudi site
XR Magazine
Esther Barthel's site on virtualization
Eltjo Poort's site on architecture


Feeds

 
XML: RSS Feed 
XML: Atom Feed 


Disclaimer

The postings on this site are my opinions and do not necessarily represent CGI’s strategies, views or opinions.

 

Copyright Sjaak Laan