4.1.1 Duplicidad de Datos
Duplicidad
de Datos
Se
usa la duplicidad de los datos para mantener en línea
copias de información y de otros recursos. La
duplicidad resulta un campo clave en los sistemas
distribuidos, ya que provee un mejor desempeño, alta
disponibilidad y tolerancia a fallas.
A
continuación se mencionan algunas de las razones
principales de la duplicidad.
- Desempeño.
La réplica de información puede ser usada para
incrementar el tiempo de respuesta a un servicio,
ya que la información compartida por un número
grande de usuarios no debería ser almacenada en un
sólo sitio, pues esa computadora se convertiría en
un cuello de botella y aumentarían los tiempos de
respuesta. Es preferible distribuir varias copias
de información en varios servidores y lograr que
cada uno de ellos atienda a un número de usuarios
más reducido.
- Disponibilidad.
Al tener varias copias de información en dos o más
servidores independientes a fallas ejecutando
software similar, si llegase a fallar el servidor
por defecto, el software cliente puede accesar a
un servidor alternativo y obtener los servicios
requeridos.
- Tolerancia
a fallas. Si cada uno de los servidores de una
colección procesa en paralelo cada petición de un
cliente, entonces es posible garantizar el
procesamiento correcto de una petición, aún si uno
o más de los servidores llegaran a fallar.
- El
mayor requerimiento que se presenta al duplicar
información, es la transparencia de
almacenamiento. Esto quiere decir que los usuarios
no deben preocuparse o tener en cuenta de que
existen varias copias físicas de la información.
Otro
requerimiento para la información duplicada es la
consistencia. Consideremos el caso en que los clientes
hacen peticiones de lectura y de escritura a un
conjunto de partidas en la información. No es correcto
que diferentes clientes que realicen la misma
operación que afectan al mismo grupo de datos,
obtengan diferentes resultados.
|