4.1.1 Duplicidad de Datos

Duplicidad de Datos

Se usa la duplicidad de los datos para mantener en línea copias de información y de otros recursos. La duplicidad resulta un campo clave en los sistemas distribuidos, ya que provee un mejor desempeño, alta disponibilidad y tolerancia a fallas.
 


A continuación se mencionan algunas de las razones principales de la duplicidad.
  • Desempeño. La réplica de información puede ser usada para incrementar el tiempo de respuesta a un servicio, ya que la información compartida por un número grande de usuarios no debería ser almacenada en un sólo sitio, pues esa computadora se convertiría en un cuello de botella y aumentarían los tiempos de respuesta. Es preferible distribuir varias copias de información en varios servidores y lograr que cada uno de ellos atienda a un número de usuarios más reducido.
  • Disponibilidad. Al tener varias copias de información en dos o más servidores independientes a fallas ejecutando software similar, si llegase a fallar el servidor por defecto, el software cliente puede accesar a un servidor alternativo y obtener los servicios requeridos.
  • Tolerancia a fallas. Si cada uno de los servidores de una colección procesa en paralelo cada petición de un cliente, entonces es posible garantizar el procesamiento correcto de una petición, aún si uno o más de los servidores llegaran a fallar.
  • El mayor requerimiento que se presenta al duplicar información, es la transparencia de almacenamiento. Esto quiere decir que los usuarios no deben preocuparse o tener en cuenta de que existen varias copias físicas de la información.

Otro requerimiento para la información duplicada es la consistencia. Consideremos el caso en que los clientes hacen peticiones de lectura y de escritura a un conjunto de partidas en la información. No es correcto que diferentes clientes que realicen la misma operación que afectan al mismo grupo de datos, obtengan diferentes resultados.