Error menor, gran catástrofe - GitLab se desconecta por un día
GitLab, una startup que es una alternativa al muy popular GitHub, ha tenido un día bastante difícil recientemente como El error humano causó que todo el sitio web estuviera inactivo durante un día completo..
El problema de GitLab comenzó cuando el Sitio web estaba experimentando problemas de tiempo de carga y estabilidad. El sitio web fue puesto fuera de línea para rectificar los problemas. Sin embargo, durante el mantenimiento, Sin saberlo, alguien cometió el error de eliminar accidentalmente un directorio que contiene 300 GB de datos de producción en vivo..
Afortunadamente para GitLab, solo se eliminaron los contenidos. Problemas afectados y solicitudes combinadas. Los repositorios y wikis no se vieron afectados por este error de ninguna manera, lo que significa que el El daño causado por este error no fue tan grave. como podría haber sido
Con el directorio eliminado, el personal de GitLab se dirige inmediatamente hacia su copia de seguridad. Desafortunadamente para ellos, GitLab se encontró con otro problema mas. De acuerdo con el archivo de Google Doc que se actualiza constantemente a medida que GitLab se esfuerza por volver a estar en línea, las 5 copias de seguridad / replicación Técnicas que el sitio web desplegado no funcionó de manera confiable., y en algunos casos fueron en primer lugar, nunca configurar.
Recuperando estos archivos perdidos de la nube No es una opción para GitLab, ya que la puesta en marcha decidió a finales del año pasado volcar la nube para construir y operar sus propios clústeres Ceph en lugar de. No hace falta decir que GitLab ahora está reconsiderando su postura sobre ese tema en particular.
@TheRegister @gitlab trabajará para hacer que la aplicación sea más eficaz y para explorar proveedores alternativos de alojamiento en la nube.
- Connor Shea (@connorjshea) 1 de febrero de 2017
A pesar del día tumultuoso que ha tenido GitLab, el sitio web ahora está funcionando correctamente. Mientras que el sitio web Informó que algunos datos se perdieron durante una ventana de seis horas., el Git repositorios quedaron ilesos durante toda la prueba. Un registro completo de incidentes de todo el evento se puede ver aquí.
Mientras que muchos Las lecciones se pueden aprender del pequeño error de GitLab. (principalmente arrogancia), el método de GitLab para manejar la crisis es bastante admirable ya que La puesta en marcha fue clara y transparente con sus usuarios.. Aquí está la esperanza de que GitLab aprenda de este error. De lo contrario, su base de usuarios probablemente perdonaría más si la historia se repitiera..
Fuente: El Registro