Cambridge University Press - Inicio de Sesión Único para 100M de Usuarios Globales
Modernizamos la infraestructura de autenticación para una plataforma de publicación académica que sirve a 100 millones de usuarios en todo el mundo con 4 mil millones de documentos en ámbitos públicos y privados.
Objetivos del Proyecto
Modernizar el sistema heredado de inicio de sesión único para soportar 100 millones de usuarios en múltiples ámbitos de autenticación, entregar monitoreo en tiempo real y herramientas operacionales para plataforma que sirve 4 mil millones de documentos, asegurar cero tiempo de inactividad durante la migración de infraestructura académica crítica, y soportar tanto acceso público como suscripciones institucionales con autenticación unificada.
El Problema
Cambridge University Press opera una de las plataformas de publicación académica más grandes del mundo. 100 millones de usuarios. 4 mil millones de documentos. Estudiantes e investigadores de todo el mundo dependiendo de ella.
Su sistema de autenticación mostraba su edad.
El antiguo inicio de sesión único no podía escalar. Múltiples métodos de autenticación que no funcionaban bien juntos. Sin vista unificada para los equipos de operaciones. Y la complejidad: usuarios públicos, suscripciones institucionales, inicios de sesión federados de universidades—todos necesitando tratamiento diferente.
Ah, ¿y tiempo de inactividad? No es una opción. Intenta explicarle a un estudiante de doctorado por qué no puede acceder a artículos de investigación la noche antes de entregar su tesis.
El Desafío
Esto no era solo cambiar formularios de inicio de sesión. Cambridge University Press tenía una complejidad de autenticación que haría que la mayoría de las plataformas SaaS parecieran simples:
Usuarios públicos creando cuentas gratuitas. Suscriptores individuales pagando por acceso. Universidades enteras con licencias de sitio. Inicio de sesión federado desde sistemas de campus. Acceso API para integraciones de terceros.
Cada uno necesitaba flujos de autenticación diferentes. Todos ellos necesitaban funcionar juntos sin problemas.
Y la restricción de tiempo: Sin ventanas de tiempo de inactividad. Los estudiantes usan la plataforma 24/7 en todas las zonas horarias. Los calendarios académicos no tienen "períodos tranquilos."
Lo Que Construimos
Modernizamos toda la infraestructura de autenticación mientras manteníamos 100% de tiempo de actividad. Cero interrupciones de servicio. Cero sesiones perdidas. Todo como siempre desde la perspectiva del usuario.
El Nuevo Sistema SSO
Construimos un proveedor de identidad centralizado que soporta cada método de autenticación que Cambridge necesitaba:
Usuario/contraseña tradicional para usuarios directos. OAuth y SAML para instituciones federadas. Autenticación basada en tokens para APIs. Inicio de sesión único en toda la familia de productos.
Todo gestionado a través de un sistema en lugar de piezas desconectadas.
Unificación de Ámbitos
La plataforma tenía múltiples "ámbitos"—diferentes poblaciones de usuarios con diferentes patrones de acceso.
Ámbito público: Acceso abierto a contenido gratuito. Registro para personalización. Acceso de prueba a contenido premium.
Ámbito privado: Acceso institucional a través de suscripciones universitarias. Autenticación basada en IP. Inicio de sesión federado desde sistemas de campus. Cumplimiento de licencias.
Los unificamos bajo una capa de autenticación. Los usuarios podían moverse entre ámbitos sin problemas. Experiencia consistente en todas partes.
Federación a Escala
Cientos de universidades en todo el mundo. Cada una con sus propios sistemas de identidad. Cada una queriendo inicio de sesión federado para que los estudiantes usen sus credenciales de campus.
Construimos integración SAML que escalaba:
Gestión de metadatos para instituciones. Procesos de incorporación automatizados. Soporte para diferentes estándares de federación. Conmutación por error cuando los sistemas institucionales caían.
Cada integración universitaria es única. Construimos sistemas que hicieron manejables las integraciones únicas.
Infraestructura Global
100 millones de usuarios no viven en un solo lugar. Están en todas partes.
Distribuimos la infraestructura de autenticación globalmente:
Servidores regionales reduciendo latencia. Replicación de base de datos para lecturas rápidas. Almacenamiento en caché para datos frecuentemente accedidos. Enrutamiento geográfico enviando usuarios a servidores cercanos.
Los estudiantes en Tokio no deberían autenticarse a través de servidores en Londres. Ya no lo hacen.
La Migración
No migras 100 millones de usuarios de la noche a la mañana.
Ejecutamos sistemas antiguos y nuevos en paralelo. Escritura dual a ambos durante la transición. Gradualmente movimos poblaciones de usuarios a la nueva infraestructura.
Comenzamos con segmentos de bajo riesgo. Monitoreamos todo. Desplegamos región por región. Banderas de características controlando exactamente quién usaba qué.
Si algo salía mal, reversión instantánea. Nunca sucedió.
Resultado: Cero tiempo de inactividad durante toda la migración.
Herramientas Operacionales
Construimos monitoreo en tiempo real y herramientas operacionales para el equipo que gestiona la plataforma:
Paneles mostrando tasas de éxito de autenticación por región. Métricas de latencia de inicio de sesión. Sesiones activas. Patrones de error. Uso por institución.
Los equipos de soporte podían diagnosticar problemas en segundos en lugar de horas:
¿Un usuario no puede iniciar sesión? Busca su cuenta, ve su historial de autenticación, identifica el problema inmediatamente.
¿Una universidad reporta problemas de acceso? Verifica sus patrones de uso, verifica su configuración de federación, detecta el problema.
Las operaciones pasaron de reactivas a proactivas. Problemas detectados antes de que los usuarios los notaran.
Los Resultados
100 millones de usuarios soportados globalmente. Cada método de autenticación. Cada región. Todo funcionando.
4 mil millones de documentos accesibles. El contenido siempre estuvo ahí. Ahora la autenticación nunca se interpone en el camino de acceder a él.
Cero tiempo de inactividad durante la migración. Ni un minuto de interrupción del servicio. La infraestructura académica de misión crítica se mantuvo de misión crítica.
Tasa de éxito de autenticación del 99.9%+. Los usuarios inician sesión. Funciona. Cada vez.
Tickets de soporte disminuyeron 60%. Mejor monitoreo significó que los problemas se arreglaron antes de que los usuarios contactaran soporte.
Latencia de autenticación reducida 40%. La distribución global y el almacenamiento en caché hicieron los inicios de sesión más rápidos en todas partes.
Lo Que Aprendimos
La migración de ejecución dual permite cero tiempo de inactividad. Ejecutar sistemas antiguos y nuevos en paralelo cuesta más infraestructura. Pero para sistemas de misión crítica donde el tiempo de inactividad no es aceptable, es la única forma.
Cambio gradual de tráfico. Capacidad de reversión instantánea. Validación de producción en cada paso.
El monitoreo es una característica del producto. Las herramientas operacionales en tiempo real no eran solo para el equipo de operaciones. Mejoraron la experiencia del usuario al permitir una resolución de problemas más rápida.
Cuando los equipos de soporte pueden diagnosticar problemas en segundos, los usuarios obtienen ayuda más rápido.
La complejidad de autenticación escala con la complejidad del negocio. La autenticación de Cambridge no era complicada por diversión. Usuarios públicos, suscriptores institucionales, inicio de sesión federado—cada uno resolvía una necesidad de negocio real.
El desafío técnico fue hacer que toda esa complejidad funcionara junta sin problemas.
La federación requiere paciencia. Cada universidad es diferente. Sistemas diferentes. Estándares diferentes. Plazos diferentes. Procesos burocráticos diferentes.
No puedes estandarizarlo. Construyes sistemas que manejan la diversidad con gracia.
La escala global requiere pensamiento regional. La autenticación centralizada desde un centro de datos no funciona cuando los usuarios están en todas partes.
La distribución geográfica no es opcional a esta escala. Es la diferencia entre una experiencia de usuario aceptable y excelente.
Cambridge University Press apoya la educación en todo el mundo. Su infraestructura de autenticación finalmente coincidió con ese alcance.
¿Necesitas implementación de SSO empresarial o modernización de plataforma? Hablemos →
Ve más transformaciones de infraestructura Ver casos de estudio →