greenhouse

ITSM Incident & Problem Manager @ Convera

Santa AnaOnsiteFull-timePosted 7 days ago

Opens on greenhouse

About this role

Incident & Major Incident management

Key Responsibilities

Serve as the Incident Manager / Major Incident Manager for high-severity and business-impacting incidents by organizing incident bridges and war rooms, driving Rapid triage / Clear ownership / Timely decision-making

Ensure incidents are properly classified, prioritized, and escalated based on impact and urgency

ITSM Process Ownership & Governance

Enforce ITIL-aligned Incident and Problem Management practices

Ensure accurate and complete documentation within ServiceNow, including Impact and affected services / Incident timelines / Root cause summaries and follow-ups

Play the role of Problem Manager to Identify recurring issues and systemic risks / Ensure RCAs are completed with actionable outcomes

Act as a process authority during incidents, ensuring teams adhere to defined ITSM standards

Service Availability, Reliability & KPIs

Own operational oversight of service availability and reliability - Monitor and manage key service health indicators, including Service availability and uptime / Incident volumes and severity trends / MTTR and MTTD / SLA and OLA adherence

Use observability data to proactively identify service degradation and emerging risks

Escalate systemic availability or reliability concerns to leadership with data-backed insights

Observability & Operational Intelligence

Actively leverage observability platforms (e.g., Grafana, Datadog)

Partner with engineering and SRE teams to improve Monitoring coverage / Alert quality and signal-to-noise ratio

Ensure alerting and escalation via PagerDuty aligns with service criticality

Communication & Executive Engagement:

Serve as the primary communication lead during incidents - Deliver concise, executive-level updates that articulate Business impact / Current status / Mitigation steps / Next milestones

Translate complex technical details into clear business language

Maintain confidence and composure while engaging senior leaders during high-pressure events

Post-Incident & Continuous Improvement:

Facilitate or support post-incident reviews - Identify trends, gaps, and opportunities for Process improvement / Tooling enhancement / Better operational readiness

Contribute to the evolution of Command Center playbooks, runbooks, and response standards

Required Qualifications & Experience

Experience

3–6 years of experience in:

Incident Management

Major Incident / Command Center operations

Production operations or site reliability support

Proven experience managing high-severity incidents in 24×7 environments

Demonstrated ownership of service reliability and operational KPIs

ITSM & Process Expertise

Strong working knowledge of ITIL / ITSM frameworks

Deep hands-on experience with:

Incident Management

Major Incident workflows

Problem Management

Experience enforcing ITSM discipline across distributed technology teams

Skills & Competencies

Exceptional communication and facilitation skills

Strong analytical mindset with comfort using metrics and dashboards

Ability to operate decisively in high-pressure situations

Influences outcomes without formal authority

Comfortable interfacing with executive leadership

Nice-to-Have

Experience in regulated or customer-critical environments (FinTech, Payments, SaaS)

Exposure to ITSM tools like ServiceNow, PagerDuty etc.

Exposure to monitoring tools like Datadog, Grafana, Dynatrace etc.

About Convera

Convera is the largest non-bank B2B cross-border payments company in the world. Formerly Western Union Business Solutions, we leverage decades of industry expertise and technology-led payment solutions to deliver smarter money movements to our customers – helping them capture more value with every transaction. Convera serves more than 30,000 customers ranging from small business owners to enterprise treasurers, educational institutions, financial institutions, law firms, and NGOs.

Our teams care deeply about the value we bring to our customers, making Convera a rewarding workplace. This is an exciting time for our organization as we build our team with growth-minded, results-oriented people who are looking to move fast in an innovative environment.

As a truly global company with employees in over 20 countries, we are passionate about diversity; we seek and celebrate people from different backgrounds, lifestyles, and unique points of view. We want to work with the best people and ensure we foster a culture of inclusion and belonging.

We offer an abundance of competitive perks and benefits including:

Market competitive salary. Great career growth and development opportunities in a global organization. Hybrid schedule with 2 in the office per week. Generous insurance (health, disability, life). Paid holidays, time-off, and leave policies for life events (maternity, paternity, adoption). Paid volunteering opportunities (5 days per year).

This position follows a shift roster defined by the company. As we operate in a 24/7 environment, the selected candidate will work according to rotating schedules.

Apply now if you’re ready to unleash your potential.

Gestión de Incidentes y Mayores Incidentes

Responsabilidades Clave

Actuar como Incident Manager / Major Incident Manager para incidentes de alta severidad e impacto empresarial, organizando incident bridges y war rooms, impulsando una triage rápida, propiedad clara y toma de decisiones oportuna. Garantizar que los incidentes estén correctamente clasificados, priorizados y escalados según impacto y urgencia.

Propiedad de Procesos ITSM y Gobernanza

Hacer cumplir las prácticas de Gestión de Incidentes y Problemas alineadas con ITIL. Asegurar documentación precisa y completa en ServiceNow, incluyendo: impacto y servicios afectados, líneas de tiempo del incidente, resúmenes de causa raíz y seguimientos. Actuar como Problem Manager para identificar problemas recurrentes y riesgos sistémicos, garantizando que los análisis de causa raíz (RCA) se completen con resultados accionables. Actuar como autoridad de proceso durante incidentes, asegurando la adherencia a los estándares ITSM definidos.

Disponibilidad del Servicio, Confiabilidad y KPIs

Ser responsable de la supervisión operativa de la disponibilidad y confiabilidad del servicio. Monitorear y gestionar indicadores clave, como: disponibilidad y tiempo activo del servicio, volúmenes y tendencias de severidad de incidentes, MTTR y MTTD, cumplimiento de SLA y OLA. Utilizar datos de observabilidad para identificar proactivamente degradaciones del servicio y riesgos emergentes. Escalar preocupaciones sistémicas de disponibilidad o confiabilidad al liderazgo con insights fundamentados en datos.

Observabilidad e Inteligencia Operacional

Aprovechar activamente plataformas de observabilidad (p. ej., Grafana, Datadog). Colaborar con equipos de ingeniería y SRE para mejorar la cobertura de monitoreo, la calidad de alertas y la relación señal/ruido. Asegurar que las alertas y escalaciones vía PagerDuty estén alineadas con la criticidad del servicio.

Comunicación y Relación con Ejecutivos

Ser el punto principal de comunicación durante incidentes: brindar actualizaciones concisas a nivel ejecutivo que articulen el impacto al negocio, estado actual, pasos de mitigación y próximos hitos. Traducir detalles técnicos complejos a un lenguaje claro de negocio. Mantener confianza y compostura al interactuar con líderes senior durante eventos de alta presión.

Post-Incidente y Mejora Continua

Facilitar o apoyar revisiones posteriores al incidente, identificando tendencias, brechas y oportunidades para mejorar procesos, herramientas y preparación operativa. Contribuir a la evolución de los playbooks, runbooks y estándares de respuesta del Command Center.

Calificaciones y Experiencia Requerida

Experiencia

3–6 años de experiencia en:

Gestión de Incidentes Operaciones de Mayores Incidentes / Command Center Operaciones de producción o soporte de confiabilidad del sitio (SRE)

Experiencia comprobada gestionando incidentes de alta severidad en entornos 24×7. Evidencia de liderazgo en la confiabilidad del servicio y KPIs operativos.

Conocimientos ITSM y de Procesos

Sólido conocimiento de marcos ITIL / ITSM. Amplia experiencia práctica en:

Gestión de Incidentes Flujos de trabajo de Mayores Incidentes Gestión de Problemas

Experiencia haciendo cumplir disciplina ITSM en equipos tecnológicos distribuidos.

Habilidades y Competencias

Habilidades excepcionales de comunicación y facilitación. Mentalidad analítica y comodidad usando métricas y tableros. Capacidad para operar con decisión en situaciones de alta presión. Influencia efectiva sin autoridad formal. Comodidad al interactuar con liderazgo ejecutivo.

Deseable

Experiencia en entornos regulados o críticos para clientes (FinTech, Pagos, SaaS). Conocimiento de herramientas ITSM como ServiceNow, PagerDuty, etc. Conocimiento de herramientas de monitoreo como Datadog, Grafana, Dynatrace, etc.

Sobre Convera

Convera es la empresa de pagos transfronterizos B2B más grande del mundo fuera del sector bancario. Anteriormente conocida como Western Union Business Solutions, aprovechamos décadas de experiencia en la industria y soluciones tecnológicas para ofrecer movimientos de dinero más inteligentes a nuestros clientes, ayudándolos a capturar mayor valor en cada transacción.

Convera atiende a más de 30,000 clientes, desde propietarios de pequeñas empresas hasta tesoreros corporativos, instituciones educativas, instituciones financieras, firmas legales y ONG.

Nuestros equipos se preocupan profundamente por el valor que brindamos a nuestros clientes, lo cual hace que Convera sea un lugar de trabajo gratificante. Este es un momento emocionante para nuestra organización mientras construimos un equipo con personas orientadas al crecimiento y enfocadas en resultados, que quieran avanzar rápidamente en un entorno innovador.

Como una empresa verdaderamente global con empleados en más de 20 países, somos apasionados por la diversidad; buscamos y celebramos personas de distintos orígenes, estilos de vida y perspectivas únicas. Queremos trabajar con el mejor talento y fomentar una cultura de inclusión y pertenencia.

Ofrecemos múltiples beneficios competitivos:

Salario competitivo en el mercado. Excelentes oportunidades de crecimiento y desarrollo profesional en una organización global.

Un enfoque flexible al trabajo y un esquema híbrido con 2 días a la semana en la oficina.

Generoso seguro (salud, discapacidad, vida). Días feriados, tiempo libre y políticas de licencia para eventos de vida (maternidad, paternidad, adopción). Oportunidades de voluntariado pagadas (5 días por año).

Esta posición sigue un rol de turnos definido por la empresa. Como operamos en un entorno 24/7, la persona seleccionada trabajará según horarios rotativos

Skills

Technology Operations & Support

Ready to apply?

Install the ResuMinder extension and we'll auto-fill the application in seconds — no rewriting.

Get the extension →