Vista rápida
Las llamadas con deepfakes en Zoom y Teams son ya un patrón de ataque documentado. Arup, la firma británica de ingeniería, perdió 25 millones de dólares en febrero de 2024 en una estafa de transferencia en Hong Kong donde varios ejecutivos en una videollamada eran deepfakes. El CEO de WPP afrontó un intento similar en mayo de 2024. El ataque suele empezar semanas antes con una cuenta de colaboración comprometida (Slack, Teams, Google Workspace) y escala después a un "Zoom rápido" con vídeo sintético. Las defensas centradas solo en la voz no lo ven. La solución es una llamada de vuelta a un número ya guardado para cualquier petición urgente de transferencia, la regla de los 3 minutos de pausa y un escáner de URL que bloquee las invitaciones falsificadas de Zoom y Teams antes incluso de que arranque la reunión.
El viernes por la tarde en que Daniel envió la transferencia
Daniel trabaja en una firma de arquitectura mediana de Chicago. Unas 180 personas repartidas en tres oficinas. Clientes sobre todo del sector público, algo comercial. Tiene 34 años, lleva seis en la firma y se ocupa de operaciones y finanzas en el día a día. Reporta a Maria, la CFO. Maria reporta a Karim, el CEO. La cadena de mando es corta e informal. La gente se envía mensajes. La gente se hace ping en Slack. La gente entra y sale de los despachos. Esa es la cultura de la firma.
Un viernes de finales de febrero, a las 2:54 de la tarde hora del centro, le suena Slack a Daniel. Es Maria. El mensaje dice: "Zoom rápido sobre una transferencia para el acuerdo de adquisición en Singapur. Únete ya. Karim ya está dentro. Tenemos que cerrarlo antes del fin del día". Debajo, un enlace de Zoom. El enlace pone zoom.us/j/82547... seguido de una larga cadena de números. Daniel no se fija en el prefijo. El mensaje viene de la cuenta de Slack de Maria, con su foto de perfil, con su estilo habitual de frases cortas ("Únete ya", sin punto final, exactamente como ella escribe siempre).
Daniel hace clic en el enlace. Zoom se abre. Dos recuadros de vídeo. La cara de Maria, arriba a la izquierda. La cara de Karim, arriba a la derecha. Ambos asienten ligeramente. La voz de Maria sale por los altavoces, algo comprimida, algo ahogada, con ese sonido al que siempre suena Zoom. "Hola Daniel, gracias por entrar. Es rápido. La firma de ingeniería de Singapur de la que veníamos hablando, la pequeña adquisición, los abogados cerraron el depósito esta tarde y el vendedor quiere el anticipo antes del fin del día o se cae el acuerdo. Karim, ¿quieres añadir algo?".
La cara de Karim en el recuadro de la derecha gira ligeramente. Abre la boca y entra el audio. "Sí, Daniel, esto va con prisa. Ya sé que es raro, pero llevamos dos meses hablándolo internamente, el consejo lo aprobó la semana pasada. Manda la transferencia hoy. Quinientos ochenta mil al agente de depósito. Maria tiene las instrucciones bancarias, las pega ahora mismo en el chat del Zoom".
Daniel dice "Vale, sí, sin problema". Ha hecho decenas de transferencias bajo la dirección de Maria. La cantidad es alta, pero no se sale del rango de trabajo de la firma. Maria pega las instrucciones bancarias en el chat de Zoom. Nombre del beneficiario. Código SWIFT. Número de cuenta. Banco en Singapur. Daniel hace captura del chat para sus propios archivos, dice "Anotado, la mando ya" y la reunión termina en unos cuatro minutos en total.
Daniel va a su mesa. Entra en el portal bancario de la firma. Rellena los campos del beneficiario. Teclea 580.000,00 dólares. Pulsa la confirmación por SMS al móvil del doble factor (la firma lo exige para cualquier transferencia por encima de los 50.000). La transferencia sale a las 3:11 de la tarde hora del centro. El número de confirmación cae en su correo. Lo reenvía a Maria por Slack con un emoji de pulgar arriba. Ella responde con un corazón. Daniel cierra el portátil a las 5:30 de la tarde y se va a casa para el fin de semana.
El lunes por la mañana, a las 9:08, la verdadera Maria pasa por delante del despacho de Daniel camino de la cafetera. Asoma la cabeza. "Eh, ¿qué tal el finde? ¿Salió algo el viernes que deba saber?". Daniel dice: "Sí, la transferencia a Singapur, todo bien, la confirmación te llegó al correo". La cara de Maria hace algo extraño. Ladea la cabeza. "¿Transferencia a Singapur?". Daniel insiste: "La adquisición. El depósito. Tú y Karim estabais en el Zoom el viernes por la tarde". Maria contesta: "¿Qué Zoom?".
Daniel siente que el suelo se inclina. Abre Slack. Baja hasta el viernes a las 2:54 de la tarde. El mensaje sigue ahí. El enlace de Zoom sigue ahí. Lo pincha. El enlace ahora da un 404, la reunión ha desaparecido, la sala nunca existió dentro del espacio de Zoom licenciado de la firma. Baja por los mensajes enviados reales de Maria en Slack. El mensaje de las 2:54 no está en su historial. Solo aparece en la vista que tiene Daniel de la conversación, enviado desde una sesión que ya no se puede identificar.
Karim entra dos minutos después porque Maria ya le ha avisado. Los tres están de pie en el despacho de Daniel a las 9:14 del lunes intentando reconstruir lo ocurrido. Karim dice: "El viernes a las 3 de la tarde estaba en un vuelo, sin internet, desde luego no en un Zoom". Maria abre el panel de administración de Slack. Hay una sesión del viernes por la tarde, iniciada desde una dirección IP que no reconoce. La seguridad de Slack la marcó y le envió un correo, pero el correo cayó en la pestaña de promociones por cómo venía maquetado. No lo había visto.
Llega el director de IT de la firma. Empieza a tirar de los registros. La cuenta de Slack se había comprometido el martes anterior, seis días antes, por lo que parece un correo de phishing OAuth en el que Maria hizo clic (un aviso falso de "confirmación de migración del workspace de Slack"). El atacante llevaba seis días leyendo en silencio las conversaciones de Slack, aprendiendo el tono de la firma, las personas en las que confiaba Daniel, las horas del día en las que solían salir las transferencias, la forma de escribir de Maria y los proyectos que mencionaba Karim. Para el viernes, el atacante tenía todo lo necesario para montar una videollamada de cuatro minutos con dos caras sintéticas asintiendo a un guion.
La llamada de Zoom del viernes se había alojado en un workspace zoom-meet.us/j/82547..., no en zoom.us/j/82547. El cerebro de Daniel hizo coincidir los primeros cuatro caracteres y dejó de mirar. El vídeo deepfake de Maria y Karim se había generado a partir de clips disponibles en abierto. Maria había dado una charla de doce minutos en un webinar de una conferencia del sector seis meses antes, en YouTube, con imagen nítida de su cara desde tres ángulos. Karim tenía una charla TEDx de hacía dos años. Ambos tenían vídeos en LinkedIn. Todo ello dio al atacante material más que suficiente para entrenar un modelo de face-swap en tiempo real. Las voces se clonaron a partir de esos mismos vídeos de YouTube en menos de 90 segundos cada una.
580.000 dólares aterrizaron en un banco corresponsal de Singapur a las 3:12 de la tarde hora del centro del viernes, se reenviaron a un segundo banco en otra jurisdicción a las 4:30 del mismo día y se trocearon en nueve transferencias más pequeñas, repartidas por ocho jurisdicciones distintas, durante el fin de semana. El banco de la firma intentó retroceder la transferencia el lunes por la mañana. El primer banco intermedio de Singapur dijo que los fondos ya se habían movido. La postura de recuperación pasó rápidamente a ser "denunciar a las autoridades, presentar el parte al seguro, informar al consejo".
El consejo se reunió el miércoles. El consejero que llevaba un año empujando a la firma para formalizar una norma de devolución de llamada en las transferencias miró a Karim y le dijo: "De esto ya hablamos en abril".
Cómo funciona en realidad el ataque deepfake en Zoom
El caso Arup, el intento contra WPP y el escenario compuesto de Daniel siguen todos la misma cadena de cinco pasos. La mecánica es ya de dominio público. Las cifras no son teóricas.
- Paso 1, punto de apoyo vía cuenta de colaboración. El atacante compromete una cuenta de Slack, Microsoft Teams o Google Workspace de alguien del equipo financiero o ejecutivo. El vector típico es un aviso de consentimiento OAuth que parece una migración rutinaria del workspace o una solicitud normal de permisos de una app. El usuario pulsa "Autorizar" y el atacante se queda con un token de actualización que le permite leer todos los mensajes y canales a los que tiene acceso la víctima. El compromiso suele pasar desapercibido entre una y tres semanas.
- Paso 2, reconocimiento. El atacante observa en silencio los patrones de comunicación. Quién autoriza transferencias. Qué lenguaje usa el CFO. A qué hora de la semana suelen salir las transferencias. Qué acuerdos son reales, cuáles son rumores y qué aprobaciones del consejo existen. También recoge vídeos disponibles públicamente de los ejecutivos en YouTube, LinkedIn, grabaciones de conferencias y entrevistas a prensa. Sesenta segundos de cara limpia y noventa segundos de voz limpia bastan para entrenar un deepfake en tiempo real.
- Paso 3, el disparador urgente. El atacante, haciéndose pasar por el CFO desde dentro de la cuenta de Slack o Teams comprometida, envía un mensaje a alguien del equipo de finanzas: "Videollamada rápida sobre una transferencia confidencial. Únete ya". Se incluye un enlace de Zoom o Teams. El enlace es un dominio parecido al real (zoom-meet.us, zoorn.us, teams-microsoft-365.com, meet-google.us) que aloja una sala de vídeo real controlada por el atacante. El mensaje de Slack, en cambio, viene de una cuenta interna real y verificada, lo que neutraliza casi toda la sospecha del tipo "¿esto es realmente de mi CFO?".
- Paso 4, la videollamada. El objetivo se une. Uno o más recuadros de vídeo deepfake reproducen caras sintéticas del CFO, el CEO o miembros del consejo. Las caras asienten, parpadean, miran fuera de cámara y hablan con voces clonadas que coinciden con las características reales de los ejecutivos. La llamada es corta, de tres a siete minutos. El guion va apretado. Las instrucciones bancarias se pegan en el chat. Se pide al objetivo que confirme verbalmente y proceda.
- Paso 5, la transferencia y el movimiento lateral. El objetivo ejecuta la transferencia desde el portal bancario de la firma. Los fondos aterrizan en un banco corresponsal en Hong Kong, Singapur, Emiratos Árabes Unidos u otra jurisdicción donde el movimiento lateral rápido es posible. En dos a cuatro horas, los fondos se reparten entre varias cuentas beneficiarias en otras jurisdicciones y después se filtran a través de sociedades pantalla con apariencia legítima. Para el lunes por la mañana el rastro ya está frío.
Toda la cadena le lleva al atacante unas tres semanas de reconocimiento y cuatro minutos de actuación en vídeo. El objetivo invierte alrededor de once minutos entre el ping de "Únete ya" en Slack y la confirmación de la transferencia. El banco no puede retroceder la transferencia tras el primer salto jurisdiccional. El seguro cubre parte, a veces. La reunión del consejo siempre es dura.
Por qué las defensas pensadas solo para la voz no ven el deepfake en vídeo
Hasta 2023, la defensa estándar contra el "vishing" o suplantación del CEO era: si suena urgente en una llamada de teléfono, devuelve la llamada a un número que ya conozcas. Ese consejo sigue funcionando para la suplantación solo de audio. Sin embargo, el caso Arup dejó claro que, en el momento en que añades un recuadro de vídeo con una cara familiar asintiendo, el cerebro deja de hacerse la pregunta "¿es realmente mi CFO?".
El informe Pindrop Voice Intelligence del cuarto trimestre de 2024 detectó que los ataques con voz deepfake contra bancos crecieron en torno a un 350 por ciento respecto al año anterior y que el coste medio de un ataque de voz deepfake con éxito para una institución financiera rondó los 600.000 dólares en 2024. Pindrop también señaló que los ataques ya no son mayoritariamente solo audio. El deepfake en vídeo sobre Zoom o Teams es ahora la variante más peligrosa, porque las señales humanas de confianza (contacto visual, movimiento de cabeza, microexpresiones) pesan mucho más que la voz por sí sola.
El Center for Financial Services de Deloitte proyectó en su informe de perspectivas de 2024 que el fraude impulsado por deepfakes podría provocar pérdidas en torno a los 40.000 millones de dólares solo en Estados Unidos para 2027, frente a unos 12.000 millones de 2023, lo que supone una tasa de crecimiento anual compuesta por encima del 30 por ciento. El informe de Tendencias en Identidad de 2024 del Identity Theft Resource Center señaló el fraude por identidad sintética (muy ligado al fraude habilitado por deepfakes) como una de las categorías de mayor crecimiento del año.
El cerebro confía en las caras. Esa es toda la vulnerabilidad. Un recuadro de vídeo con una cara conocida asintiendo se trata como autenticación, aunque no haya habido ninguna autenticación real.
Para el hermano gemelo solo de audio de este ataque, consulta nuestra cobertura sobre estafas de arresto falso con clonación de voz y sobre ataques de vishing con clonación de voz por IA para ver la versión de consumo de la misma tecnología que aquí se usa a escala ejecutiva.
El caso Arup en Hong Kong y lo que aprendimos
En febrero de 2024, Arup, la firma global británica de ingeniería más conocida por la Ópera de Sídney y el Centro Acuático de los Juegos Olímpicos de Pekín, perdió el equivalente a unos 25 millones de dólares (200 millones de dólares de Hong Kong) desde su oficina de Hong Kong por un ataque de videoconferencia con deepfakes. La historia, publicada primero por el South China Morning Post en febrero de 2024 y confirmada después por una portavoz de Arup a varios medios entre ellos el Financial Times y la CNN, se desarrolló así.
Una empleada del área financiera de Arup en Hong Kong recibió un correo que decía venir del CFO de la firma con sede en el Reino Unido, en el que se solicitaba una operación confidencial. La empleada se mostró inicialmente escéptica y lo señaló como posible intento de phishing. Acto seguido, el supuesto CFO la invitó a una videoconferencia. En la llamada, la empleada vio y oyó a lo que parecía ser el CFO y a varios otros directivos sénior de Arup, todos en cámara, todos hablando con sus voces habituales.
La empleada procedió a realizar 15 operaciones a varias cuentas bancarias en Hong Kong, por un total cercano a los 200 millones de dólares de Hong Kong (unos 25 millones de dólares estadounidenses a la cotización del momento). Cuando más tarde consultó con la oficina central, Arup confirmó que no se había autorizado ninguna de esas operaciones. Cada "persona" en aquella videollamada, salvo la propia empleada, era un deepfake.
La Policía de Hong Kong confirmó posteriormente en una rueda de prensa que se trataba de uno de los mayores casos de fraude financiero impulsado por deepfakes que habían investigado nunca. Las detenciones que siguieron en Hong Kong se quedaron en un pequeño número de mulas de dinero, pero los operadores técnicos detrás de los deepfakes nunca se identificaron públicamente.
La portavoz de Arup dijo después que "la estabilidad financiera y las operaciones de negocio" de la firma "no se vieron afectadas" por la pérdida, pero reconoció la lección de fondo: "Como tantas otras empresas en el mundo, nuestras operaciones están sujetas a ataques regulares, incluido el fraude de facturas, las estafas de phishing, la suplantación por voz en WhatsApp y los deepfakes". Esa última palabra, en un comunicado corporativo, fue una primicia silenciosa.
El intento de deepfake al CEO de WPP en mayo de 2024
Tres meses después de la pérdida de Arup, Mark Read, CEO de WPP, fue el objetivo de un intento de deepfake que se cazó antes de que se moviera ningún dinero. The Guardian y el Financial Times informaron en mayo de 2024 de que los atacantes clonaron una imagen pública de Read, montaron una cuenta falsa de WhatsApp usando esa imagen y, a continuación, organizaron una reunión de Microsoft Teams entre el falso Read, otro alto directivo de WPP y un tercer objetivo presentado como "líder de agencia".
En la llamada de Teams los atacantes reprodujeron un clip de YouTube con la voz de Read y usaron otra ventana de chat para teclear mensajes haciéndose pasar por él. El guion intentaba sonsacar al directivo objetivo datos personales y dinero en relación con una falsa nueva línea de negocio. El objetivo se mostró suspicaz durante la llamada y el intento fracasó. El CEO Mark Read envió después un memorándum a la compañía agradeciendo al equipo y avisando del auge de la suplantación de ejecutivos con deepfakes.
Dos detalles importantes sobre WPP que lo hacen útil como caso de estudio para la defensa. Primero, el ataque usó una reunión real en un entorno real de Microsoft Teams. La señal de confianza de "la reunión está en nuestro Teams" no atrapó esto. Segundo, el objetivo detectó el fraude por desajuste de patrón (el "CEO" pedía información personal de una forma en la que el verdadero CEO nunca lo hacía), no por ninguna detección técnica. El reconocimiento humano de patrones sigue siendo la capa de defensa más fuerte cuando fallan las capas técnicas.
Lo que dicen los informes de 2024 y 2025 sobre el fraude con deepfakes a escala
No se trata de un patrón de ataque anecdótico. Los datos oficiales más recientes muestran que escala rápido.
- Informe IC3 del FBI 2024 (publicado en abril de 2025): el Business Email Compromise (BEC) y el fraude por suplantación de ejecutivos asociado generaron pérdidas declaradas de aproximadamente 2.900 millones de dólares en 2024 sobre 21.489 denuncias solo en esa categoría. Las pérdidas totales declaradas al IC3 en todas las categorías alcanzaron los 16.600 millones de dólares, un 33 por ciento más interanual.
- Pindrop Voice Intelligence Q4 2024: los ataques con voz deepfake contra bancos e instituciones financieras subieron alrededor de un 350 por ciento interanual. La pérdida media por incidente exitoso rondó los 600.000 dólares. El informe avisa de que los deepfakes con vídeo y voz sobre Zoom y Teams están creciendo más rápido que los de solo audio.
- Deloitte Center for Financial Services 2024: proyectó que las pérdidas por fraude con deepfakes en Estados Unidos podrían alcanzar los 40.000 millones de dólares en 2027, frente a unos 12.000 millones en 2023, lo que supone una tasa de crecimiento anual compuesta superior al 30 por ciento.
- Informe de Tendencias en Identidad 2024 del Identity Theft Resource Center (enero de 2025): el fraude por identidad sintética (a menudo la capa por debajo de la suplantación con deepfakes) figura como una de las categorías de mayor crecimiento en 2024, en particular en casos de toma de control de cuentas corporativas y suplantación de ejecutivos.
- Group-IB Threat Intelligence 2024 y reportes de SentinelOne: documentan varios kits de "deepfake como servicio" vendidos en foros clandestinos a lo largo de 2024, que bajan tanto el listón técnico que operadores sin ningún conocimiento de machine learning pueden montar ataques en videollamada por unos pocos cientos de dólares por objetivo.
Una cifra para recordar: 25 millones de dólares perdidos por una sola firma en una sola tarde. Esa fue la cifra pública de Arup. El próximo caso no llevará el nombre de una sola firma asociado, pero casi con toda seguridad implicará una cuenta de Slack o Teams comprometida semanas antes y una videollamada que pareció completamente normal.
Instala SafeBrowz para bloquear enlaces falsificados de Zoom y Teams
La primera capa de defensa es asegurarse de que el enlace falso de la reunión nunca llegue a abrirse. Una URL real de Zoom empieza por zoom.us o por el subdominio específico de Zoom de tu empresa. Una URL real de Teams empieza por teams.microsoft.com. Cualquier otra cosa (zoom-meet.us, zoorn.us, zoom-conf.com, teams-microsoft-365.com, microsoft-teams-meeting.org, meet-google.us) es un disfraz.
SafeBrowz es una extensión gratuita de navegador para Chrome, Firefox y Edge que analiza cada URL que pulsas contra una base de datos de más de 550 marcas, APIs de inteligencia de amenazas en tiempo real y una capa de IA de contenido para los disfraces recién creados que ninguna lista negra ha cazado aún. Zoom, Microsoft Teams, Google Meet, Webex y el resto de marcas grandes de videoconferencia están en la base de datos. Cuando llega un ping de Slack con un enlace de "Únete ya" a zoom-meet.us, la extensión intercepta el clic y muestra una pantalla roja de advertencia antes de que cargue la sala falsa de Zoom. La videollamada deepfake de cuatro minutos nunca llega a ocurrir.
Esta es la capa barata y rápida. Corre en el navegador, no cuesta nada y funciona sobre cualquier enlace que pulses en Slack, Teams, correo o cualquier otro sitio.
Verifica cualquier transferencia urgente por un segundo canal
La capa de URL caza la mayoría de los enlaces falsificados. Sin embargo, "la mayoría" deja un hueco. Un atacante sofisticado puede comprometer una cuenta real dentro de tu firma y enviar un enlace de Zoom perfectamente válido a una sala real que él controla, con recuadros de vídeo deepfake dentro. La capa de URL ya no ayuda una vez estás dentro de una sala real de Zoom con caras sintéticas.
La segunda capa es procedimental. Ante cualquier petición urgente de transferencia, sea quien sea quien la pida y por muy convincente que haya sido el vídeo, cuelga o cierra la reunión y devuélvele la llamada a quien lo solicita en un número de teléfono que ya tengas guardado en tus contactos. No un número del chat. No un número de la firma del correo. El número de teléfono que habrías usado la semana pasada antes de que nada de esto empezara.
Este es el control de mayor valor por sí solo. Cualquier caso documentado de fraude del CEO con deepfake en 2024 se habría detenido con una llamada de vuelta de 30 segundos a un número conocido. La empleada de Arup. La cadena de transferencias de Hong Kong. El intento contra WPP (que efectivamente se frenó, en parte gracias a una verificación de tipo devolución de llamada). Las llamadas de vuelta funcionan porque el atacante deepfake controla el canal entrante, pero no tu agenda. No puede interceptar una llamada que tú inicias a un número ya guardado.
Mete la llamada de vuelta dentro de la política de transferencias de tu firma. Cualquier transferencia por encima de los 25.000 dólares, la pida quien la pida, exige que quien la ejecuta devuelva la llamada a quien la solicita usando un número del directorio de la empresa. Documéntalo. Entrena sobre ello. Hazlo aburrido y rutinario. Lo aburrido es justo el objetivo. Una llamada de vuelta de 90 segundos es la diferencia entre 0 dólares perdidos y 580.000 enviados a Singapur.
La regla de los 3 minutos de devolución de llamada
Ante cualquier petición urgente de dinero que llegue por cualquier canal (Slack, Teams, correo, videollamada, WhatsApp, SMS o teléfono) la regla es: pausa tres minutos, devuelve la llamada a un número ya guardado y solo entonces procede.
Los tres minutos se sienten artificiales cuando el "CFO" del recuadro de vídeo te está diciendo que el vendedor se va si el depósito no llega antes del fin del día. Esa pausa, por artificial que parezca, es la defensa entera. Un negocio urgente real no necesita en realidad menos de tres minutos de verificación. Un CFO real, al saber que quien va a ejecutar la operación va a pausar para llamarle y confirmarle, diría "bien, claro, llámame". Un CFO deepfake o cortaría la llamada, o te presionaría para seguir, o ambas cosas. La presión para saltarse la devolución de llamada es la señal de alarma más clara de todo el ataque.
La regla de los 3 minutos casa de forma natural con los consejos estándar para patrones de ataque relacionados. Para el fraude por transferencia bancaria con suplantación de ejecutivos en general, consulta las estafas de whaling y la transferencia del falso CEO. Para el reconocimiento en LinkedIn que casi siempre precede a un ataque deepfake, consulta spear phishing y perfilado en LinkedIn.
Señales de alerta durante una videollamada
Si ya estás dentro de una videollamada y empiezas a dudar si las caras son reales, conviene conocer estas señales. Ninguna es perfecta por sí sola. Dos o tres juntas son una pista fuerte.
- Sincronización labial ligeramente desfasada. El vídeo deepfake ha mejorado mucho, pero los modelos de face-swap en tiempo real aún se desvían entre 30 y 80 milisegundos en las consonantes difíciles. Si algo te chirría en el tiempo del habla, hazle caso a esa sensación.
- Perfil lateral limitado. La mayoría de modelos deepfake renderizan la cara limpia de frente, pero sufren cuando la cabeza gira más de unos 30 grados respecto al centro. Pide a la persona que gire la cabeza y mire a algo a su derecha o a su izquierda.
- Mano delante de la cara. Los deepfakes en tiempo real se rompen o parpadean cuando una mano pasa por delante de la cara. Pide a la persona que salude con la mano, que se rasque la nariz o que levante un dedo.
- Superficies reflectantes y gafas. Los reflejos en las gafas y en los pendientes brillantes siguen siendo difíciles para los modelos deepfake. Si las gafas se ven raramente mates o la luz sobre ellas no encaja con la sala, tómatelo en serio.
- Sin comportamiento espontáneo fuera de guion. Los deepfakes funcionan mejor con discurso guionizado. Haz una pregunta fuera de guion que solo la persona real podría responder. "¿Qué tal va la temporada de voleibol de tu hija?" funciona mejor que "¿cuál es el nombre de nuestra empresa?".
- La llamada no se puede mover. Si propones colgar y reconectar por otra plataforma, o pasar a una llamada de teléfono a un número guardado, y la persona se resiste con fuerza, esa presión por permanecer en el canal que él controla es por sí sola la señal de alarma más fuerte.
- Presión para no parar. Los CFO y CEO reales aceptan devoluciones de llamada. Los atacantes deepfake no pueden permitirse ese tiempo. Si la urgencia se siente diseñada para impedir una llamada de vuelta, casi con toda seguridad lo está.
Qué hacer si caíste
Si al leer esto reconoces un momento de las últimas semanas en tu firma, esta es la jugada para las primeras 24 horas.
- Llama al banco de tu firma de inmediato. Diles que hay una transferencia fraudulenta y que necesitas abrir una solicitud de retroceso ya. La velocidad importa. Las primeras 4 a 8 horas son la única ventana realista de recuperación.
- Congela la cuenta de origen. Cierra cualquier transferencia adicional desde la cuenta de la que salió la fraudulenta hasta que tu equipo de IT haya confirmado qué credenciales están comprometidas.
- Restablece credenciales de todas las plataformas de colaboración. Fuerza el restablecimiento de contraseñas y el cierre de sesiones en Slack, Microsoft Teams, Google Workspace y cualquier otra plataforma compartida. Revoca los tokens OAuth de todas las apps de terceros, ya que el punto de apoyo original probablemente fue un consentimiento OAuth.
- Activa a tu aseguradora cibernética. La mayoría de pólizas cibernéticas empresariales exigen notificación dentro de una ventana corta (a menudo de 24 a 72 horas) de cualquier incidente conocido. Notificar tarde puede anular la cobertura.
- Denuncia en el Internet Crime Complaint Center del FBI en ic3.gov. El FBI a veces puede iniciar un proceso de Financial Fraud Kill Chain con los bancos corresponsales si la denuncia entra dentro de las 72 horas. Esto ha recuperado fondos en casos previos de BEC. Presenta la denuncia el mismo día.
- Contrata respuesta a incidentes externa. Si tu firma no tiene un equipo interno de DFIR, contrata a una firma externa (Mandiant, CrowdStrike Services, Unit 42, Kroll o similar) para una revisión forense completa de la cuenta comprometida. Entender a qué otros datos accedió el atacante es esencial.
- Informa al consejo y a legal. Documenta todo por escrito. El consejo tiene que enterarse en menos de 24 horas. Legal debe valorar las obligaciones de divulgación bajo las normas de la SEC (para cotizadas), las notificaciones del RGPD o las leyes estatales de filtración de datos.
Cómo denunciar un intento de fraude con deepfake
Aunque no se mueva ni un dólar, denuncia el intento. Cada denuncia refuerza el registro público y ayuda a la siguiente firma.
- FBI IC3 en ic3.gov. Presenta un informe completo. Incluye la URL falsa de Zoom o Teams, las marcas de tiempo, las muestras del vídeo deepfake si las guardaste, la cuenta comprometida y los datos de la transferencia si los hubo.
- FTC en reportfraud.ftc.gov. Alimenta la base de datos Consumer Sentinel Network consultada por las fuerzas del orden.
- Tu oficina local del FBI. Para pérdidas por encima de unos pocos cientos de miles de dólares, una llamada directa al escuadrón cibernético de la oficina local del FBI a veces consigue tracción más rápida que una denuncia online en IC3 por sí sola.
- CISA en cisa.gov/report. Si tu firma está en un sector de infraestructura crítica (energía, agua, finanzas, defensa, salud).
- APWG en reportphishing@apwg.org. Si el compromiso inicial fue un correo de phishing OAuth, reenvía el correo original. Suma la URL a la lista negra global antiphishing.
- Equipos de abuso de Microsoft y Zoom. Reporta la URL falsa de reunión a abuse@zoom.us y a Microsoft a través del flujo de notificación del admin de Teams. Ambos proveedores tumban activamente las salas de conferencia falsificadas.
Última actualización 2026-05-30
Cómo SafeBrowz bloquea esta amenaza
SafeBrowz utiliza una arquitectura de detección de 3 capas: Local + APIs + IA.
- Capa 1, Detección local: más de 60 patrones de URL y más de 550 firmas específicas de marca corren directamente en tu navegador. Esta es la capa que caza zoom-meet.us, zoorn.us, teams-microsoft-365.com, meet-google.us y otros dominios falsificados de videoconferencia en el momento del clic, antes de que cargue la sala falsa. Zoom, Microsoft Teams, Google Meet, Webex, GoToMeeting y las demás grandes marcas de conferencia están horneados dentro de la propia extensión.
- Capa 2, Verificación con APIs: referencias cruzadas con Google Safe Browsing, PhishTank y URLhaus se ejecutan en el servidor. Atrapa URLs de reunión maliciosas conocidas en el momento en que se reportan en cualquier parte del mundo, incluidos los dominios falsificados desechables que se queman y se reconstruyen cada pocas horas.
- Capa 3, Análisis IA profundo (Premium): el análisis de contenido marca páginas falsificadas recién creadas de Zoom y Teams que ninguna lista negra ha visto aún. La pantalla falsa de consentimiento OAuth de Microsoft 365 que se publicó hace dos horas y que se está usando como punto de apoyo para el ataque deepfake al CEO del mes que viene. La nueva página de "migración del workspace de Slack". Funciona en más de 100 idiomas.
Las firmas de detección se derivan de investigación de inteligencia de amenazas y de nuestra base de datos interna de marcas, no de datos de navegación del usuario. SafeBrowz no almacena historial de navegación por usuario.
Bloquea las páginas falsificadas de Zoom, Teams y consentimiento OAuth antes de que carguen
SafeBrowz es una extensión gratuita de navegador para Chrome, Firefox y Edge que bloquea enlaces falsos de videoconferencia, pantallas falsas de consentimiento OAuth y sitios falsificados de plataformas de colaboración antes de que carguen. Más de 550 marcas en la base de datos, incluidas Zoom, Microsoft Teams, Google Meet, Slack, Webex y los grandes bancos. El análisis de contenido con IA caza falsificaciones recién creadas en más de 100 idiomas. Gratis para siempre, sin cuenta. Comprueba primero cualquier URL en el verificador gratuito de URL.
Preguntas frecuentes
¿De verdad se puede suplantar a un CEO en una llamada de Zoom en directo en 2026?
Sí. Los modelos de face-swap y clonación de voz en tiempo real llevan siendo lo bastante buenos desde finales de 2023 como para renderizar suplantaciones convincentes de ejecutivos en videollamadas cortas. La pérdida de Arup en febrero de 2024 (unos 25 millones de dólares) y el intento contra el CEO de WPP en mayo de 2024 son confirmaciones públicas. Sesenta segundos de vídeo limpio de la cara y noventa segundos de voz limpia son material de partida suficiente para entrenar un deepfake en tiempo real. La mayoría de ejecutivos con perfil público tienen mucho más que eso en YouTube, LinkedIn y grabaciones de conferencias. La parte difícil ya no es el deepfake en sí. La parte difícil es conseguir primero un punto de apoyo en la plataforma de colaboración de la firma objetivo.
¿Cómo funcionó en realidad el ataque deepfake a Arup?
Según informaciones del South China Morning Post de febrero de 2024 y confirmaciones de Arup al Financial Times y la CNN, una empleada del área financiera de Arup en Hong Kong recibió un correo de phishing que decía venir del CFO de la firma con sede en el Reino Unido. La empleada se mostró escéptica al principio. Después, el supuesto CFO la invitó a una videoconferencia. En la llamada, la empleada vio y oyó al CFO y a otros directivos sénior, todos en cámara, todos hablando. La empleada procedió a realizar 15 operaciones por un total cercano a los 200 millones de dólares de Hong Kong (unos 25 millones de dólares estadounidenses). Cada "persona" en la videollamada, salvo la propia empleada, era un deepfake. La Policía de Hong Kong dijo después que era uno de los mayores casos de fraude habilitado por deepfakes que habían investigado.
¿Una llamada de vuelta habría detenido el ataque a Arup?
Sí, casi con toda seguridad. La empleada del caso Arup ya había marcado el correo inicial como sospechoso antes de unirse a la videollamada. Una simple llamada de vuelta de 60 segundos al CFO real del Reino Unido a un número del directorio de la empresa habría dejado claro que el CFO no estaba en ninguna de esas reuniones. Las llamadas de vuelta funcionan porque el atacante deepfake controla el canal entrante que él ofreció (el enlace de Zoom, la reunión de Teams), pero no tu lista de contactos. No puede interceptar una llamada saliente a un número que ya tienes guardado. Cualquier caso documentado de fraude del CEO con deepfake en 2024 se habría detenido con una llamada de vuelta de 30 segundos a un número conocido.
¿Qué fue el intento de deepfake al CEO de WPP?
En mayo de 2024, Mark Read, CEO de WPP, fue el objetivo de un intento de suplantación con deepfake que se cazó antes de que se perdiera dinero o datos. Los atacantes clonaron una imagen pública de Read, montaron una cuenta falsa de WhatsApp usando esa imagen y organizaron una reunión de Microsoft Teams con otro alto directivo de WPP. En la llamada los atacantes reprodujeron un clip de YouTube con la voz de Read y usaron otra ventana de chat para teclear mensajes haciéndose pasar por él. El directivo objetivo se mostró suspicaz durante la llamada (el "CEO" pedía información personal de una forma en la que el verdadero Read nunca lo hacía) y el intento fracasó. WPP confirmó el incidente a The Guardian y al Financial Times. Mark Read envió un memorándum a toda la compañía después avisando sobre la suplantación de ejecutivos con deepfakes.
¿A qué velocidad están creciendo los ataques con deepfakes?
Rápido. El informe Pindrop Voice Intelligence del cuarto trimestre de 2024 detectó que los ataques con voz deepfake contra bancos crecieron alrededor de un 350 por ciento interanual. Deloitte proyectó que las pérdidas por fraude con deepfakes en Estados Unidos podrían alcanzar los 40.000 millones de dólares en 2027, frente a unos 12.000 millones en 2023, lo que supone una tasa de crecimiento anual compuesta superior al 30 por ciento. El Informe sobre Delitos en Internet del FBI 2024 (abril de 2025) registró aproximadamente 2.900 millones de dólares en pérdidas por Business Email Compromise en el año, con una proporción significativa y creciente con componentes de vídeo y voz deepfake. Group-IB y SentinelOne documentaron kits de deepfake como servicio vendidos en foros clandestinos a lo largo de 2024 que bajan el listón técnico para montar este tipo de ataques.
¿Puede SafeBrowz detectar un vídeo deepfake dentro de una llamada de Zoom?
No. SafeBrowz es un escáner de seguridad de URLs. Impide que la sala falsa de la reunión cargue bloqueando URLs falsificadas de Zoom, Teams y Google Meet (zoom-meet.us, zoorn.us, teams-microsoft-365.com, meet-google.us) antes de que entres en la llamada. También bloquea las páginas de phishing por consentimiento OAuth que los atacantes usan para conseguir el primer punto de apoyo en la plataforma de colaboración de la firma semanas antes. SafeBrowz no analiza fotogramas de vídeo dentro de una llamada de Zoom en directo. Para eso necesitas las defensas procedimentales: la llamada de vuelta a un número guardado, la regla de los 3 minutos y las señales de alarma en llamada descritas más arriba (sincronización labial desfasada, perfil lateral limitado, resistencia a preguntas fuera de guion, presión por no parar).