Todos sabemos que el filtro antispam de Google es realmente efectivo, aunque siempre es aconsejable echar un vistazo de vez en cuando por si ha caído algo allí que no era precisamente spam.
Según Google, Gmail protege el correo entrante contra spam, intentos de phishing y malware usando modelos de aprendizaje automático que bloquean más del 99.9% de las amenazas, pero ese 0,1 restante puede hacer mucho daño.
En su blog han dado más detalles sobre como funciona su escáner de malware, una tecnología que que procesa más de 300 mil millones de archivos adjuntos cada semana.
El 63% de los documentos maliciosos que bloqueamos difieren de un día a otro. Para adelantarnos a esta amenaza en constante evolución, recientemente agregamos una nueva generación de escáneres de documentos que dependen del aprendizaje profundo para mejorar nuestras capacidades de detección. Estamos compartiendo los detalles de esta tecnología y su éxito temprano esta semana en RSA 2020.
El escáner lo lanzaron hace pocas semanas, y desde entonces han conseguido detectar millones de documentos de Office que contienen scripts maliciosos. El nuevo escáner ha mejorado la tasa de detección en un 150%, por lo que ahora es más seguro recibir documentos office por email.
El sistema usa un modelo de aprendizaje profundo TensorFlow distinto, entrenado con TFX (TensorFlow Extended), y un analizador de documentos personalizado para cada tipo de archivo. Los analizadores de documentos son responsables de analizar el documento, identificar patrones de ataque comunes, extraer macros, desofuscar contenido y realizar la extracción de características.
Indican que los documentos maliciosos representan el 58% del malware dirigido a los usuarios de Gmail. Es decir, más de la mitad de los virus y otras amenazas que hay en nuestro email, se oculta dentro de documentos.
De momento solo usan esta tecnología para escanear documentos de Office, pero seguirán trabajando en ella.