Volver al blog
Proyectos6 min

OpusAudit: Herramienta de Análisis de Audios de WhatsApp

Conrado Gómez

OpusAudit es una herramienta de ciberseguridad que desarrollé para identificar posibles filtraciones de información sensible en audios de WhatsApp. Utilizando IA y ADB, extrae audios de dispositivos Android y los analiza en busca de datos comprometedores.

Capturas de Pantalla

Interfaz principal de OpusAudit

Interfaz principal de OpusAudit

Análisis de audios en progreso

Análisis de audios en progreso

El Problema: Audios de WhatsApp como Vector de Ataque

En consultoría de seguridad, descubrí que muchas personas comparten información sensible por audios de WhatsApp sin darse cuenta:

  • Contraseñas dictadas a familiares
  • Datos de tarjetas de crédito compartidos verbalmente
  • Información bancaria mencionada en conversaciones casuales
  • Códigos de autenticación leídos en voz alta

OpusAudit automatiza el proceso de auditoría de estos audios para identificar riesgos antes de que sean explotados.

¿Cómo Funciona?

1. Extracción de Audios con ADB

Utilizando Android Debug Bridge (ADB), OpusAudit se conecta al dispositivo y extrae los archivos .opus almacenados en:

/storage/emulated/0/Android/media/com.whatsapp/WhatsApp/Media/WhatsApp Voice Notes/

Los audios se copian de forma segura al equipo local para análisis offline, preservando la privacidad.

2. Transcripción con Whisper AI

OpusAudit utiliza Whisper de OpenAI, un modelo de reconocimiento de voz de última generación:

  • Precisión del 95%+ en español e inglés
  • Funciona offline (modelo base incluido)
  • Procesa formatos .opus nativamente
  • Detecta automáticamente el idioma

3. Detección de Secretos

Una vez transcritos, los textos se analizan contra una lista de palabras clave configurables:

Palabras clave por defecto (Español):

tarjeta de crédito, contraseña, clave, usuario, banco, DNI, código, CVV, PIN

Palabras clave por defecto (English):

credit card, password, key, user, bank, SSN, code, CVV, PIN

Los usuarios pueden agregar palabras clave personalizadas según su contexto (nombres de empresas, proyectos confidenciales, etc.).

Interfaz Bilingüe con PyQt5

OpusAudit cuenta con una interfaz gráfica completa construida con PyQt5:

  • Selector de idioma: Español / English en tiempo real
  • Guía de configuración: Instrucciones para activar Depuración USB
  • Detección automática de dispositivo: Indicador visual cuando ADB conecta
  • Opciones de análisis: Todos los audios o últimos N audios
  • Filtros personalizados: Agregar palabras clave separadas por coma
  • Log en tiempo real: Progreso paso a paso del análisis
  • Resultados destacados: Audios con secretos detectados

Stack Tecnológico

  • Python: Lenguaje principal
  • PyQt5: Framework para interfaz gráfica
  • Whisper (OpenAI): Modelo de transcripción de audio
  • ADB (Android Debug Bridge): Comunicación con dispositivo Android
  • Threading: Procesamiento asíncrono para mantener UI responsiva
  • OS/Subprocess: Ejecución de comandos ADB

Casos de Uso

1. Auditoría Personal de Seguridad

Usuarios pueden analizar sus propios audios para identificar información que podrían haber compartido inadvertidamente.

2. Consultoría de Ciberseguridad

Profesionales de seguridad pueden usar OpusAudit como parte de evaluaciones de riesgo en empresas, identificando malas prácticas de empleados.

3. Investigación Forense

En contextos legales, permite analizar conversaciones en busca de evidencia de fraude o filtración de datos.

Consideraciones Éticas y Legales

OpusAudit debe usarse ÚNICAMENTE en dispositivos propios o con consentimiento explícito. Analizar audios de terceros sin autorización es ilegal en la mayoría de jurisdicciones. Esta herramienta está diseñada para mejorar la seguridad personal y profesional, no para violar la privacidad.

Resultados del Análisis

OpusAudit genera dos archivos de salida:

audioleak.txt: Transcripción completa de todos los audios
secretleak.txt: Solo las líneas que contienen palabras clave detectadas

Instalación y Requisitos

Requisitos:

  • Python 3.8+
  • Android con Depuración USB activada
  • Cable USB para conexión
  • ~2GB de espacio para modelo Whisper

Pasos de instalación:

1. git clone https://github.com/OOMrConrado/OpusAudit
2. pip install -r requirements.txt
3. python opusaudit.py

💡 Desafío Técnico Resuelto

El mayor desafío fue mantener la interfaz responsiva durante el procesamiento con Whisper, que puede tardar varios minutos en dispositivos sin GPU. La solución fue usar threading para ejecutar Whisper en segundo plano mientras la UI muestra progreso en tiempo real a través de QTimer y signals.

Roadmap y Mejoras Futuras

  • ✅ Transcripción con Whisper AI
  • ✅ Interfaz bilingüe (Español/English)
  • ✅ Detección de palabras clave configurables
  • 🔄 Soporte para análisis de audios de Telegram
  • 📋 Exportar reportes en PDF con nivel de riesgo
  • 🌐 Detección de entidades con NLP (NER) para identificar nombres, fechas, lugares
  • 🔐 Cifrado de archivos de salida con contraseña

Enlaces del Proyecto

¿Encontraste un bug o tienes una sugerencia? Abre un issue en GitHub. Recuerda usar esta herramienta de forma ética y legal.

Tags:#Python#PyQt5#Ciberseguridad#Whisper AI

¿Te gustó este artículo?

Descubre más artículos sobre QA, Testing, Scrum y mejores prácticas de desarrollo.

Ver todos los artículos

© 2025 Conrado Gómez. All rights reserved.

Conrado Gómez | Software Developer