OpusAudit: Herramienta de Análisis de Audios de WhatsApp
OpusAudit es una herramienta de ciberseguridad que desarrollé para identificar posibles filtraciones de información sensible en audios de WhatsApp. Utilizando IA y ADB, extrae audios de dispositivos Android y los analiza en busca de datos comprometedores.
Capturas de Pantalla

Interfaz principal de OpusAudit

Análisis de audios en progreso
El Problema: Audios de WhatsApp como Vector de Ataque
En consultoría de seguridad, descubrí que muchas personas comparten información sensible por audios de WhatsApp sin darse cuenta:
- Contraseñas dictadas a familiares
- Datos de tarjetas de crédito compartidos verbalmente
- Información bancaria mencionada en conversaciones casuales
- Códigos de autenticación leídos en voz alta
OpusAudit automatiza el proceso de auditoría de estos audios para identificar riesgos antes de que sean explotados.
¿Cómo Funciona?
1. Extracción de Audios con ADB
Utilizando Android Debug Bridge (ADB), OpusAudit se conecta al dispositivo y extrae los archivos .opus almacenados en:
Los audios se copian de forma segura al equipo local para análisis offline, preservando la privacidad.
2. Transcripción con Whisper AI
OpusAudit utiliza Whisper de OpenAI, un modelo de reconocimiento de voz de última generación:
- Precisión del 95%+ en español e inglés
- Funciona offline (modelo base incluido)
- Procesa formatos .opus nativamente
- Detecta automáticamente el idioma
3. Detección de Secretos
Una vez transcritos, los textos se analizan contra una lista de palabras clave configurables:
Palabras clave por defecto (Español):
tarjeta de crédito, contraseña, clave, usuario, banco, DNI, código, CVV, PIN
Palabras clave por defecto (English):
credit card, password, key, user, bank, SSN, code, CVV, PIN
Los usuarios pueden agregar palabras clave personalizadas según su contexto (nombres de empresas, proyectos confidenciales, etc.).
Interfaz Bilingüe con PyQt5
OpusAudit cuenta con una interfaz gráfica completa construida con PyQt5:
- Selector de idioma: Español / English en tiempo real
- Guía de configuración: Instrucciones para activar Depuración USB
- Detección automática de dispositivo: Indicador visual cuando ADB conecta
- Opciones de análisis: Todos los audios o últimos N audios
- Filtros personalizados: Agregar palabras clave separadas por coma
- Log en tiempo real: Progreso paso a paso del análisis
- Resultados destacados: Audios con secretos detectados
Stack Tecnológico
- Python: Lenguaje principal
- PyQt5: Framework para interfaz gráfica
- Whisper (OpenAI): Modelo de transcripción de audio
- ADB (Android Debug Bridge): Comunicación con dispositivo Android
- Threading: Procesamiento asíncrono para mantener UI responsiva
- OS/Subprocess: Ejecución de comandos ADB
Casos de Uso
1. Auditoría Personal de Seguridad
Usuarios pueden analizar sus propios audios para identificar información que podrían haber compartido inadvertidamente.
2. Consultoría de Ciberseguridad
Profesionales de seguridad pueden usar OpusAudit como parte de evaluaciones de riesgo en empresas, identificando malas prácticas de empleados.
3. Investigación Forense
En contextos legales, permite analizar conversaciones en busca de evidencia de fraude o filtración de datos.
Consideraciones Éticas y Legales
OpusAudit debe usarse ÚNICAMENTE en dispositivos propios o con consentimiento explícito. Analizar audios de terceros sin autorización es ilegal en la mayoría de jurisdicciones. Esta herramienta está diseñada para mejorar la seguridad personal y profesional, no para violar la privacidad.
Resultados del Análisis
OpusAudit genera dos archivos de salida:
Instalación y Requisitos
Requisitos:
- Python 3.8+
- Android con Depuración USB activada
- Cable USB para conexión
- ~2GB de espacio para modelo Whisper
Pasos de instalación:
2. pip install -r requirements.txt
3. python opusaudit.py
💡 Desafío Técnico Resuelto
El mayor desafío fue mantener la interfaz responsiva durante el procesamiento con Whisper, que puede tardar varios minutos en dispositivos sin GPU. La solución fue usar threading para ejecutar Whisper en segundo plano mientras la UI muestra progreso en tiempo real a través de QTimer y signals.
Roadmap y Mejoras Futuras
- ✅ Transcripción con Whisper AI
- ✅ Interfaz bilingüe (Español/English)
- ✅ Detección de palabras clave configurables
- 🔄 Soporte para análisis de audios de Telegram
- 📋 Exportar reportes en PDF con nivel de riesgo
- 🌐 Detección de entidades con NLP (NER) para identificar nombres, fechas, lugares
- 🔐 Cifrado de archivos de salida con contraseña
Enlaces del Proyecto
¿Encontraste un bug o tienes una sugerencia? Abre un issue en GitHub. Recuerda usar esta herramienta de forma ética y legal.