Entropía de Expectativa: Una Nueva Métrica para la Evaluación de la Fortaleza de Contraseñas

1. Introducción y Motivación

Este artículo presenta la Entropía de Expectativa, una nueva métrica diseñada para estimar la fortaleza de contraseñas aleatorias o similares a aleatorias. La motivación surge de una brecha práctica en las herramientas existentes de evaluación de fortaleza de contraseñas. Las fórmulas clásicas basadas en combinatoria (por ejemplo, $\log_2(\text{espacio de caracteres}^{\text{longitud}})$) arrojan resultados en decenas de bits, mientras que la suite estándar de la industria, NIST Entropy Estimation Suite, proporciona una puntuación de entropía mínima normalizada entre 0 y 1. Esta discrepancia dificulta la comparación directa y la interpretación intuitiva. La Entropía de Expectativa salva esta brecha al proporcionar una estimación de fortaleza en la misma escala 0-1 que la herramienta de NIST, donde un valor de, por ejemplo, 0.4 indica que un atacante debe buscar exhaustivamente al menos el 40% del total de intentos posibles para encontrar la contraseña.

El trabajo se contextualiza dentro del proyecto "PHY2APP", centrándose en generar contraseñas simétricas fuertes para el aprovisionamiento de dispositivos Wi-Fi (protocolo ComPass) utilizando métodos de Seguridad de Capa Física, destacando la necesidad de una métrica de fortaleza robusta y escalable.

2. Varias Definiciones de Entropía

La entropía mide el desorden, la aleatoriedad o la incertidumbre. Diferentes definiciones se aplican de manera variable a la fortaleza de las contraseñas.

2.1 Entropía Mínima

Definida como $H_{\infty} = -\log_2(\max(p_i))$, donde $p_i$ es la probabilidad de un elemento. Representa el peor de los casos, midiendo la dificultad de adivinar el resultado más probable. Esta es la base para la salida de la suite de NIST.

2.2 Entropía de Shannon

Definida como $H_1 = -\sum_{i=1}^{N} p_i \log_2 p_i$. Proporciona una medida promedio del contenido de información, pero se critica por no estar relacionada con la dificultad real de adivinación en contextos de descifrado de contraseñas, ya que ignora la longitud de la contraseña y la estrategia óptima del atacante.

2.3 Entropía de Hartley

Definida como $H_0 = \log_2 N$, mide solo el tamaño de la distribución (tamaño del alfabeto), ignorando completamente las probabilidades de los caracteres.

2.4 Entropía de Adivinación

Definida como $G = \sum_{i=1}^{N} p_i \cdot i$, donde los intentos se ordenan por probabilidad decreciente. Esto mide el número esperado de intentos requeridos por un atacante óptimo. Está más directamente relacionado con el tiempo práctico de descifrado, pero no está normalizado.

3. Entropía de Expectativa

3.1 Definición y Formulación

La Entropía de Expectativa se basa en el concepto de Entropía de Adivinación pero normalizada a una escala [0, 1]. La idea central es estimar la fortaleza a partir de la composición de una única contraseña. Considera conjuntos de caracteres disjuntos: letras minúsculas $L$ (|L|=26), letras mayúsculas $U$ (26), dígitos $D$ (10) y símbolos $S$ (32), formando un espacio total de caracteres $K$ de tamaño 94 para el inglés.

Aunque la derivación matemática completa para una sola contraseña está implícita pero no es totalmente explícita en el extracto proporcionado, la métrica esencialmente normaliza el esfuerzo requerido por un atacante óptimo en relación con el espacio de búsqueda total. Si $G$ es la Entropía de Adivinación y $N$ es el número total de contraseñas posibles (por ejemplo, $94^{\text{longitud}}$ para el espacio completo), una forma normalizada podría estar conceptualmente relacionada con $E \approx G / N_{eff}$, donde $N_{eff}$ es un tamaño efectivo del espacio de búsqueda considerando la composición de la contraseña.

3.2 Interpretación y Escala

La innovación clave es su escala interpretable. Un valor de Entropía de Expectativa de $\alpha$ (donde $0 \le \alpha \le 1$) significa que un atacante debe realizar al menos una fracción $\alpha$ del total de intentos requeridos (en un orden óptimo) para descifrar la contraseña. Un valor de 1 indica una aleatoriedad ideal donde el atacante debe realizar una búsqueda de fuerza bruta completa. Esto se alinea intuitivamente con la escala de entropía mínima de NIST, facilitando la comparación y la toma de decisiones para los diseñadores de sistemas.

4. Idea Central y Perspectiva del Analista

Idea Central: Reaz y Wunder no solo proponen otra métrica de entropía; están intentando resolver una brecha crítica de usabilidad e interpretabilidad en la ingeniería de seguridad. El problema real no es la falta de medidas de complejidad, sino la fricción cognitiva cuando una herramienta de combinatoria grita "¡80 bits!" y NIST susurra "0.7". La Entropía de Expectativa es un traductor pragmático, que convierte la fortaleza criptográfica en una puntuación de riesgo probabilística y accionable en un panel unificado.

Flujo Lógico: El argumento es elegantemente simple: 1) Las métricas existentes viven en planetas diferentes (bits vs. puntuaciones normalizadas), causando confusión. 2) La Entropía de Adivinación ($G$) está más cerca de la realidad de un atacante pero no está acotada. 3) Por lo tanto, normalizar $G$ en relación con el espacio de búsqueda efectivo para crear una puntuación 0-1 que mapee directamente al porcentaje de esfuerzo requerido por el atacante. Esto une lo teórico (entropía mínima de NIST) y lo práctico (carga de trabajo del descifrador de contraseñas).

Fortalezas y Debilidades: Su fortaleza es su elegante simplicidad e interpretabilidad inmediata—una bendición para los responsables de políticas y arquitectos de sistemas. Sin embargo, el diablo está en los supuestos distribucionales. La precisión de la métrica depende en gran medida de modelar correctamente la distribución de probabilidad $p_i$ de los caracteres dentro de una única muestra de contraseña, lo cual es un problema estadístico notoriamente difícil. A diferencia de la suite de NIST que prueba flujos de bits largos, aplicar esto a una contraseña corta de 16 caracteres requiere estimadores robustos que pueden ser sensibles a sesgos. El artículo, según el extracto, no detalla completamente este proceso de estimación para una sola instancia, lo cual es su talón de Aquiles.

Conclusiones Accionables: Para los equipos de seguridad, esta métrica podría integrarse en APIs de creación de contraseñas o complementos de Active Directory para proporcionar retroalimentación de fortaleza intuitiva y en tiempo real ("Su contraseña requiere el 60% de los intentos para ser descifrada"). Para los investigadores, el siguiente paso debe ser una validación empírica rigurosa y a gran escala contra herramientas de descifrado del mundo real (como Hashcat o John the Ripper) para calibrar el modelo. ¿Una Entropía de Expectativa de 0.8 realmente significa el 80% del espacio de búsqueda? Esto necesita pruebas contra modelos de IA adversarios, similar a cómo se usan las GANs para atacar otros dominios de seguridad. El concepto es prometedor, pero su utilidad operativa depende de una validación transparente y revisada por pares más allá del entorno controlado de contraseñas generadas por máquina.

5. Detalles Técnicos y Formulación Matemática

Basándose en los conceptos esbozados, la Entropía de Expectativa $H_E$ para una contraseña puede enmarcarse conceptualmente. Sea una contraseña de longitud $l$ extraída de un alfabeto $\mathcal{A}$ con una distribución de probabilidad asociada para cada posición de carácter (que puede estimarse a partir de la propia contraseña o de un corpus de referencia).

Vector de Probabilidad Ordenado: Para todo el espacio de contraseñas de tamaño $N = |\mathcal{A}|^l$, teóricamente se pueden ordenar todas las contraseñas posibles por su probabilidad descendente de ser elegidas (según el modelo generativo).
Entropía de Adivinación: El número esperado de intentos para un atacante óptimo es $G = \sum_{i=1}^{N} p_i \cdot i$, donde $p_i$ es la probabilidad de la $i$-ésima contraseña más probable.
Normalización: El máximo $G$ posible para una distribución uniforme es $(N+1)/2$. Una medida normalizada del esfuerzo podría definirse como: $$ H_E \approx \frac{2 \cdot G - 1}{N} $$ Esto mapearía una distribución uniforme (aleatoriedad perfecta) a $H_E \to 1$ a medida que $N$ crece, y una contraseña altamente predecible (donde $G$ es pequeño) a un valor cercano a 0.
Estimación Práctica: Para una sola contraseña, se debe estimar su "rango" o la probabilidad acumulada de todas las contraseñas más probables que ella. Si la masa de probabilidad acumulada de una contraseña hasta su rango es $\alpha$, entonces $H_E \approx 1 - \alpha$. Esto se alinea con la descripción del artículo de que un valor de 0.4 significa buscar el 40% del espacio.

El algoritmo preciso y eficiente para estimar esto a partir de una sola muestra es la contribución técnica central implícita de los autores.

6. Resultados Experimentales y Descripción de Gráficos

Nota: El extracto del PDF proporcionado no contiene resultados experimentales específicos ni gráficos. La siguiente es una descripción basada en lo que implicaría un estudio de validación típico para dicha métrica.

Una evaluación integral de la Entropía de Expectativa probablemente incluiría los siguientes gráficos:

Gráfico 1: Diagrama de Dispersión de Comparación de Métricas. Este gráfico representaría las contraseñas en dos ejes: el eje X mostraría la fortaleza clásica en bits (por ejemplo, $\log_2(94^l)$), y el eje Y mostraría la Entropía de Expectativa (0-1). Una nube de puntos revelaría la correlación (o falta de ella) entre las dos medidas, destacando contraseñas que son largas (alta fortaleza en bits) pero predecibles (baja Entropía de Expectativa).
Gráfico 2: Curva de Resistencia al Descifrado. Esto mostraría la fracción real del espacio de búsqueda que un atacante (usando una herramienta como Hashcat con un ataque basado en reglas) debe recorrer para descifrar contraseñas agrupadas por su puntuación de Entropía de Expectativa (por ejemplo, 0.0-0.1, 0.1-0.2...). Una métrica ideal mostraría una línea diagonal perfecta donde el esfuerzo predicho (Entropía) es igual al esfuerzo real. La desviación de la diagonal indica error de estimación.
Gráfico 3: Distribución de Puntuaciones. Un histograma que muestre las puntuaciones de Entropía de Expectativa para diferentes tipos de contraseñas: generadas por máquina (por ejemplo, del protocolo ComPass), generadas por humanos con reglas, y generadas por humanos sin reglas. Esto demostraría visualmente la capacidad de la métrica para discriminar entre métodos de generación de contraseñas.

El resultado clave a validar es la afirmación: "Tener una Entropía de Expectativa de cierto valor, por ejemplo, 0.4, significa que un atacante tiene que buscar exhaustivamente al menos el 40% del número total de intentos." Esto requiere simulaciones de ataques empíricos.

7. Marco de Análisis: Caso de Ejemplo

Escenario: Evaluar dos contraseñas de 12 caracteres para un sistema que utiliza el espacio de 94 caracteres ASCII imprimibles.

Contraseña A (Elegida por humano): Summer2024!
Contraseña B (Generada por máquina): k9$Lp@2W#r1Z

Fortaleza Clásica en Bits: Ambas tienen el mismo máximo teórico: $\log_2(94^{12}) \approx 78.7$ bits.

Análisis de Entropía de Expectativa:

Contraseña A: La estructura es común: una palabra del diccionario ("Summer"), un año predecible ("2024") y un símbolo de sufijo común ("!"). Un modelo probabilístico (como una cadena de Markov entrenada en contraseñas filtradas) asignaría una alta probabilidad a este patrón. Su rango en la lista ordenada de contraseñas probables sería muy bajo, lo que significa que la probabilidad acumulada de contraseñas más probables es alta. Por lo tanto, su Entropía de Expectativa sería baja (por ejemplo, 0.05-0.2), indicando que un atacante probablemente la encontraría en el primer 5-20% de un orden de intentos optimizado.
Contraseña B: Parece aleatoria, sin patrón obvio, mezclando conjuntos de caracteres por posición. Un modelo probabilístico asignaría una probabilidad muy baja, aproximadamente uniforme, a esta secuencia específica. Su rango sería muy alto (cerca del medio/final de la lista ordenada). Por lo tanto, su Entropía de Expectativa sería alta (por ejemplo, 0.7-0.95), indicando que un atacante debe buscar la mayor parte del espacio.

Este ejemplo demuestra cómo la Entropía de Expectativa proporciona una evaluación de riesgo más matizada y realista que la idéntica fortaleza en bits de la fórmula clásica.

8. Perspectivas de Aplicación y Direcciones Futuras

Aplicaciones Inmediatas:

Medidores de Fortaleza de Contraseñas en Tiempo Real: Integrar la Entropía de Expectativa en los flujos de registro de aplicaciones y web para proporcionar a los usuarios un indicador de fortaleza intuitivo y basado en porcentajes.
Aplicación de Políticas de Seguridad: Las organizaciones podrían establecer umbrales mínimos de Entropía de Expectativa (por ejemplo, 0.6) en lugar de solo reglas de complejidad, vinculando directamente la política al esfuerzo estimado de descifrado.
Auditorías Automatizadas de Sistemas: Escanear bases de datos de contraseñas existentes (con hash) para estimar la distribución colectiva de la Entropía de Expectativa e identificar cuentas con contraseñas críticamente débiles.

Direcciones Futuras de Investigación:

Estimadores Robustos de Muestra Única: Desarrollar y comparar métodos estadísticos (por ejemplo, usando modelos de lenguaje neuronal, modelos n-grama o filtros Bloom) para estimar con precisión la probabilidad/rango de una única contraseña a partir de la cual se deriva $H_E$.
Evaluación Adversaria: Probar la métrica contra herramientas de descifrado de contraseñas de última generación y modelos de IA (por ejemplo, PassGAN, una adaptación del marco de Redes Generativas Antagónicas para contraseñas) para ver si el esfuerzo predicho coincide con los tiempos reales de descifrado.
Más Allá de las Contraseñas: Aplicar el concepto normalizado de "fracción de esfuerzo" a otros secretos, como claves criptográficas (donde los bits son estándar) o plantillas biométricas, para crear una métrica de fortaleza unificada en diferentes factores de autenticación.
Esfuerzos de Estandarización: Proponer la Entropía de Expectativa o sus principios a organismos como NIST para su inclusión en futuras revisiones de las directrices de identidad digital (por ejemplo, SP 800-63B).

9. Referencias

Ministerio Federal de Educación e Investigación de Alemania (BMBF). Detalles de la subvención para el proyecto PHY2APP.
M. Dell'Amico, P. Michiardi, Y. Roudier, "Password Strength: An Empirical Analysis," en Proceedings of IEEE INFOCOM, 2010. (Representa un estudio sobre métodos de fortaleza de contraseñas).
National Institute of Standards and Technology (NIST). Entropy Estimation Suite. [En línea]. Disponible: https://github.com/usnistgov/entropy-estimation
NIST Special Publication 800-90B. Recommendation for the Entropy Sources Used for Random Bit Generation.
J. Kelsey, K. A. McKay, M. Turan, "Predictive Models for Min-Entropy Estimation," en Proceedings of CHES, 2015.
K. Reaz, G. Wunder, "ComPass: A Protocol for Secure and Usable Wi-Fi Device Provisioning," en Proceedings of ACM WiSec, 2023. (Supuesto por el contexto).
C. E. Shannon, "A Mathematical Theory of Communication," The Bell System Technical Journal, vol. 27, pp. 379–423, 623–656, 1948.
R. V. L. Hartley, "Transmission of Information," The Bell System Technical Journal, vol. 7, no. 3, pp. 535–563, 1928.
J. Bonneau, "The Science of Guessing: Analyzing an Anonymized Corpus of 70 Million Passwords," en Proceedings of IEEE Symposium on Security and Privacy, 2012.
J. L. Massey, "Guessing and Entropy," en Proceedings of IEEE International Symposium on Information Theory (ISIT), 1994.
C. Cachin, Entropy Measures and Unconditional Security in Cryptography. Tesis Doctoral, ETH Zurich, 1997.
J. O. Pliam, "The Disparity between Work and Entropy in Cryptology," 1998. [En línea]. Disponible: https://eprint.iacr.org/1998/024
B. Hitaj, P. Gasti, G. Ateniese, F. Perez-Cruz, "PassGAN: A Deep Learning Approach for Password Guessing," en Proceedings of ACNS, 2019. (Referencia externa para evaluación de IA adversaria).