期待エントロピー：パスワード強度評価のための新規指標

1. 序論と動機

本論文は、ランダムまたはランダムに近いパスワードの強度を推定するために設計された新規指標である期待エントロピーを紹介する。その動機は、既存のパスワード強度評価ツールにおける実用的なギャップに起因する。古典的な組み合わせ論に基づく公式（例：$\log_2(\text{文字空間}^{\text{長さ}})$）は数十ビットの結果を出力する一方、業界標準であるNISTエントロピー推定スイートは0から1の間の正規化された最小エントロピースコアを提供する。この不一致により、直接的な比較や直感的な解釈が困難となっている。期待エントロピーは、NISTツールと同じ0-1スケールで強度推定値を提供することでこのギャップを埋める。例えば値0.4は、攻撃者がパスワードを見つけるために、可能な総推測数の少なくとも40%を網羅的に探索しなければならないことを示す。

この研究は「PHY2APP」プロジェクトの文脈に位置づけられており、物理層セキュリティ手法を用いたWi-Fiデバイスプロビジョニング（ComPassプロトコル）のための強力な対称パスワード生成に焦点を当て、堅牢でスケーラブルな強度指標の必要性を強調している。

2. 様々なエントロピーの定義

エントロピーは、無秩序さ、ランダム性、または不確実性を測定する。パスワード強度に対しては、異なる定義が様々に適用される。

2.1 最小エントロピー

$p_i$を要素の確率として、$H_{\infty} = -\log_2(\max(p_i))$で定義される。これは最悪ケースのシナリオを表し、最も起こり得る結果を推測する難しさを測定する。これがNISTスイートの出力の基礎となっている。

2.2 シャノン・エントロピー

$H_1 = -\sum_{i=1}^{N} p_i \log_2 p_i$で定義される。これは情報量の平均的な尺度を提供するが、パスワード長と攻撃者の最適戦略を無視するため、パスワードクラッキングの文脈における実際の推測の難しさとは無関係であると批判されている。

2.3 ハートレー・エントロピー

$H_0 = \log_2 N$で定義され、分布のサイズ（アルファベットサイズ）のみを測定し、文字の確率を完全に無視する。

2.4 推測エントロピー

推測を確率の降順に並べた場合、$G = \sum_{i=1}^{N} p_i \cdot i$で定義される。これは最適な攻撃者に必要な期待推測回数を測定する。実際のクラッキング時間により直接関連するが、正規化されていない。

3. 期待エントロピー

3.1 定義と定式化

期待エントロピーは、推測エントロピーの概念に基づきつつ、[0, 1]スケールに正規化したものである。核心的な考え方は、単一のパスワードの構成からその強度を推定することである。これは、互いに素な文字セット：小文字$L$ (|L|=26)、大文字$U$ (26)、数字$D$ (10)、記号$S$ (32)を考慮し、英語の場合サイズ94の総文字空間$K$を形成する。

単一パスワードに対する完全な数学的導出は、提供された抜粋では暗示されているが完全には明示されていないが、この指標は本質的に、総探索空間に対する最適な攻撃者に必要な労力を正規化するものである。$G$を推測エントロピー、$N$を可能なパスワードの総数（例：全空間に対して$94^{\text{長さ}}$）とすると、正規化された形式は概念的には$E \approx G / N_{eff}$に関連付けることができ、ここで$N_{eff}$はパスワードの構成を考慮した実効的な探索空間サイズである。

3.2 解釈とスケール

その重要な革新点は、解釈可能なスケールにある。期待エントロピーの値が$\alpha$（$0 \le \alpha \le 1$）であるということは、攻撃者がパスワードをクラックするために、必要な総推測数の少なくとも割合$\alpha$を（最適な順序で）実行しなければならないことを意味する。値1は、攻撃者が完全なブルートフォース探索を実行しなければならない理想的なランダム性を示す。これはNIST最小エントロピースケールと直感的に一致し、システム設計者にとっての比較と意思決定を容易にする。

4. 核心的洞察とアナリストの視点

核心的洞察： ReazとWunderは単に別のエントロピー指標を提案しているのではなく、セキュリティエンジニアリングにおける重要なユーザビリティと解釈可能性のギャップを解決しようと試みている。真の問題は複雑性指標の不足ではなく、組み合わせ論ツールが「80ビット！」と叫び、NISTが「0.7」と囁くときの認知的摩擦である。期待エントロピーは実用的な翻訳者であり、暗号学的強度を統一されたダッシュボード上の実行可能な確率的リスクスコアに変換する。

論理的流れ： 議論は優雅に単純である：1) 既存の指標は異なる惑星（ビット vs. 正規化スコア）に存在し、混乱を引き起こす。2) 推測エントロピー($G$)は攻撃者の現実に近いが境界がない。3) したがって、$G$を実効探索空間に対して正規化し、攻撃者の必要な労力の割合に直接マッピングする0-1スコアを作成する。これにより、理論的（NISTの最小エントロピー）と実践的（パスワードクラッカーの作業負荷）が橋渡しされる。

強みと欠点： その強みは、優雅な単純さと即時の解釈可能性にあり、政策決定者やシステムアーキテクトにとって天の恵みである。しかし、問題は分布の仮定にある。この指標の精度は、単一のパスワードサンプル内の文字の確率分布$p_i$を正しくモデル化することに大きく依存しており、これは統計的に非常に難しい問題である。長いビットストリームをテストするNISTのスイートとは異なり、これを短い16文字のパスワードに適用するには、バイアスに敏感な可能性がある堅牢な推定量が必要となる。抜粋から判断する限り、論文は単一インスタンスに対するこの推定プロセスを完全には詳細化しておらず、これがそのアキレス腱である。

実行可能な洞察： セキュリティチームにとって、この指標はパスワード作成APIやActive Directoryプラグインに統合され、リアルタイムで直感的な強度フィードバック（「あなたのパスワードはクラックするために推測の60%が必要です」）を提供する可能性がある。研究者にとって、次のステップは、実世界のクラッキングツール（HashcatやJohn the Ripperなど）に対して厳密で大規模な実証的検証を行い、モデルを較正することである。期待エントロピー0.8は本当に探索空間の80%を意味するのか？これは、GANが他のセキュリティドメインを攻撃するために使用されるのと同様に、敵対的AIモデルに対する証明が必要である。この概念は有望であるが、その運用上の有用性は、機械生成パスワードの制御された環境を超えた、透明性のある、査読済みの検証にかかっている。

5. 技術的詳細と数学的定式化

概説された概念に基づき、パスワードに対する期待エントロピー$H_E$を概念的に枠組みづけることができる。長さ$l$のパスワードが、各文字位置に関連する確率分布（パスワード自体または参照コーパスから推定される可能性がある）を持つアルファベット$\mathcal{A}$から抽出されるとする。

順序付けられた確率ベクトル： サイズ$N = |\mathcal{A}|^l$のパスワード空間全体に対して、理論的にはすべての可能なパスワードを、（生成モデルに従って）選択される確率の降順に並べることができる。
推測エントロピー： 最適な攻撃者に対する期待推測回数は$G = \sum_{i=1}^{N} p_i \cdot i$であり、ここで$p_i$は$i$番目に起こり得るパスワードの確率である。
正規化： 一様分布に対する最大可能な$G$は$(N+1)/2$である。労力の正規化された尺度は次のように定義できる： $$ H_E \approx \frac{2 \cdot G - 1}{N} $$ これは、一様分布（完全なランダム性）を$N$が大きくなるにつれて$H_E \to 1$に、非常に予測可能なパスワード（$G$が小さい）を0に近い値にマッピングする。
実用的な推定： 単一のパスワードに対して、その「順位」またはそれよりも起こり得るすべてのパスワードの累積確率を推定しなければならない。パスワードの順位までの累積確率質量が$\alpha$である場合、$H_E \approx 1 - \alpha$となる。これは、値0.4が空間の40%の探索を意味するという論文の記述と一致する。

単一サンプルからこれを推定するための正確で効率的なアルゴリズムが、著者らによって暗示されている核心的な技術的貢献である。

6. 実験結果とチャートの説明

注：提供されたPDF抜粋には具体的な実験結果やチャートは含まれていない。以下は、このような指標に対する典型的な検証研究が含むであろう内容に基づく説明である。

期待エントロピーの包括的評価には、おそらく以下のチャートが含まれるであろう：

チャート1：指標比較散布図。 このチャートは、パスワードを2軸にプロットする：X軸は古典的ビット強度（例：$\log_2(94^l)$）、Y軸は期待エントロピー（0-1）。点の雲は2つの指標間の相関（またはその欠如）を明らかにし、長い（高いビット強度）が予測可能な（低い期待エントロピー）パスワードを強調する。
チャート2：クラッキング耐性曲線。 これは、攻撃者（ルールベース攻撃を使用するHashcatのようなツール）が、期待エントロピースコア（例：0.0-0.1, 0.1-0.2...）でビン分けされたパスワードをクラックするために実際に横断しなければならない探索空間の割合を示す。理想的な指標では、予測労力（エントロピー）が実際の労力と等しい完全な対角線が示される。対角線からの逸脱は推定誤差を示す。
チャート3：スコアの分布。 異なるパスワードタイプ：機械生成（例：ComPassプロトコルから）、ルールあり人間生成、ルールなし人間生成に対する期待エントロピースコアを示すヒストグラム。これは、指標がパスワード生成方法を区別する能力を視覚的に示す。

検証すべき重要な結果は、「期待エントロピーがある値、例えば0.4を持つということは、攻撃者が総推測数の少なくとも40%を網羅的に探索しなければならないことを意味する」という主張である。これには実証的攻撃シミュレーションが必要である。

7. 分析フレームワーク：事例ケース

シナリオ： 94文字の印字可能ASCII空間を使用するシステムに対する2つの12文字パスワードの評価。

パスワードA（人間選択）： Summer2024!
パスワードB（機械生成）： k9$Lp@2W#r1Z

古典的ビット強度： 両方とも同じ理論的最大値を持つ：$\log_2(94^{12}) \approx 78.7$ビット。

期待エントロピー分析：

パスワードA： 構造は一般的である：辞書単語（"Summer"）、予測可能な年（"2024"）、一般的な接尾辞記号（"!"）。確率モデル（漏洩パスワードで訓練されたマルコフ連鎖など）はこのパターンに高い確率を割り当てる。起こり得るパスワードの順序付けられたリストにおけるその順位は非常に低く、より起こり得るパスワードの累積確率が高いことを意味する。したがって、その期待エントロピーは低い（例：0.05-0.2）となり、攻撃者が最適化された推測順序の最初の5-20%でそれを見つける可能性が高いことを示す。
パスワードB： これはランダムに見え、明らかなパターンがなく、位置ごとに文字セットを混合している。確率モデルはこの特定のシーケンスに非常に低く、ほぼ一様な確率を割り当てる。その順位は非常に高い（順序付けられたリストの中間/終わり近く）。したがって、その期待エントロピーは高い（例：0.7-0.95）となり、攻撃者が空間の大部分を探索しなければならないことを示す。

この例は、期待エントロピーが、古典的公式からの同一のビット強度よりも、よりニュアンスに富み現実的なリスク評価を提供する方法を示している。

8. 応用の展望と将来の方向性

即時応用：

リアルタイムパスワード強度メーター： 期待エントロピーをウェブおよびアプリケーションのサインアップフローに統合し、ユーザーに直感的でパーセンテージベースの強度指標を提供する。
セキュリティポリシー強制： 組織は、単なる複雑性ルールの代わりに最小期待エントロピー閾値（例：0.6）を設定し、ポリシーを推定クラッキング労力に直接結びつけることができる。
自動化システム監査： 既存のパスワードデータベース（ハッシュ化）をスキャンして、集合的な期待エントロピー分布を推定し、致命的に弱いパスワードを持つアカウントを特定する。

将来の研究方向性：

堅牢な単一サンプル推定量： $H_E$が導出される単一のパスワードの確率/順位を正確に推定するための統計的方法（例：ニューラル言語モデル、n-gramモデル、ブルームフィルターの使用）を開発し比較する。
敵対的評価： 最先端のパスワードクラッキングツールおよびAIモデル（例：パスワード用に生成敵対ネットワークフレームワークを適応させたPassGAN）に対して指標をテストし、予測労力が実際のクラッキング時間と一致するかどうかを確認する。
パスワードを超えて： 正規化された「労力割合」の概念を、暗号鍵（ビットが標準）や生体認証テンプレートなどの他の秘密に適用し、異なる認証要素にわたる統一された強度指標を作成する。
標準化への取り組み： 期待エントロピーまたはその原理をNISTなどの機関に提案し、将来のデジタルアイデンティティガイドライン（例：SP 800-63B）への包含を目指す。

9. 参考文献

ドイツ連邦教育研究省（BMBF）。プロジェクトPHY2APPの助成金詳細。
M. Dell'Amico, P. Michiardi, Y. Roudier, "Password Strength: An Empirical Analysis," in Proceedings of IEEE INFOCOM, 2010. （パスワード強度手法に関するサーベイを代表）。
米国国立標準技術研究所（NIST）。 Entropy Estimation Suite. [オンライン]。入手先：https://github.com/usnistgov/entropy-estimation
NIST Special Publication 800-90B. Recommendation for the Entropy Sources Used for Random Bit Generation.
J. Kelsey, K. A. McKay, M. Turan, "Predictive Models for Min-Entropy Estimation," in Proceedings of CHES, 2015.
K. Reaz, G. Wunder, "ComPass: A Protocol for Secure and Usable Wi-Fi Device Provisioning," in Proceedings of ACM WiSec, 2023. （文脈から想定）。
C. E. Shannon, "A Mathematical Theory of Communication," The Bell System Technical Journal, vol. 27, pp. 379–423, 623–656, 1948.
R. V. L. Hartley, "Transmission of Information," The Bell System Technical Journal, vol. 7, no. 3, pp. 535–563, 1928.
J. Bonneau, "The Science of Guessing: Analyzing an Anonymized Corpus of 70 Million Passwords," in Proceedings of IEEE Symposium on Security and Privacy, 2012.
J. L. Massey, "Guessing and Entropy," in Proceedings of IEEE International Symposium on Information Theory (ISIT), 1994.
C. Cachin, Entropy Measures and Unconditional Security in Cryptography. PhD Thesis, ETH Zurich, 1997.
J. O. Pliam, "The Disparity between Work and Entropy in Cryptology," 1998. [オンライン]。入手先：https://eprint.iacr.org/1998/024
B. Hitaj, P. Gasti, G. Ateniese, F. Perez-Cruz, "PassGAN: A Deep Learning Approach for Password Guessing," in Proceedings of ACNS, 2019. （敵対的AI評価のための外部参照）。