SOPG：基於搜尋的自迴歸神經網路有序密碼生成方法

1. 引言

密碼至今仍是最普遍的使用者驗證方式，在簡便性與有效性之間取得平衡。然而，其安全性持續受到密碼猜測攻擊的挑戰，這在攻擊性安全測試與防禦強度評估中都是關鍵環節。傳統方法，從基於規則的枚舉到如馬可夫鏈和PCFG等統計模型，在多樣性與效率上存在固有的限制。深度學習的出現，特別是自迴歸神經網路，預示著典範的轉移。然而，一個關鍵的疏忽持續存在：生成方法本身。標準的取樣技術引入了隨機性，產生重複密碼和無序的輸出，嚴重阻礙了攻擊效率。本文介紹了SOPG（基於搜尋的有序密碼生成），這是一種新穎的方法，迫使自迴歸模型以近似概率降序的方式生成密碼，從而徹底改變了基於神經網路的密碼猜測效率。

2. 背景與相關工作

2.1 密碼猜測技術的演進

此領域經歷了幾個不同的發展階段：啟發式規則型方法依賴於手動字典和轉換規則（例如，John the Ripper規則），這類方法依賴經驗且缺乏理論基礎。2009年後真實密碼外洩事件的激增催生了統計方法。如OMEN所使用的馬可夫模型，基於固定長度的歷史來預測下一個字元；而概率上下文無關文法（PCFG）則將密碼分割成模式（字母、數字、符號）並學習其概率。雖然系統化，但這些模型經常過度擬合，且難以泛化。

2.2 神經網路方法

能夠學習複雜高維分佈的深度學習模型，成為強大的後繼者。PassGAN利用生成對抗網路（GANs）來生成密碼，儘管GANs對於離散資料眾所周知地不穩定。VAEPass應用了變分自編碼器。最近且最相關的方法是PassGPT，它利用了GPT（生成式預訓練轉換器）架構，這是一種自迴歸模型，根據所有先前的標記來預測下一個標記。然而，所有這些模型在生成過程中通常依賴標準取樣（例如，隨機取樣、top-k取樣、核心取樣），這無法保證順序性或唯一性。

3. SOPG 方法

3.1 核心概念

SOPG解決了隨機取樣的根本效率問題。它不是隨機生成密碼，而是將密碼生成框架為一個搜尋問題。目標是在由模型詞彙表和最大長度定義的龐大可能密碼空間中，以近似於底層自迴歸神經網路所分配的概率降序進行遍歷。

3.2 搜尋演算法

雖然PDF摘要未詳述具體演算法，但SOPG很可能採用或改編了由模型概率估計引導的最佳優先搜尋或波束搜尋策略。候選密碼表示為一個標記序列。搜尋維護一個優先佇列（例如，堆積），其中包含部分或完整的序列，並根據其累積概率或從中推導出的啟發式分數進行排序。在每一步中，最有希望的候選者會透過附加可能的下一個標記（來自詞彙表）來擴展，新的候選者會被評分並重新插入佇列。這確保了輸出流大致上從最可能到最不可能排序。

3.3 SOPGesGPT 模型

作者透過建構SOPGesGPT來實例化他們的方法，這是一個基於GPT架構的密碼猜測模型。該模型在洩漏的密碼資料集上進行訓練，以學習底層分佈。關鍵在於，在生成階段，它使用SOPG演算法而非標準取樣，使其成為展示SOPG優越性的載體。

4. 技術細節與數學公式

給定一個自迴歸模型（如GPT），密碼序列 $S = (s_1, s_2, ..., s_T)$ 的概率分解為： $$P(S) = \prod_{t=1}^{T} P(s_t | s_1, ..., s_{t-1})$$ 其中 $s_t$ 是位置 $t$ 的標記，而 $P(s_t | s_1, ..., s_{t-1})$ 是模型的輸出概率分佈。

標準隨機取樣從此分佈中抽取 $s_t$，導致隨機漫步。相反地，SOPG旨在找到最大化 $P(S)$ 的序列 $S^*$，或系統性地枚舉高概率序列。這可以視為： $$S^* = \arg\max_{S \in \mathcal{V}^*} P(S)$$ 其中 $\mathcal{V}^*$ 是最大長度內所有可能序列的集合。窮舉搜尋是難以處理的。因此，SOPG採用一種啟發式搜尋演算法（例如，使用對數概率成本的 $A^*$）來有效地近似這種有序枚舉。搜尋使用負對數概率作為成本：$\text{cost}(S) = -\sum_{t=1}^{T} \log P(s_t | s_1, ..., s_{t-1})$。該演算法旨在按成本遞增的順序輸出序列。

5. 實驗結果與分析

覆蓋率 (SOPGesGPT)

35.06%

單一網站測試中達到的最高覆蓋率。

相較於 PassGPT 的提升

81%

比最新模型更高的覆蓋率。

相較於 PassGAN 的提升

421%

相較於基於GAN的方法有巨大提升。

5.1 與隨機取樣的比較

論文首先在相同的底層模型上，驗證了SOPG相對於標準隨機取樣的核心效率主張。主要發現：

零重複： SOPG生成一個唯一、有序的清單，消除了在重複猜測上浪費計算資源的問題。
相同覆蓋率所需推論次數更少： 為了達到相同的覆蓋率（從測試集中破解密碼的百分比），SOPG所需的模型推論（前向傳遞）次數顯著少於隨機取樣。
總猜測次數少得多： 因此，SOPG透過生成小得多的猜測清單來破解相同數量的密碼，直接轉化為更快的攻擊時間。

此實驗確鑿地證明生成方法本身是一個主要瓶頸，而SOPG有效地移除了它。

5.2 與尖端技術的基準測試

SOPGesGPT在單一網站測試中與主要基準進行了比較：OMEN（馬可夫）、FLA、PassGAN（GAN）、VAEPass（VAE）以及最新的PassGPT（使用隨機取樣的GPT）。

覆蓋率： SOPGesGPT達到了35.06%的覆蓋率。其提升幅度驚人：相較於OMEN提升254%，相較於FLA提升298%，相較於PassGAN提升421%，相較於VAEPass提升380%，相較於PassGPT提升81%。
有效率： 論文還提到在「有效率」上領先，可能指的是單位時間或計算量內生成的有效唯一密碼數量，進一步強調了SOPG的效率。

圖表描述： 長條圖的Y軸顯示「覆蓋率（%）」，X軸顯示模型名稱。SOPGesGPT的長條將顯著高於所有其他模型，PassGPT位居第二但明顯較低。一條疊加線可以顯示達到20%覆蓋率所需的猜測次數，其中SOPGesGPT的線將在早期急遽上升，展示其「快速且強力命中」的能力。

6. 分析框架與案例示例

框架：密碼猜測效率象限
我們可以在兩個軸上分析模型：模型能力（學習複雜分佈的能力，例如 GPT > 馬可夫）和生成效率（輸出的最佳排序）。

象限 I（高能力，低效率）： PassGPT、VAEPass。強大的模型因隨機取樣而受限。
象限 II（高能力，高效率）： SOPGesGPT。本工作達成的目標狀態。
象限 III（低能力，低效率）： 基本的規則型攻擊。
象限 IV（低能力，高效率）： OMEN、FLA。它們的生成本質上是有序的（按概率），但其模型能力限制了最終性能。

非程式碼案例示例： 想像兩位擁有相同高品質地圖（訓練好的GPT模型）的尋寶者（攻擊者）。一位尋寶者（隨機取樣）隨機行走，經常重訪地點，緩慢地找到寶藏。另一位尋寶者（SOPG）有一個金屬探測器，首先指向附近最有希望的地點，遵循一個系統性、不重複的路徑。對於相同的步數，SOPG尋寶者找到的寶藏要多得多。SOPG就是神經網路地圖的那個金屬探測器。

7. 應用前景與未來方向

立即應用：

主動式密碼強度評估： 安全公司可以使用SOPG驅動的工具來稽核密碼策略，透過以指數級更快的速度生成最可能的攻擊猜測，提供真實的風險評估。
數位鑑識與合法恢復： 在時間至關重要的法律調查中，加速密碼恢復。

未來研究方向：

混合搜尋策略： 將SOPG與有限的隨機性結合，以更早地探索概率稍低但可能富有成果的「創意」猜測，平衡利用與探索。
硬體加速搜尋： 在GPU/TPU上實作搜尋演算法，以平行化候選者評估，減少搜尋過程本身的開銷。
超越密碼： 將有序生成典範應用於其他自迴歸模型任務，其中有序、唯一的輸出具有價值，例如為軟體生成測試案例，或按可行性順序創建多樣的設計變體。
防禦對策： 研究如何偵測和防禦此類高效、有序的攻擊，可能透過研究SOPG生成的猜測清單與隨機清單的「指紋」差異。

8. 參考文獻

M. Jin, J. Ye, R. Shen, H. Lu, "Search-based Ordered Password Generation of Autoregressive Neural Networks," Manuscript Submitted for Publication.
A. Narayanan and V. Shmatikov, "Fast dictionary attacks on passwords using time-space tradeoff," in Proceedings of the 12th ACM conference on Computer and communications security, 2005.
M. Weir, S. Aggarwal, B. de Medeiros, and B. Glodek, "Password cracking using probabilistic context-free grammars," in 2009 30th IEEE Symposium on Security and Privacy, 2009.
J. Ma, W. Yang, M. Luo, and N. Li, "A study of probabilistic password models," in 2014 IEEE Symposium on Security and Privacy, 2014.
B. Hitaj, P. Gasti, G. Ateniese, and F. Perez-Cruz, "PassGAN: A Deep Learning Approach for Password Guessing," in Applied Cryptography and Network Security Workshops, 2019.
OpenAI, "Improving Language Understanding by Generative Pre-Training," 2018. [Online]. Available: https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf
M. Pasquini, D. Bernardo, and G. Ateniese, "PassGPT: Password Modeling and (Guessing) with Large Language Models," in arXiv preprint arXiv:2306.01745, 2023.

9. 原創分析與專家評論

核心洞見

論文的突破並非一個新的神經網路架構；而是對生成瓶頸的精準打擊。多年來，密碼猜測社群，如同生成式AI的趨勢一樣，痴迷於模型能力——更大的轉換器、更好的GANs——同時將取樣過程視為一個已解決的次要問題。Jin等人正確地指出這是一個關鍵的謬誤。從強大模型中隨機取樣，就像使用精準狙擊步槍隨機掃射；SOPG則加上了瞄準鏡和策略。這種從建模到搜尋的焦點轉移，是論文最重要的概念貢獻。它證明了在輸出順序直接映射到成功率（先破解最簡單的密碼）的安全應用中，搜尋效率可以勝過模型擬合度的邊際增益。

邏輯脈絡

論證具有說服力且結構良好：(1) 確立當前神經網路猜測（隨機、充滿重複）的重要性與低效率。(2) 提出SOPG作為基於搜尋的解決方案，以強制執行概率排序、唯一的生成。(3) 在相同模型上實證證明SOPG相對於隨機取樣的效率——一個乾淨的對照研究。(4) 透過建構SOPGesGPT並擊敗現有基準，展示端到端的優越性。相較於PassGPT的81%提升尤其說明問題；它透過比較相同GPT架構的兩種不同生成方案，隔離了SOPG的價值。

優點與缺陷

優點： 核心思想優雅且影響力大。實驗設計穩健，結果清晰、決定性。性能提升並非漸進式，而是變革性的，表明SOPG可能成為新的標準組件。這項工作與古典AI中的搜尋演算法深度連結，將其應用於現代深度學習情境——這是一次富有成果的跨領域融合。

缺陷與開放問題： PDF摘錄缺乏關鍵細節：具體的搜尋演算法（A*、波束、最佳優先？）及其計算開銷。搜尋並非免費；維護優先佇列和評分眾多候選者是有成本的。論文聲稱「更少的推論」，但這是否考慮了搜尋內部的推論？需要完整的成本效益分析。此外，「近似降序」這個限定詞很模糊——近似程度如何？對於非常長或複雜的密碼，順序是否會退化？雖然比較結果令人印象深刻，但這是「單一網站測試」。在不同資料集（企業密碼 vs. 社交媒體密碼）上的泛化能力需要驗證。最後，與所有攻擊技術的進步一樣，它存在雙重用途技術的風險，賦能惡意行為者的程度可能與賦能防禦者一樣多。

可行建議

對於安全從業者：立即使用類似SOPG的方法對您組織的密碼進行壓力測試，而不僅僅是舊的馬可夫或GAN模型。更新密碼強度評估器，以納入這種新一代高效、有序的攻擊。

對於AI/ML研究人員：這是一個重新審視目標導向任務中自迴歸模型生成策略的號召。不要只關注損失曲線；分析推論路徑的效率。探索混合神經符號方法，讓學習到的模型引導古典搜尋。

對於供應商與政策制定者：加速超越密碼的轉變。SOPG使得字典攻擊如此高效，以至於中等複雜度的密碼也面臨更大風險。投資並強制要求使用抗釣魚的多因素驗證（如FIDO2/WebAuthn）作為主要驗證方法。對於傳統密碼系統，實施嚴格的速率限制和異常偵測，以識別有序、高速攻擊的模式。

總而言之，這篇論文不僅推進了密碼猜測技術；它提供了一個關於如何最佳化AI流程的最後一步——生成策略——可以在現實世界中獲得比無止境擴展模型本身更大的性能增益的典範。這是一堂關於應用AI效率的課，其影響遠超網路安全領域。