2.1 密碼猜測技術的演進
此領域經歷了幾個不同的發展階段:啟發式規則型方法依賴於手動字典和轉換規則(例如,John the Ripper規則),這類方法依賴經驗且缺乏理論基礎。2009年後真實密碼外洩事件的激增催生了統計方法。如OMEN所使用的馬可夫模型,基於固定長度的歷史來預測下一個字元;而概率上下文無關文法(PCFG)則將密碼分割成模式(字母、數字、符號)並學習其概率。雖然系統化,但這些模型經常過度擬合,且難以泛化。
密碼至今仍是最普遍的使用者驗證方式,在簡便性與有效性之間取得平衡。然而,其安全性持續受到密碼猜測攻擊的挑戰,這在攻擊性安全測試與防禦強度評估中都是關鍵環節。傳統方法,從基於規則的枚舉到如馬可夫鏈和PCFG等統計模型,在多樣性與效率上存在固有的限制。深度學習的出現,特別是自迴歸神經網路,預示著典範的轉移。然而,一個關鍵的疏忽持續存在:生成方法本身。標準的取樣技術引入了隨機性,產生重複密碼和無序的輸出,嚴重阻礙了攻擊效率。本文介紹了SOPG(基於搜尋的有序密碼生成),這是一種新穎的方法,迫使自迴歸模型以近似概率降序的方式生成密碼,從而徹底改變了基於神經網路的密碼猜測效率。
此領域經歷了幾個不同的發展階段:啟發式規則型方法依賴於手動字典和轉換規則(例如,John the Ripper規則),這類方法依賴經驗且缺乏理論基礎。2009年後真實密碼外洩事件的激增催生了統計方法。如OMEN所使用的馬可夫模型,基於固定長度的歷史來預測下一個字元;而概率上下文無關文法(PCFG)則將密碼分割成模式(字母、數字、符號)並學習其概率。雖然系統化,但這些模型經常過度擬合,且難以泛化。
能夠學習複雜高維分佈的深度學習模型,成為強大的後繼者。PassGAN利用生成對抗網路(GANs)來生成密碼,儘管GANs對於離散資料眾所周知地不穩定。VAEPass應用了變分自編碼器。最近且最相關的方法是PassGPT,它利用了GPT(生成式預訓練轉換器)架構,這是一種自迴歸模型,根據所有先前的標記來預測下一個標記。然而,所有這些模型在生成過程中通常依賴標準取樣(例如,隨機取樣、top-k取樣、核心取樣),這無法保證順序性或唯一性。
SOPG解決了隨機取樣的根本效率問題。它不是隨機生成密碼,而是將密碼生成框架為一個搜尋問題。目標是在由模型詞彙表和最大長度定義的龐大可能密碼空間中,以近似於底層自迴歸神經網路所分配的概率降序進行遍歷。
雖然PDF摘要未詳述具體演算法,但SOPG很可能採用或改編了由模型概率估計引導的最佳優先搜尋或波束搜尋策略。候選密碼表示為一個標記序列。搜尋維護一個優先佇列(例如,堆積),其中包含部分或完整的序列,並根據其累積概率或從中推導出的啟發式分數進行排序。在每一步中,最有希望的候選者會透過附加可能的下一個標記(來自詞彙表)來擴展,新的候選者會被評分並重新插入佇列。這確保了輸出流大致上從最可能到最不可能排序。
作者透過建構SOPGesGPT來實例化他們的方法,這是一個基於GPT架構的密碼猜測模型。該模型在洩漏的密碼資料集上進行訓練,以學習底層分佈。關鍵在於,在生成階段,它使用SOPG演算法而非標準取樣,使其成為展示SOPG優越性的載體。
給定一個自迴歸模型(如GPT),密碼序列 $S = (s_1, s_2, ..., s_T)$ 的概率分解為: $$P(S) = \prod_{t=1}^{T} P(s_t | s_1, ..., s_{t-1})$$ 其中 $s_t$ 是位置 $t$ 的標記,而 $P(s_t | s_1, ..., s_{t-1})$ 是模型的輸出概率分佈。
標準隨機取樣從此分佈中抽取 $s_t$,導致隨機漫步。相反地,SOPG旨在找到最大化 $P(S)$ 的序列 $S^*$,或系統性地枚舉高概率序列。這可以視為: $$S^* = \arg\max_{S \in \mathcal{V}^*} P(S)$$ 其中 $\mathcal{V}^*$ 是最大長度內所有可能序列的集合。窮舉搜尋是難以處理的。因此,SOPG採用一種啟發式搜尋演算法(例如,使用對數概率成本的 $A^*$)來有效地近似這種有序枚舉。搜尋使用負對數概率作為成本:$\text{cost}(S) = -\sum_{t=1}^{T} \log P(s_t | s_1, ..., s_{t-1})$。該演算法旨在按成本遞增的順序輸出序列。
35.06%
單一網站測試中達到的最高覆蓋率。
81%
比最新模型更高的覆蓋率。
421%
相較於基於GAN的方法有巨大提升。
論文首先在相同的底層模型上,驗證了SOPG相對於標準隨機取樣的核心效率主張。主要發現:
SOPGesGPT在單一網站測試中與主要基準進行了比較:OMEN(馬可夫)、FLA、PassGAN(GAN)、VAEPass(VAE)以及最新的PassGPT(使用隨機取樣的GPT)。
框架:密碼猜測效率象限
我們可以在兩個軸上分析模型:模型能力(學習複雜分佈的能力,例如 GPT > 馬可夫)和生成效率(輸出的最佳排序)。
立即應用:
論文的突破並非一個新的神經網路架構;而是對生成瓶頸的精準打擊。多年來,密碼猜測社群,如同生成式AI的趨勢一樣,痴迷於模型能力——更大的轉換器、更好的GANs——同時將取樣過程視為一個已解決的次要問題。Jin等人正確地指出這是一個關鍵的謬誤。從強大模型中隨機取樣,就像使用精準狙擊步槍隨機掃射;SOPG則加上了瞄準鏡和策略。這種從建模到搜尋的焦點轉移,是論文最重要的概念貢獻。它證明了在輸出順序直接映射到成功率(先破解最簡單的密碼)的安全應用中,搜尋效率可以勝過模型擬合度的邊際增益。
論證具有說服力且結構良好:(1) 確立當前神經網路猜測(隨機、充滿重複)的重要性與低效率。(2) 提出SOPG作為基於搜尋的解決方案,以強制執行概率排序、唯一的生成。(3) 在相同模型上實證證明SOPG相對於隨機取樣的效率——一個乾淨的對照研究。(4) 透過建構SOPGesGPT並擊敗現有基準,展示端到端的優越性。相較於PassGPT的81%提升尤其說明問題;它透過比較相同GPT架構的兩種不同生成方案,隔離了SOPG的價值。
優點: 核心思想優雅且影響力大。實驗設計穩健,結果清晰、決定性。性能提升並非漸進式,而是變革性的,表明SOPG可能成為新的標準組件。這項工作與古典AI中的搜尋演算法深度連結,將其應用於現代深度學習情境——這是一次富有成果的跨領域融合。
缺陷與開放問題: PDF摘錄缺乏關鍵細節:具體的搜尋演算法(A*、波束、最佳優先?)及其計算開銷。搜尋並非免費;維護優先佇列和評分眾多候選者是有成本的。論文聲稱「更少的推論」,但這是否考慮了搜尋內部的推論?需要完整的成本效益分析。此外,「近似降序」這個限定詞很模糊——近似程度如何?對於非常長或複雜的密碼,順序是否會退化?雖然比較結果令人印象深刻,但這是「單一網站測試」。在不同資料集(企業密碼 vs. 社交媒體密碼)上的泛化能力需要驗證。最後,與所有攻擊技術的進步一樣,它存在雙重用途技術的風險,賦能惡意行為者的程度可能與賦能防禦者一樣多。
對於安全從業者:立即使用類似SOPG的方法對您組織的密碼進行壓力測試,而不僅僅是舊的馬可夫或GAN模型。更新密碼強度評估器,以納入這種新一代高效、有序的攻擊。
對於AI/ML研究人員:這是一個重新審視目標導向任務中自迴歸模型生成策略的號召。不要只關注損失曲線;分析推論路徑的效率。探索混合神經符號方法,讓學習到的模型引導古典搜尋。
對於供應商與政策制定者:加速超越密碼的轉變。SOPG使得字典攻擊如此高效,以至於中等複雜度的密碼也面臨更大風險。投資並強制要求使用抗釣魚的多因素驗證(如FIDO2/WebAuthn)作為主要驗證方法。對於傳統密碼系統,實施嚴格的速率限制和異常偵測,以識別有序、高速攻擊的模式。
總而言之,這篇論文不僅推進了密碼猜測技術;它提供了一個關於如何最佳化AI流程的最後一步——生成策略——可以在現實世界中獲得比無止境擴展模型本身更大的性能增益的典範。這是一堂關於應用AI效率的課,其影響遠超網路安全領域。