Ukuran Kekuatan Kata Laluan Kanonikal: Memformalkan Keselamatan Terhadap Serangan Tebakan

1. Pengenalan

Kertas kerja ini menangani jurang asas dalam wacana keselamatan kata laluan: ketiadaan definisi yang ketat bagi "kekuatan kata laluan." Ia berhujah bahawa pendekatan semasa sering bersifat anekdot dan gagal mengambil kira strategi penyerang. Penulis mencadangkan ukuran kanonikal berdasarkan kecekapan serangan tebakan yang berpotensi, mengalihkan tumpuan daripada ciri-ciri kata laluan kepada ciri-ciri serangan.

2. Keadaan Semasa

Kertas kerja ini mengkritik keadaan semasa keselamatan kata laluan sebagai "suram seperti perubatan zaman pertengahan," dengan memetik pemerhatian Bruce Schneier bahawa banyak nasihat adalah berdasarkan anekdot dan bukannya analisis. Ia menekankan ketiadaan kaedah yang memuaskan untuk mengukur kekuatan set data kata laluan, seperti yang dinyatakan dalam literatur terkini [3]. Pengukur kekuatan kata laluan biasa diketepikan kerana hanya mengukur "peniruan" dan bukannya rintangan sebenar terhadap serangan pintar.

3. Teras Wawasan & Aliran Logik

Teras Wawasan: Kekuatan kata laluan bukanlah sifat intrinsik bagi rentetan aksara; ia adalah sifat relasional yang ditakrifkan sepenuhnya oleh strategi tebakan penyerang. Matlamat pembela bukanlah untuk mencipta "kata laluan kuat" dalam vakum, tetapi untuk mencipta kata laluan yang menunjukkan prestasi buruk terhadap set strategi serangan yang boleh dilaksanakan yang mungkin digunakan oleh musuh yang rasional.

Aliran Logik: Hujah diteruskan dengan ketepatan formal:

Takrifkan serangan tebakan sebagai senarai teratur (kamus) calon kata laluan.
Buktikan bahawa mana-mana dua serangan hanya berbeza dari segi susunan senarai ini.
Buat kesimpulan bahawa kekuatan kata laluan terhadap serangan tertentu adalah kedudukannya dalam kamus serangan tersebut.
Memandangkan pembela tidak tahu susunan serangan yang tepat, mereka mesti mempertimbangkan set serangan yang munasabah.
Oleh itu, ukuran kekuatan pembela adalah nilai jangkaan kedudukan kata laluan merentasi set serangan ini.

Ini membalikkan skrip: keselamatan dimodelkan sebagai permainan di mana pembela menganggarkan ruang strategi penyerang.

4. Kekuatan & Kelemahan

Kekuatan:

Ketegasan Konseptual: Menyediakan definisi formal pertama bagi kekuatan kata laluan yang berpusatkan serangan, melangkaui peraturan heuristik.
Asas Teori Permainan: Membingkaikan pemilihan kata laluan dengan betul sebagai interaksi strategik, selaras dengan analisis keselamatan moden seperti yang terdapat dalam penyelidikan Teori Permainan untuk Keselamatan.
Mendedahkan Heuristik yang Cacat: Berkesan mendedahkan dasar yang berfokuskan pematuhan (contohnya, "mesti termasuk nombor dan simbol") yang menghasilkan corak yang boleh diramal.

Kelemahan & Batasan:

Ketidakbolehlaksanaan Pengiraan: Metrik teras—mengira pangkat jangkaan merentasi semua serangan yang munasabah—adalah tidak boleh dilaksanakan secara pengiraan untuk ruang kata laluan yang besar. Ia adalah ideal teori, bukan alat praktikal untuk pengukur kekuatan masa nyata.
Meninggalkan Realiti Utama: Model ini mengandaikan serangan "tebakan luar talian" dengan percubaan tanpa had, mengabaikan had kadar, penguncian akaun, dan sistem pengesanan dalam talian yang mengubah strategi penyerang secara asas.
Tiada Panduan untuk Set Serangan: Lompatan kritikal kertas kerja—mentakrifkan "set serangan yang boleh dilaksanakan"—ditinggalkan tanpa spesifikasi yang jelas. Bagaimanakah pembela memodelkan set ini secara praktikal? Inilah inti masalahnya.

5. Wawasan Boleh Tindak

Bagi pengamal keselamatan, kertas kerja ini memerlukan peralihan paradigma:

Berhenti Mengukur Peniruan: Buang pengukur kata laluan yang hanya menyemak kelas aksara. Ia melatih pengguna untuk mencipta kata laluan yang kuat terhadap pengukur, bukan terhadap penyerang.
Fikirkan dalam Taburan, Bukan Peraturan: Daripada mewajibkan simbol, galakkan pengguna untuk memilih kata laluan daripada taburan entropi tinggi yang tidak mungkin sejajar dengan kamus serangan biasa (contohnya, menggunakan diceware atau pengurus kata laluan).
Modelkan Musuh Anda: Untuk sistem kritikal, lakukan pemodelan ancaman untuk mentakrifkan strategi serangan yang munasabah (contohnya, brute-force, kamus berdasarkan pelanggaran lalu, maklumat peribadi sasaran). Sesuaikan dasar kata laluan untuk mengganggu strategi khusus tersebut.
Terima Ketidakpastian: Akui bahawa pengukuran kekuatan yang sempurna adalah mustahil. Matlamatnya adalah untuk meningkatkan kos dan ketidakpastian bagi penyerang, bukan untuk mencapai skor yang sempurna.

6. Kerangka Teknikal

6.1 Model Serangan Formal

Kertas kerja ini memodelkan serangan tebakan $A$ sebagai jujukan teratur (kamus) $D_A = (w_1, w_2, w_3, ...)$ calon kata laluan, di mana $w_i$ adalah perkataan daripada abjad terhingga. Penyerang mencuba kata laluan mengikut susunan ini sehingga berjaya. Serangan adalah "luar talian," bermakna antara muka memberikan maklum balas kejayaan/kegagalan serta-merta tanpa had.

6.2 Formulasi Matematik

Biarkan $p$ menjadi kata laluan tertentu. Bagi serangan tertentu $A$, kekuatan $p$ ditakrifkan sebagai pangkatnya dalam $D_A$: $$S_A(p) = \text{rank}_A(p)$$ di mana $\text{rank}_A(p) = i$ jika $p = w_i \in D_A$.

Memandangkan pembela tidak tahu $A$ yang tepat, mereka mempertimbangkan set $\mathcal{A}$ serangan yang mungkin. Kekuatan kata laluan kanonikal $C(p)$ kemudiannya adalah pangkat jangkaan: $$C(p) = \mathbb{E}_{A \sim \mathcal{A}}[\,S_A(p)\,] = \sum_{A \in \mathcal{A}} P(A) \cdot \text{rank}_A(p)$$ di mana $P(A)$ adalah kebarangkalian (atau kemungkinan) yang diberikan kepada serangan $A$ daripada set $\mathcal{A}$. Formulasi ini secara langsung mengikat kekuatan kepada kepercayaan pembela tentang strategi penyerang.

7. Keputusan Eksperimen & Analisis

Eksperimen Konseptual & Implikasi: Walaupun kertas kerja itu sendiri tidak membentangkan data empirikal daripada larian perisian, ia secara logik menunjukkan keperluan modelnya melalui eksperimen pemikiran. Ia menunjukkan bahawa dua kata laluan, "Password123!" dan "xQ37!z9pLm", mungkin menerima skor yang serupa daripada pengukur naif yang menyemak panjang dan kepelbagaian aksara. Walau bagaimanapun, "Password123!" akan mempunyai pangkat yang sangat rendah (kekuatan tinggi) dalam susunan serangan brute-force tetapi pangkat yang sangat tinggi (kekuatan rendah) dalam serangan kamus yang mengutamakan perkataan asas dan corak biasa. Ukuran kanonikal $C(p)$, dengan purata merentasi kedua-dua jenis serangan, akan mendedahkan kelemahan sebenar "Password123!" berbanding rentetan rawak.

Tafsiran Carta (Konseptual): Bayangkan carta bar yang membandingkan tiga kaedah penilaian kata laluan untuk sampel kata laluan:

Kaedah A (Pengukur Naif): Menunjukkan "Password123!" dan "xQ37!z9pLm" sebagai sama kuat.
Kaedah B (Pangkat Serangan Kamus): Menunjukkan "Password123!" sebagai sangat lemah (nombor pangkat rendah) dan "xQ37!z9pLm" sebagai kuat (nombor pangkat tinggi).
Kaedah C (Ukuran Kanonikal $C(p)$): Menunjukkan purata berwajaran. Skor "Password123!" merosot teruk disebabkan kebarangkalian tingginya dalam serangan kamus, manakala rentetan rawak mengekalkan skor tinggi. Carta ini secara visual akan berhujah bahawa $C(p)$ berkorelasi lebih baik dengan kebolehretakan dunia sebenar.

8. Kerangka Analisis: Kajian Kes

Skenario: Dasar kata laluan syarikat memerlukan: "Sekurang-kurangnya 12 aksara, termasuk huruf besar, huruf kecil, nombor, dan simbol."

Analisis Tradisional: Kata laluan seperti "Summer2024!$" lulus dasar dan mendapat penarafan "Kuat" daripada pengukur biasa.

Analisis Ukuran Kanonikal:

Takrifkan Set Serangan $\mathcal{A}$:
- $A_1$: Serangan kamus menggunakan perkataan biasa ("Summer"), musim, tahun, dan akhiran simbol biasa ("!$"). Kebarangkalian: Tinggi (0.7).
- $A_2$: Serangan sasaran menggunakan nama syarikat, maklumat pekerja. Kebarangkalian: Rendah untuk serangan pukal (0.1).
- $A_3$: Brute-force penuh pada ruang 12-aksara. Kebarangkalian: Sangat Rendah (0.001).
- $A_4$: Serangan menggunakan kata laluan daripada pelanggaran terdahulu syarikat serupa. Kebarangkalian: Sederhana (0.199).
Anggarkan Pangkat:
- $\text{rank}_{A1}("Summer2024!$")$: Sangat rendah (contohnya, dalam 10 juta teratas).
- $\text{rank}_{A2}(p)$: Boleh jadi rendah jika disasarkan.
- $\text{rank}_{A3}(p)$: Sangat tinggi (~$95^{12}$).
- $\text{rank}_{A4}(p)$: Berpotensi rendah jika corak biasa.
Kira $C(p)$: Pangkat jangkaan didominasi oleh serangan kamus berkebarangkalian tinggi $A_1$, menghasilkan skor kekuatan kanonikal yang rendah, mendedahkan kegagalan dasar tersebut.

Kesimpulan: Dasar itu mencipta taburan yang boleh diramal. Kerangka kanonikal menunjukkan bahawa mempertahankan diri memerlukan pemecahan kebolehramalan ini, mungkin dengan mewajibkan kata laluan yang dijana secara rawak atau menggunakan senarai blok kata laluan lemah yang diketahui, yang secara langsung mengubah kebarangkalian dalam $\mathcal{A}$.

9. Aplikasi & Hala Tuju Masa Depan

Dasar Kata Laluan Adaptif: Sistem boleh menggunakan kerangka kanonikal untuk mencipta dasar dinamik. Daripada peraturan statik, perkhidmatan backend boleh menganggarkan $\mathcal{A}$ berdasarkan risikan ancaman semasa (contohnya, kamus yang baru dibocorkan) dan menolak kata laluan dengan skor $C(p)$ yang rendah terhadap model yang dikemas kini itu.
Integrasi Pengurus Kata Laluan: Pengurus kata laluan adalah ideal untuk melaksanakan ini. Ia boleh mengekalkan model tempatan $\mathcal{A}$ (berdasarkan data pelanggaran global dan peraturan heuristik) dan menggunakannya untuk menjana kata laluan yang memaksimumkan $C(p)$. Ini mengubah model teori menjadi peningkatan keselamatan praktikal dan telus kepada pengguna.
Bukti Keselamatan Formal: Model ini menyediakan asas untuk membuktikan secara formal sifat keselamatan algoritma penjanaan kata laluan dalam literatur akademik, serupa dengan cara algoritma penyulitan dianalisis.
Model Ancaman Hibrid: Kerja masa depan mesti mengintegrasikan ukuran kanonikal dengan kekangan dunia sebenar seperti had kadar. Set serangan $\mathcal{A}$ kemudiannya akan termasuk bukan sahaja susunan kata laluan, tetapi juga strategi untuk mengagihkan tebakan merentasi masa dan akaun.
Pembelajaran Mesin untuk $\mathcal{A}$: Masalah terbuka utama—mentakrifkan set serangan—boleh ditangani dengan ML. Sistem boleh melatih model pada percubaan retakan sebenar dan kata laluan yang dibocorkan untuk terus belajar dan mengemas kini taburan kebarangkalian $P(A)$ merentasi strategi, mencipta sasaran bergerak untuk penyerang.

10. Rujukan

Panferov, E. (2016). A Canonical Password Strength Measure. arXiv:1505.05090v4 [cs.CR].
Schneier, B. (2007). Schneier on Security. Wiley.
Bonneau, J. (2012). The Science of Guessing: Analyzing an Anonymized Corpus of 70 Million Passwords. IEEE Symposium on Security and Privacy.
Shannon, C. E. (1948). A Mathematical Theory of Communication. The Bell System Technical Journal.
Florêncio, D., & Herley, C. (2007). A Large-Scale Study of Web Password Habits. Proceedings of the 16th International Conference on World Wide Web.
Ur, B., et al. (2015). Do Users' Perceptions of Password Security Match Reality? Proceedings of the 2015 CHI Conference on Human Factors in Computing Systems.
NIST Special Publication 800-63B (2017). Digital Identity Guidelines: Authentication and Lifecycle Management.
Wang, D., et al. (2016). The Tangled Web of Password Reuse. NDSS Symposium 2016.