SOPG: تولید رمز عبور مبتنی بر جستجو به‌صورت مرتب‌شده برای شبکه‌های عصبی خودرگرسیو

1. مقدمه

رمزهای عبور همچنان فراگیرترین روش احراز هویت کاربر هستند که سادگی را با اثربخشی متعادل می‌کنند. با این حال، امنیت آن‌ها همواره با حملات حدس رمز عبور به چالش کشیده می‌شود که جزء حیاتی در هر دو حوزه آزمایش امنیت تهاجمی و ارزیابی قدرت دفاعی است. روش‌های سنتی، از شمارش مبتنی بر قاعده تا مدل‌های آماری مانند زنجیره‌های مارکوف و PCFG، محدودیت‌های ذاتی در تنوع و کارایی دارند. ظهور یادگیری عمیق، به ویژه شبکه‌های عصبی خودرگرسیو، نوید یک تغییر پارادایم را داد. با این حال، یک غفلت حیاتی همچنان پابرجا بود: خود روش تولید. تکنیک‌های استاندارد نمونه‌گیری، تصادفی بودن را معرفی می‌کنند که منجر به رمزهای عبور تکراری و خروجی نامرتب می‌شود و به شدت کارایی حمله را مختل می‌کند. این مقاله SOPG (تولید رمز عبور مرتب‌شده مبتنی بر جستجو) را معرفی می‌کند، روشی نوین که مدل‌های خودرگرسیو را وادار می‌کند رمزهای عبور را به ترتیب تقریبی نزولی احتمال تولید کنند و بدین ترتیب کارایی حدس رمز عبور مبتنی بر شبکه عصبی را متحول می‌سازد.

2. پیشینه و کارهای مرتبط

2.1 تکامل حدس رمز عبور

این حوزه از مراحل متمایزی تکامل یافته است: روش‌های مبتنی بر قاعده اکتشافی به فرهنگ‌های لغت دستی و قواعد تبدیل (مانند قواعد John the Ripper) متکی بودند که وابسته به تجربه و فاقد پایه نظری بودند. گسترش نشت رمزهای عبور واقعی پس از سال ۲۰۰۹، روش‌های آماری را ممکن ساخت. مدل مارکوف، همان‌طور که در OMEN استفاده می‌شود، کاراکتر بعدی را بر اساس تاریخچه‌ای با ترتیب ثابت پیش‌بینی می‌کند، در حالی که دستور زبان احتمالی مستقل از متن (PCFG) رمزهای عبور را به الگوها (حروف، رقم، نماد) تقسیم کرده و احتمالات آن‌ها را یاد می‌گیرد. اگرچه این مدل‌ها سیستماتیک هستند، اما اغلب بیش‌برازش می‌دهند و با تعمیم‌دهی مشکل دارند.

2.2 رویکردهای شبکه عصبی

مدل‌های یادگیری عمیق، که قادر به یادگیری توزیع‌های پیچیده و چندبعدی هستند، به عنوان جانشینان قدرتمند ظاهر شدند. PassGAN از شبکه‌های مولد تخاصمی (GANs) برای تولید رمز عبور استفاده کرد، اگرچه GANها به دلیل ناپایداری برای داده‌های گسسته مشهورند. VAEPass از رمزگذارهای خودکار واریاسیونی استفاده کرد. جدیدترین و مرتبط‌ترین رویکرد، PassGPT است که از معماری GPT (ترنسفورماتور پیش‌آموزش‌دیده مولد) بهره می‌برد، یک مدل خودرگرسیو که توکن بعدی را با توجه به تمام توکن‌های قبلی پیش‌بینی می‌کند. با این حال، همه این مدل‌ها معمولاً در حین تولید به نمونه‌گیری استاندارد (مانند نمونه‌گیری تصادفی، top-k، نمونه‌گیری هسته) متکی هستند که ترتیب یا یکتایی را تضمین نمی‌کند.

3. روش SOPG

3.1 مفهوم اصلی

SOPG به ناکارآمدی اساسی نمونه‌گیری تصادفی می‌پردازد. به جای تولید تصادفی رمزهای عبور، تولید رمز عبور را به عنوان یک مسئله جستجو قالب‌بندی می‌کند. هدف این است که فضای وسیع رمزهای عبور ممکن (تعریف شده توسط واژگان مدل و حداکثر طول) به ترتیبی پیمایش شود که تقریباً نزولی احتمال باشد، همان‌طور که توسط شبکه عصبی خودرگرسیو زیربنایی تعیین شده است.

3.2 الگوریتم جستجو

اگرچه چکیده PDF الگوریتم خاصی را جزئی نمی‌دهد، SOPG احتمالاً از یک استراتژی جستجوی بهترین-اول یا جستجوی پرتو استفاده یا آن را تطبیق می‌دهد که توسط تخمین‌های احتمال مدل هدایت می‌شود. یک رمز عبور کاندید به عنوان دنباله‌ای از توکن‌ها نمایش داده می‌شود. جستجو یک صف اولویت (مانند هیپ) از دنباله‌های جزئی یا کامل را حفظ می‌کند که بر اساس احتمال تجمعی یا امتیاز اکتشافی مشتق شده از آن رتبه‌بندی شده‌اند. در هر مرحله، امیدوارکننده‌ترین کاندید با افزودن توکن‌های بعدی ممکن (از واژگان) گسترش می‌یابد و کاندیدهای جدید امتیازدهی شده و دوباره به صف وارد می‌شوند. این امر تضمین می‌کند که جریان خروجی تقریباً از محتمل‌ترین به کم‌احتمال‌ترین مرتب شده است.

3.3 مدل SOPGesGPT

نویسندگان روش خود را با ساخت SOPGesGPT، یک مدل حدس رمز عبور مبتنی بر معماری GPT، نمونه‌سازی می‌کنند. این مدل بر روی مجموعه داده‌های رمز عبور نشت‌یافته آموزش دیده تا توزیع زیربنایی را یاد بگیرد. نکته حیاتی این است که در مرحله تولید، به جای نمونه‌گیری استاندارد از الگوریتم SOPG استفاده می‌کند و آن را به وسیله‌ای برای نشان دادن برتری SOPG تبدیل می‌کند.

4. جزئیات فنی و فرمول‌بندی ریاضی

با توجه به یک مدل خودرگرسیو (مانند GPT)، احتمال دنباله رمز عبور $S = (s_1, s_2, ..., s_T)$ به صورت زیر تجزیه می‌شود: $$P(S) = \prod_{t=1}^{T} P(s_t | s_1, ..., s_{t-1})$$ که در آن $s_t$ توکن در موقعیت $t$ است و $P(s_t | s_1, ..., s_{t-1})$ توزیع احتمال خروجی مدل است.

نمونه‌گیری تصادفی استاندارد، $s_t$ را از این توزیع می‌کشد که منجر به یک راه‌پیمایی تصادفی می‌شود. در مقابل، SOPG هدفش یافتن دنباله $S^*$ است که $P(S)$ را بیشینه می‌کند یا به طور سیستماتیک دنباله‌های با احتمال بالا را برمی‌شمارد. این را می‌توان به صورت زیر دید: $$S^* = \arg\max_{S \in \mathcal{V}^*} P(S)$$ که در آن $\mathcal{V}^*$ مجموعه تمام دنباله‌های ممکن تا حداکثر طول است. جستجوی جامع غیرعملی است. بنابراین، SOPG از یک الگوریتم جستجوی آگاهانه (مانند $A^*$ با هزینه لگاریتم احتمال) برای تقریب کارآمد این شمارش مرتب‌شده استفاده می‌کند. جستجو از لگاریتم منفی احتمال به عنوان هزینه استفاده می‌کند: $\text{cost}(S) = -\sum_{t=1}^{T} \log P(s_t | s_1, ..., s_{t-1})$. الگوریتم به دنبال خروجی دادن دنباله‌ها به ترتیب افزایش هزینه است.

5. نتایج آزمایشی و تحلیل

نرخ پوشش (SOPGesGPT)

۳۵.۰۶٪

بالاترین پوشش حاصل شده در آزمون تک‌سایتی.

بهبود نسبت به PassGPT

۸۱٪

نرخ پوشش بالاتر نسبت به جدیدترین مدل.

بهبود نسبت به PassGAN

۴۲۱٪

افزایش چشمگیر نسبت به رویکرد مبتنی بر GAN.

5.1 مقایسه با نمونه‌گیری تصادفی

مقاله ابتدا ادعای کارایی اصلی SOPG را در برابر نمونه‌گیری تصادفی استاندارد روی همان مدل زیربنایی اعتبارسنجی می‌کند. یافته‌های کلیدی:

بدون تکرار: SOPG یک لیست یکتا و مرتب تولید می‌کند و اتلاف منابع محاسباتی روی حدس‌های تکراری را حذف می‌کند.
استنتاج‌های کمتر برای پوشش یکسان: برای دستیابی به همان نرخ پوشش (درصد رمزهای عبور شکسته شده از یک مجموعه آزمایشی)، SOPG در مقایسه با نمونه‌گیری تصادفی به استنتاج‌های مدل (پاس‌های رو به جلو) به مراتب کمتری نیاز دارد.
حدس‌های کلی بسیار کمتر: در نتیجه، SOPG همان تعداد رمز عبور را با تولید یک لیست حدس بسیار کوچک‌تر می‌شکند که مستقیماً به زمان‌های حمله سریع‌تر ترجمه می‌شود.

این آزمایش به طور قطعی ثابت می‌کند که روش‌شناسی تولید یک گلوگاه اصلی است و SOPG به طور مؤثری آن را برطرف می‌کند.

5.2 ارزیابی در برابر پیشرفته‌ترین روش‌ها

SOPGesGPT در یک آزمون تک‌سایتی در برابر معیارهای اصلی مقایسه شد: OMEN (مارکوف)، FLA، PassGAN (GAN)، VAEPass (VAE) و جدیدترین PassGPT (GPT با نمونه‌گیری تصادفی).

نرخ پوشش: SOPGesGPT به نرخ پوشش ۳۵.۰۶٪ دست یافت. بهبودها شگفت‌آور است: ۲۵۴٪ نسبت به OMEN، ۲۹۸٪ نسبت به FLA، ۴۲۱٪ نسبت به PassGAN، ۳۸۰٪ نسبت به VAEPass و ۸۱٪ نسبت به PassGPT.
نرخ مؤثر: مقاله همچنین از پیشتازی در "نرخ مؤثر" نام می‌برد که احتمالاً به تعداد رمزهای عبور معتبر یکتای تولید شده در واحد زمان یا محاسبات اشاره دارد و بیشتر بر کارایی SOPG تأکید می‌کند.

توضیح نمودار: یک نمودار میله‌ای "نرخ پوشش (٪)" را روی محور Y و نام مدل‌ها را روی محور X نشان می‌دهد. میله SOPGesGPT به طور چشمگیری بلندتر از بقیه خواهد بود، با PassGPT در رتبه دوم اما به طور قابل توجهی پایین‌تر. یک خط رویی می‌تواند تعداد حدس‌های مورد نیاز برای رسیدن به پوشش ۲۰٪ را نشان دهد، جایی که خط SOPGesGPT در ابتدا به شدت افزایش می‌یابد و قابلیت "ضربه سخت و سریع" آن را نشان می‌دهد.

6. چارچوب تحلیل و مثال موردی

چارچوب: ربع کارایی حدس رمز عبور
ما می‌توانیم مدل‌ها را روی دو محور تحلیل کنیم: ظرفیت مدل (توانایی یادگیری توزیع‌های پیچیده، مثلاً GPT > مارکوف) و کارایی تولید (مرتب‌سازی بهینه خروجی‌ها).

ربع I (ظرفیت بالا، کارایی پایین): PassGPT، VAEPass. مدل‌های قدرتمندی که توسط نمونه‌گیری تصادفی فلج شده‌اند.
ربع II (ظرفیت بالا، کارایی بالا): SOPGesGPT. حالت هدفی که توسط این کار حاصل شده است.
ربع III (ظرفیت پایین، کارایی پایین): حملات پایه مبتنی بر قاعده.
ربع IV (ظرفیت پایین، کارایی بالا): OMEN، FLA. تولید آن‌ها ذاتاً مرتب‌شده است (بر اساس احتمال) اما ظرفیت مدل آن‌ها عملکرد نهایی را محدود می‌کند.

مثال موردی غیرکدی: دو جوینده گنج (مهاجمان) را تصور کنید که یک نقشه باکیفیت یکسان (مدل GPT آموزش‌دیده) دارند. یک جوینده (نمونه‌گیری تصادفی) به طور تصادفی راه می‌رود، اغلب مکان‌ها را دوباره بازدید می‌کند و گنج را به کندی پیدا می‌کند. جوینده دیگر (SOPG) یک فلزیاب دارد که ابتدا به امیدوارکننده‌ترین مکان نزدیک اشاره می‌کند و یک مسیر سیستماتیک و غیرتکراری را دنبال می‌کند. برای همان تعداد قدم، جوینده SOPG گنج بسیار بیشتری پیدا می‌کند. SOPG آن فلزیاب برای نقشه شبکه عصبی است.

7. چشم‌انداز کاربرد و جهت‌های آینده

کاربردهای فوری:

ارزیابی پیشگیرانه قدرت رمز عبور: شرکت‌های امنیتی می‌توانند از ابزارهای مبتنی بر SOPG برای حسابرسی سیاست‌های رمز عبور استفاده کنند تا محتمل‌ترین حدس‌های حمله را با سرعتی چندین برابر سریع‌تر تولید کنند و ارزیابی‌های واقع‌بینانه‌ای از ریسک ارائه دهند.
آزمایشگاه‌های قانونی دیجیتال و بازیابی قانونی: تسریع بازیابی رمز عبور در تحقیقات قانونی که زمان حیاتی است.

جهت‌های تحقیقاتی آینده:

استراتژی‌های جستجوی ترکیبی: ترکیب SOPG با تصادفی بودن محدود برای کاوش زودهنگام حدس‌های "خلاقانه" با احتمال کمی پایین‌تر اما بالقوه پربار، متعادل کردن بهره‌برداری و اکتشاف.
جستجوی شتاب‌یافته سخت‌افزاری: پیاده‌سازی الگوریتم جستجو روی GPU/TPU برای موازی‌سازی ارزیابی کاندیدها، کاهش سربار فرآیند جستجو.
فراتر از رمزهای عبور: اعمال پارادایم تولید مرتب‌شده به سایر وظایف مدل خودرگرسیو که خروجی مرتب و یکتا ارزشمند است، مانند تولید موارد آزمایشی برای نرم‌افزار، یا ایجاد انواع طراحی متنوع به ترتیب امکان‌پذیری.
اقدامات متقابل دفاعی: تحقیق در مورد شناسایی و دفاع در برابر چنین حملات کارآمد و مرتبی، احتمالاً با مطالعه "اثر انگشت" یک لیست حدس تولیدشده توسط SOPG در مقابل یک لیست تصادفی.

8. مراجع

M. Jin, J. Ye, R. Shen, H. Lu, "Search-based Ordered Password Generation of Autoregressive Neural Networks," Manuscript Submitted for Publication.
A. Narayanan and V. Shmatikov, "Fast dictionary attacks on passwords using time-space tradeoff," in Proceedings of the 12th ACM conference on Computer and communications security, 2005.
M. Weir, S. Aggarwal, B. de Medeiros, and B. Glodek, "Password cracking using probabilistic context-free grammars," in 2009 30th IEEE Symposium on Security and Privacy, 2009.
J. Ma, W. Yang, M. Luo, and N. Li, "A study of probabilistic password models," in 2014 IEEE Symposium on Security and Privacy, 2014.
B. Hitaj, P. Gasti, G. Ateniese, and F. Perez-Cruz, "PassGAN: A Deep Learning Approach for Password Guessing," in Applied Cryptography and Network Security Workshops, 2019.
OpenAI, "Improving Language Understanding by Generative Pre-Training," 2018. [Online]. Available: https://cdn.openai.com/research-covers/language-unsupervised/language_understanding_paper.pdf
M. Pasquini, D. Bernardo, and G. Ateniese, "PassGPT: Password Modeling and (Guessing) with Large Language Models," in arXiv preprint arXiv:2306.01745, 2023.

9. تحلیل اصلی و تفسیر کارشناسی

بینش اصلی

دستاورد مقاله یک معماری عصبی جدید نیست؛ بلکه یک ضربه جراحی بر گلوگاه تولید است. برای سال‌ها، جامعه حدس رمز عبور، که روندهای هوش مصنوعی مولد را منعکس می‌کرد، بر ظرفیت مدل وسواس داشت - ترنسفورماتورهای بزرگتر، GANهای بهتر - در حالی که فرآیند نمونه‌گیری را به عنوان یک مسئله حل‌شده و ثانویه تلقی می‌کرد. جین و همکاران به درستی این را یک مغالطه حیاتی شناسایی می‌کنند. نمونه‌گیری تصادفی از یک مدل قدرتمند مانند استفاده از یک تفنگ تک‌تیراندازی دقیق برای پاشیدن تصادفی گلوله‌ها است؛ SOPG دوربین و استراتژی را اضافه می‌کند. این تغییر تمرکز از مدل‌سازی به جستجو مهم‌ترین مشارکت مفهومی مقاله است. این نشان می‌دهد که در کاربردهای امنیتی که ترتیب خروجی مستقیماً به نرخ موفقیت (شکستن آسان‌ترین رمزهای عبور اول) نگاشت می‌شود، کارایی جستجو می‌تواند بر بهبودهای حاشیه‌ای در وفاداری مدل غلبه کند.

جریان منطقی

استدلال قانع‌کننده و به خوبی ساختار یافته است: (1) اهمیت و ناکارآمدی حدس عصبی فعلی (تصادفی، پر از تکرار) را اثبات می‌کند. (2) SOPG را به عنوان یک راه‌حل مبتنی بر جستجو برای اعمال تولید یکتا و مرتب‌شده بر اساس احتمال پیشنهاد می‌دهد. (3) کارایی SOPG را نسبت به نمونه‌گیری تصادفی روی همان مدل به صورت تجربی ثابت می‌کند - یک مطالعه حذفی تمیز. (4) برتری سرتاسری را با ساخت SOPGesGPT و درهم شکستن معیارهای موجود نشان می‌دهد. بهبود ۸۱٪ نسبت به PassGPT به ویژه گویاست؛ این مقایسه ارزش SOPG را با مقایسه همان معماری GPT با دو طرح تولید مختلف ایزوله می‌کند.

نقاط قوت و ضعف

نقاط قوت: ایده اصلی ظریف و پرتأثیر است. طراحی آزمایشی قوی است، با نتایج واضح و قطعی. بهبودهای عملکردی افزایشی نیستند؛ بلکه تحول‌آفرین هستند و نشان می‌دهند SOPG می‌تواند به یک جزء استاندارد جدید تبدیل شود. این کار ارتباط عمیقی با الگوریتم‌های جستجو از هوش مصنوعی کلاسیک برقرار می‌کند و آن‌ها را در بافت یادگیری عمیق مدرن به کار می‌برد - یک تلاقی ثمربخش.

نقاط ضعف و سؤالات باز: گزیده PDF فاقد جزئیات حیاتی است: الگوریتم جستجوی خاص (A*، پرتو، بهترین-اول؟) و سربار محاسباتی آن. جستجو رایگان نیست؛ حفظ یک صف اولویت و امتیازدهی به کاندیدهای زیاد هزینه دارد. مقاله ادعای "استنتاج‌های کمتر" می‌کند، اما آیا این هزینه استنتاج‌های داخلی جستجو را در نظر می‌گیرد؟ یک تحلیل کامل هزینه-فایده مورد نیاز است. علاوه بر این، قید "تقریباً به ترتیب نزولی" مبهم است - چقدر تقریبی؟ آیا ترتیب برای رمزهای عبور بسیار طولانی یا پیچیده تنزل می‌کند؟ مقایسه، اگرچه چشمگیر است، یک "آزمون تک‌سایتی" است. تعمیم در مجموعه داده‌های متنوع (رمزهای عبور شرکتی در مقابل رسانه‌های اجتماعی) نیاز به تأیید دارد. در نهایت، مانند همه پیشرفت‌های حمله، خطر فناوری دوگانه‌کار را دارد که به همان اندازه که مدافعان را توانمند می‌سازد، بازیگران مخرب را نیز توانمند می‌کند.

بینش‌های عملی

برای متخصصان امنیت: بلافاصله رمزهای عبور سازمان خود را در برابر روش‌شناسی‌های مشابه SOPG آزمایش فشار دهید، نه فقط مدل‌های قدیمی مارکوف یا GAN. برآوردگرهای قدرت رمز عبور را به‌روز کنید تا این نسل جدید حملات کارآمد و مرتب را در نظر بگیرند.

برای محققان هوش مصنوعی/یادگیری ماشین: این یک فراخوان برای بازبینی استراتژی‌های تولید در مدل‌های خودرگرسیو برای وظایف هدف‌محور است. فقط روی منحنی‌های زیان تمرکز نکنید؛ کارایی مسیر استنتاج را تحلیل کنید. رویکردهای ترکیبی عصبی-نمادین را کاوش کنید که در آن یک مدل یادگرفته‌شده یک جستجوی کلاسیک را هدایت می‌کند.

برای فروشندگان و سیاست‌گذاران: حرکت به فراتر از رمزهای عبور را تسریع کنید. SOPG حملات فرهنگ لغت را چنان کارآمد می‌کند که حتی رمزهای عبور نسبتاً پیچیده نیز در معرض خطر بیشتری هستند. در احراز هویت چندعاملی مقاوم در برابر فیشینگ (مانند FIDO2/WebAuthn) به عنوان روش اصلی احراز هویت سرمایه‌گذاری کرده و آن را اجباری کنید. برای سیستم‌های رمز عبور قدیمی، محدودیت نرخ سختگیرانه و تشخیص ناهنجاری تنظیم‌شده برای شناسایی الگوی یک حمله مرتب و پرسرعت را پیاده‌سازی کنید.

در نتیجه، این مقاله فقط حدس رمز عبور را پیش نمی‌برد؛ بلکه یک کلاس استادی در چگونگی بهینه‌سازی مرحله نهایی یک خط لوله هوش مصنوعی - استراتژی تولید - ارائه می‌دهد که می‌تواند بهبودهای عملکردی دنیای واقعی بیشتری نسبت به مقیاس‌دهی بی‌پایان خود مدل به همراه آورد. این یک درس در کارایی هوش مصنوعی کاربردی است که فراتر از امنیت سایبری طنین‌انداز است.