Ƙarfafa Tsaron Sirrin Shiga: Tsarin Ƙima Mai Ingantaccen Inganci Ta Amfani da Dazuzzukan Bazuwar

Teburin Abubuwan Ciki

1. Gabatarwa

Sirrin shiga ya kasance babban hanyar tabbatar da ainihi, duk da haka shi ne mabuɗin rauni. Na'urorin ƙima na gargajiya na ƙarfin sirrin shiga, waɗanda suka dogara da ƙa'idodi masu tsayi kamar buƙatun nau'in haruffa (LUDS), ana sauƙin ƙetare su ta hanyar tsare-tsare masu iya hasasawa (misali, 'P@ssw0rd1!'), suna ba da tunanin tsaro na ƙarya. Wannan takarda tana magance wannan gibi ta hanyar gabatar da tsarin ƙimar ƙarfin sirrin shiga na tushen injin koyo. Babban manufa ita ce a wuce daga duba ƙa'idodi masu sauƙi zuwa samfurin da ya fahimci rikitattun raunuka na mahallin a cikin sirrin shiga da mutum ya zaɓa, a ƙarshe yana ba da ƙima na tsaro mafi inganci da kuma mai yiwuwa.

2. Ayyukan Da Suka Gabata

Binciken da ya gabata a cikin tantance ƙarfin sirrin shiga ya samo asali daga masu duba ƙa'idodi masu sauƙi zuwa samfuran yiwuwa. Aikin farko ya mayar da hankali kan ƙa'idodin tsari. Daga baya, an gabatar da nahawu na mahallin mara yiwuwa (PCFGs) da samfuran Markov don ƙirar halayen ƙirƙirar sirrin shiga. Kwanan nan, an yi amfani da hanyoyin injin koyo, gami da hanyoyin sadarwa na jijiyoyi. Duk da haka, da yawa ba su da fahimta ko kuma sun kasa haɗa cikakken tsarin siffofi waɗanda ke ɗauke da raunin nahawu da ma'ana. Wannan aikin ya ginu akan waɗannan tushe ta hanyar haɗa ingantaccen ƙirar siffofi tare da samfuri mai fahimta, mai inganci.

3. Hanyar Da Aka Gabatar

Tsarin da aka gabatar ya ƙunshi matakai guda uku masu mahimmanci: shirye-shiryen bayanai, cire siffofi masu zurfi, da horar da samfurin/tantancewa.

3.1. Bayanan Gwaji & Shirye-shiryen Farka

An horar da samfurin kuma an tantance shi akan bayanan sirrin shiga na ainihi sama da 660,000, mai yuwuwa an samo su daga keta sirri na jama'a (tare da ɓoyayyen sunayen da suka dace). An yiwa sirrin shiga lakabi bisa ga ƙimar ƙarfinsu ko sanannen rauni daga yunƙurin karya. Shirye-shiryen bayanai sun haɗa da sarrafa lambobi da daidaitawa na asali.

3.2. Ƙirar Siffofi Haɗe-haɗe

Wannan shine babban ƙirƙira na takarda. Tsarin siffofi ya wuce ma'auni na asali don ɗaukar rikitattun raunuka:

Ma'auni na Asali: Tsawon lokaci, ƙididdigar nau'in haruffa (LUDS).
Ƙididdigar Shannon Mai Daidaitawa ta Leetspeak: Yana ƙididdige ƙididdiga bayan juyar da sauye-sauyen leetspeak na gama-gari (misali, '@' -> 'a', '3' -> 'e') don tantance bazuwar gaskiya. Ana ƙididdige ƙididdiga $H$ kamar haka: $H = -\sum_{i=1}^{n} P(x_i) \log_2 P(x_i)$ inda $P(x_i)$ shine yuwuwar harafin $x_i$.
Gano Tsari: Yana gano tafiya akan madannai (misali, 'qwerty'), jerin gwano (misali, '12345'), da maimaita haruffa.
Kalmomi na Ƙamus & Siffofi na N-gram: Yana duba kalmomin ƙamus na gama-gari (harsuna da yawa) kuma yana amfani da TF-IDF na matakin haruffa akan n-grams (misali, bi-grams, tri-grams) don gano ɓangarorin kalmomi da ake maimaita amfani da su daga bayanan da aka keta.
Siffofi na Tsari: Matsayin nau'in haruffa, rabo na haruffa na musamman zuwa tsawon lokaci.

3.3. Tsarin Samfurin & Horarwa

An kwatanta samfura huɗu: Dajin Bazuwar (RF), Injin Tallafawa Vector (SVM), Cibiyar Sadarwa ta Jijiyoyi ta Convolutional (CNN), da Regression na Logistic. An zaɓi Dajin Bazuwar a matsayin samfurin ƙarshe saboda ingantaccen aikinsa da fahimtar da ke cikinsa. An raba bayanan zuwa rukunin horo, tabbatarwa, da gwaji. An yi amfani da daidaita sigogi ta amfani da binciken grid ko binciken bazuwar.

4. Sakamako & Bincike

4.1. Ma'aunin Aiki

Samfurin Dajin Bazuwar ya sami inganci na 99.12% akan rukunin gwaji da aka keɓe, wanda ya fi sauran samfuran girma sosai. An taƙaita ma'auni masu mahimmanci na aiki a ƙasa:

Kwatancen Aikin Samfurin

Dajin Bazuwar: Inganci 99.12%

Injin Tallafawa Vector: ~97.5% Inganci

Cibiyar Sadarwa ta Jijiyoyi ta Convolutional: ~98.0% Inganci

Regression na Logistic: ~95.8% Inganci

Ƙididdiga na Bayanan Gwaji

Jimlar Sirrin Shiga: 660,000+

Girman Vector na Siffofi: 50+

Girman Rukunin Gwaji: 20% na jimlar bayanai

Bayanin Chati: Chati na sanduna zai wakilta ingancin dukkan samfuran huɗu a zahiri, yana nuna sarautar Dajin Bazuwar a fili. Wani chati na biyu zai iya nuna lanƙwasa daidaito-ƙwaƙwalwar ajiya don samfurin RF, yana nuna ƙarfinsa a cikin bakin ma'auni daban-daban na rarrabuwa.

4.2. Muhimmancin Siffofi

Babban fa'ida na samfurin Dajin Bazuwar shine ikon cire maki mahimmanci na siffofi. Bincike ya nuna cewa ƙididdiga mai daidaitawa ta leetspeak da tutocin daidaita ƙamus suna cikin manyan masu hasasawa, suna tabbatar da hasashen cewa waɗannan siffofi haɗe-haɗe suna da mahimmanci. Siffofin gano tsari don tafiya akan madannai suma sun kasance a matsayi mai girma.

4.3. Binciken Kwatance

Aikin samfurin RF ya nuna cewa hanyoyin da suka dogara da bishiyoyi na iya dacewa ko wuce ƙarfin hasashe na ƙarin rikitattun hanyoyin sadarwa na jijiyoyi (CNN) don wannan aikin mai tsari, mai cike da siffofi, yayin da yake ba da gaskiya mafi girma. Rashin aikin Regression na Logistic ya nuna rikitattun alaƙa marasa layi tsakanin siffofi waɗanda samfuran layi masu sauƙi ba za su iya ɗauka ba.

5. Tattaunawa & Ayyukan Gaba

Aikace-aikace & Haɗawa: Ana iya haɗa wannan tsarin ƙima cikin musanya ƙirƙirar sirrin shiga na ainihin lokaci, yana ba da ra'ayi na nan take, mai zurfi (misali, "Rauni saboda tsarin madannai na gama-gari 'qwerty'") maimakon lakabi mai sauƙi na "Rauni/Ƙarfi". Hakanan ana iya amfani da shi don binciken lokaci-lokaci na bayanan sirrin shiga da ke akwai.

Hanyoyin Gaba:

Koyo na Adawa: Horar da samfurin a kan masu karya sirrin shiga na zamani kamar HashCat ko John the Ripper a cikin tsari mai kama da GAN don sanya shi mai ƙarfi ga dabarun harin da ke tasowa, kama da horon adawa a cikin samfuran hoto kamar CycleGAN.
Ƙimar Mahalli-Mai Fahimta: Haɗa mahallin mai amfani (misali, nau'in sabis - banki da zamantakewa, halayen sirrin shiga na baya na mai amfani) don bakin ma'auni na ƙarfi na keɓaɓɓu.
Koyo na Tarayya: Ba da damar samfurin ya ci gaba da ingantawa ta hanyar koyo daga sabbin bayanan sirrin shiga a cikin ƙungiyoyi ba tare da tattara bayanan sirri a tsakiya ba, yana kiyaye sirri.
Haɗa AI Mai Bayyanawa (XAI): Haɓaka binciken muhimmancin siffofi tare da bayani na gida masu fahimta waɗanda ba su da alaƙa da samfurin (LIME) don ba da jagora mafi bayyananne ga mai amfani.

6. Ra'ayin Mai Bincike: Rarrabuwa Ta Matakai Hudu

Fahimta ta Asali: Babban nasarar takarda ba ingancin 99% ba ne—shine rage matsayin inganci na asali a matsayin babban manufa don fifita hankali mai fahimta, mai yiwuwa. A cikin fagen da ke nutsewa cikin hanyoyin sadarwa na jijiyoyi baƙar fata, marubutan sun zaɓi Dajin Bazuwar da hikima ba kawai saboda yana aiki ba, amma saboda yana iya bayyana dalilin da yasa yake aiki. Wannan yana canza tsarin ƙima daga hasashe kawai zuwa ilmantar da mai amfani da ƙarfafa tsarin, wani muhimmin juyi da yawancin takardun ML-na-tsaro na ilimi suka rasa.

Kwararar Hankali & Ingantaccen Dabarun: Hankali yana da kyau: 1) Ƙa'idodin tsaye sun lalace, 2) Don haka, koyi daga bayanan keta ainihi, 3) Amma, koyon rikitattun tsare-tsare yana buƙatar siffofi masu zurfi (saboda haka ƙirar haɗin gwiwa), 4) Duk da haka, don amfani, tsarin dole ne ya tabbatar da makin sa. Zaɓin yin kwatance da SVM, CNN, da Regression na Logistic yana da wayo—yana nuna cewa ƙirar siffofin su tana da ƙarfi sosai har samfurin mai sauƙi, mai fahimta zai iya doke mafi rikitarwa. Wannan babban darasi ne a cikin ƙirar tsarin ML mai amfani.

Ƙarfi & Kurakurai Masu Bayyanawa: Tsarin siffofi haɗe-haɗe, musamman ƙididdiga mai daidaitawa ta leetspeak, yana da kyau kuma yana da tasiri. Amfani da babban bayanan ainihi yana kafa binciken a cikin gaskiya. Duk da haka, babban aibin takarda shine zaton shiru: cewa bayanan keta da suka gabata suna hasashen rauni na gaba daidai. Wannan samfurin a zahiri yana duban baya. Ƙwararren maharin da ke amfani da AI mai ƙirƙira don ƙirƙirar sabbin sirrin shiga, waɗanda ba na ƙamus ba amma masu ma'ana a hankali (dabarar da aka nuna a cikin binciken OpenAI da Anthropic na baya-bayan nan kan amincin AI) na iya ƙetare shi. Samfurin yana yaƙin yaƙin da ya gabata da fasaha, amma yaƙin na gaba na iya buƙatar makaman daban-daban na asali.

Fahimta Mai Yiwuwa ga Masu Aiki:

Aiki Nan Take: Ƙungiyoyin tsaro yakamata su matsa wa masu siyarwa su maye gurbin na'urorin ƙima na tushen LUDS da tsarin ML, masu fahimta kamar wannan. Dawowar kuɗin shiga don hana hare-haren cushewar takaddun shaida kadai yana da girma.
Fifikon Ci Gaba: Mayar da hankali kan haɗa sakamakon muhimmancin siffofi cikin madaukai na ra'ayi na mai amfani. Fada wa mai amfani "sirrin shigarka yana da rauni" ba shi da amfani; gaya musu "yana da rauni saboda yana ɗauke da tafiya akan madannai na gama-gari da kalmar ƙamus" yana haifar da canjin hali.
Zuba Jari na R&D na Dabarun: Makomar ta ta'allaka ne a cikin samfuran adawa, masu ƙirƙira. Rarraba albarkatu don haɓaka tsarin ƙima da aka horar tare da masu karya sirrin shiga na AI a cikin simintin ƙungiyar ja/ƙungiyar shuɗi na ci gaba, kama da hanyoyin horon adawa waɗanda suka sanya samfura kamar CycleGAN don fassarar hoto su zama masu ƙarfi. Jiran babban keta na gaba don sabunta samfurin ku dabarar rashin nasara ce.

A ƙarshe, wannan aikin babban nasara ne na dabara a yaƙin tsaron sirrin shiga. Duk da haka, ɗaukarsa a matsayin mafita ta ƙarshe zai zama kuskuren dabarun. Shi ne mafi kyawun tushe har yanzu wanda za a gina tsarin tsaro na gaba na daidaitawa, mai jira.

7. Ƙarin Bayani na Fasaha

Misalin Tsarin Bincike (Ba Lamba ba): Yi la'akari da tantance sirrin shiga "S3cur1ty2024!". Mai duba LUDS na gargajiya yana ganin tsawon lokaci=12, babba, ƙarami, lambobi, haruffa na musamman – mai yiwuwa ya ƙidaya shi "Ƙarfi". Binciken tsarin mu zai kasance:

Daidaitawar Leetspeak: Yana canza shi zuwa "Security2024!".
Ƙididdigar Ƙididdiga: Yana ƙididdige ƙididdiga akan kirtani mai daidaitawa, wanda aka rage saboda "Security" kalmar ƙamus ce ta gama-gari.
Daidaita Ƙamus: Yana yiwa "Security" alama a matsayin kalmar Ingilishi ta sama da 10,000.
Gano Tsari: Yana yiwa "2024" alama a matsayin tsarin shekara na gama-gari.
Binciken N-gram: Ya gano cewa "ty20" ɓangaren kirtani ne da ake faruwa akai-akai a cikin sirrin shiga da aka keta (yana haɗa ƙarshen kalmomi na gama-gari zuwa ginshiƙan shekaru na gama-gari).

Samfurin Dajin Bazuwar yana haɗa waɗannan siffofi masu nauyi. Yayin da tsawon lokaci da bambancin haruffa ke ba da gudummawa mai kyau, manyan ma'auni mara kyau daga daidaita ƙamus, shekara mai iya hasashe, da n-gram na gama-gari zai iya haifar da maki na ƙarshe na "Matsakaici" ko "Rauni," yana ba da ƙimar haɗari mafi inganci da maki na ra'ayi na musamman ("Kauce wa kalmomin ƙamus," "Kauce wa shekarun baya-bayan nan").

8. Nassoshi

Google Cloud. (2022). Rahoton Sararin Samaniya na Barazana.
Veras, R., et al. (2014). A kan Tsarin Ma'anar Sirrin Shiga da Tasirin Tsaronsu. A cikin NDSS.
Weir, M., et al. (2010). Karya Sirrin Shiga Ta Amfani da Nahawu na Mahallin Maras Yiwuwa. A cikin IEEE S&P.
Zhu, J.-Y., et al. (2017). Fassarar Hoton-da-Ba a Haɗa ba Ta Amfani da Cibiyoyin Sadarwa na Adawa Masu Daidaituwa. A cikin ICCV (CycleGAN).
OpenAI. (2023). Rahoton Fasaha na GPT-4. (Yana tattauna iyawa a cikin samar da rubutu mai ma'ana, mai dacewa don ƙirƙirar sabon sirrin shiga).
Scikit-learn: Injin Koyo a cikin Python. Pedregosa et al., JMLR 12, shafi na 2825-2830, 2011.