1. Data Masking සංකල්පය
දත්ත ආවරණ කිරීම දත්ත ආවරණ ලෙසද හැඳින්වේ. අපි ආවරණ නීති සහ ප්රතිපත්ති ලබා දී ඇති විට ජංගම දුරකථන අංකය, බැංකු කාඩ්පත් අංකය සහ වෙනත් තොරතුරු වැනි සංවේදී දත්ත පරිවර්තනය කිරීම, වෙනස් කිරීම හෝ ආවරණය කිරීම තාක්ෂණික ක්රමයකි. මෙම තාක්ෂණය මූලික වශයෙන් භාවිතා කරනුයේ විශ්වාස කළ නොහැකි පරිසරවල සංවේදී දත්ත සෘජුවම භාවිතා කිරීම වැළැක්වීම සඳහා ය.
දත්ත ආවරණ මූලධර්මය: දත්ත ආවරණ මුල් දත්ත ලක්ෂණ, ව්යාපාරික නීති සහ දත්ත අදාළත්වය පවත්වා ගත යුතු අතර පසුව සිදු කරන සංවර්ධනය, පරීක්ෂා කිරීම සහ දත්ත විශ්ලේෂණය ආවරණය කිරීම මගින් බලපාන්නේ නැත. ආවරණ කිරීමට පෙර සහ පසු දත්ත අනුකූලතාව සහ වලංගුභාවය සහතික කරන්න.
2. දත්ත ආවරණ වර්ගීකරණය
දත්ත ආවරණ ස්ථිතික දත්ත ආවරණ (SDM) සහ ගතික දත්ත ආවරණ (DDM) ලෙස බෙදිය හැකිය.
ස්ථිතික දත්ත ආවරණ (SDM): ස්ථිතික දත්ත ආවරණ සඳහා නිෂ්පාදන පරිසරයෙන් හුදකලා වීම සඳහා නව නිෂ්පාදන නොවන පරිසර දත්ත ගබඩාවක් පිහිටුවීම අවශ්ය වේ. සංවේදී දත්ත නිෂ්පාදන දත්ත ගබඩාවෙන් උපුටා ගන්නා අතර පසුව නිෂ්පාදන නොවන දත්ත ගබඩාවේ ගබඩා කෙරේ. මේ ආකාරයට, ව්යාපාරික අවශ්යතා සපුරාලන සහ නිෂ්පාදන දත්තවල ආරක්ෂාව සහතික කරන නිෂ්පාදන පරිසරයෙන් densensitized දත්ත හුදකලා වේ.
ගතික දත්ත ආවරණ (DDM): එය සාමාන්යයෙන් නිෂ්පාදන පරිසරය තුළ සංවේදී දත්ත තත්ය කාලීනව අඩු කිරීමට භාවිතා කරයි. සමහර අවස්ථාවලදී, විවිධ අවස්ථාවන්හිදී එකම සංවේදී දත්ත කියවීමට විවිධ මට්ටම් ආවරණ අවශ්ය වේ. උදාහරණයක් ලෙස, විවිධ භූමිකාවන් සහ අවසරයන් විවිධ ආවරණ යෝජනා ක්රම ක්රියාත්මක කළ හැක.
දත්ත වාර්තා කිරීම සහ දත්ත නිෂ්පාදන ආවරණ යෙදුම
එවැනි අවස්ථා ප්රධාන වශයෙන් අභ්යන්තර දත්ත අධීක්ෂණ නිෂ්පාදන හෝ දැන්වීම් පුවරුව, බාහිර සේවා දත්ත නිෂ්පාදන සහ ව්යාපාර වාර්තා සහ ව්යාපෘති සමාලෝචනය වැනි දත්ත විශ්ලේෂණය මත පදනම් වූ වාර්තා ඇතුළත් වේ.
3. දත්ත ආවරණ විසඳුම
පොදු දත්ත ආවරණ යෝජනා ක්රමවලට ඇතුළත් වන්නේ: අවලංගු කිරීම, අහඹු අගය, දත්ත ප්රතිස්ථාපනය, සමමිතික සංකේතනය, සාමාන්ය අගය, ඕෆ්සෙට් සහ වටකුරු කිරීම යනාදිය.
අවලංගු කිරීම: අවලංගු කිරීම යනු සංවේදී දත්ත සංකේතනය කිරීම, කප්පාදු කිරීම හෝ සැඟවීමයි. මෙම යෝජනා ක්රමය සාමාන්යයෙන් සැබෑ දත්ත විශේෂ සංකේත (* වැනි) සමඟ ප්රතිස්ථාපනය කරයි. මෙහෙයුම සරලයි, නමුත් පරිශීලකයින්ට මුල් දත්තවල ආකෘතිය දැනගත නොහැක, එය පසුකාලීන දත්ත යෙදුම් වලට බලපෑ හැකිය.
අහඹු අගය: සසම්භාවී අගය යනු සංවේදී දත්ත අහඹු ලෙස ප්රතිස්ථාපනය කිරීමයි (සංඛ්යා ඉලක්කම් ප්රතිස්ථාපනය කරයි, අකුරු අකුරු ප්රතිස්ථාපනය කරයි, සහ අක්ෂර අක්ෂර ප්රතිස්ථාපනය කරයි). මෙම ආවරණ ක්රමය යම් ප්රමාණයකට සංවේදී දත්තවල ආකෘතිය සහතික කරන අතර පසුව දත්ත යෙදීමට පහසුකම් සපයයි. මිනිසුන්ගේ සහ ස්ථානවල නම් වැනි සමහර අර්ථවත් වචන සඳහා ආවරණ ශබ්දකෝෂ අවශ්ය විය හැකිය.
දත්ත ප්රතිස්ථාපනය: දත්ත ප්රතිස්ථාපනය ශුන්ය සහ අහඹු අගයන් ආවරණය කිරීම හා සමාන වේ, හැර විශේෂ අක්ෂර හෝ අහඹු අගයන් භාවිතා කිරීම වෙනුවට, ආවරණ දත්ත නිශ්චිත අගයකින් ප්රතිස්ථාපනය වේ.
සමමිතික සංකේතනය: සමමිතික සංකේතනය යනු විශේෂ ආපසු හැරවිය හැකි ආවරණ ක්රමයකි. එය සංකේතන යතුරු සහ ඇල්ගොරිතම හරහා සංවේදී දත්ත සංකේතනය කරයි. කේතාංක පෙළ ආකෘතිය තාර්කික රීතිවල මුල් දත්ත සමඟ අනුකූල වේ.
සාමාන්යය: සාමාන්ය යෝජනා ක්රමය බොහෝ විට සංඛ්යානමය අවස්ථා වලදී භාවිතා වේ. සංඛ්යාත්මක දත්ත සඳහා, අපි ප්රථමයෙන් ඒවායේ මධ්යන්යය ගණනය කරන්නෙමු, පසුව අහඹු ලෙස මධ්යන්යය වටා අවසංවේදී අගයන් බෙදා හරිමු, එමඟින් දත්තවල එකතුව නියතව තබා ගනී.
ඕෆ්සෙට් සහ රවුම් කිරීම: මෙම ක්රමය අහඹු මාරුවකින් ඩිජිටල් දත්ත වෙනස් කරයි. පෙර යෝජනා ක්රමවලට වඩා සැබෑ දත්තවලට සමීප වන අතර විශාල දත්ත විශ්ලේෂණයේ දී විශාල වැදගත්කමක් ඇති දත්තවල ආරක්ෂාව පවත්වා ගනිමින් ඕෆ්සෙට් වටකුරු පරාසයේ ආසන්න සත්යතාව සහතික කරයි.
නිර්දේශිත ආකෘතිය"ML-NPB-5660"දත්ත ආවරණ සඳහා
4. බහුලව භාවිතා වන Data Masking Techniques
(1) සංඛ්යාන ශිල්පීය ක්රම
දත්ත නියැදීම සහ දත්ත එකතු කිරීම
- දත්ත නියැදීම: දත්ත කුලකයේ නියෝජිත උප කුලකයක් තෝරා ගැනීමෙන් මුල් දත්ත කට්ටලය විශ්ලේෂණය කිරීම සහ ඇගයීම හඳුනාගැනීමේ ක්රමවල සඵලතාවය වැඩි දියුණු කිරීම සඳහා වැදගත් ක්රමයකි.
- දත්ත එක්රැස් කිරීම: ක්ෂුද්ර දත්තවල උපලක්ෂණ සඳහා යොදන සංඛ්යාන ශිල්පීය ක්රම (සමාකලනය, ගණන් කිරීම, සාමාන්යය, උපරිම සහ අවම වැනි) එකතුවක් ලෙස, ප්රතිඵලය මුල් දත්ත කට්ටලයේ සියලුම වාර්තා නියෝජනය කරයි.
(2) ගුප්ත විද්යාව
ගුප්තකේතනය යනු අවසංවේදීකරණයේ සඵලතාවය අඩු කිරීමට හෝ වැඩි දියුණු කිරීමට ඇති පොදු ක්රමයකි. විවිධ වර්ගයේ සංකේතාංකන ඇල්ගොරිතමවලට විවිධ desensitization බලපෑම් ලබා ගත හැක.
- නිර්ණායක සංකේතනය: අහඹු නොවන සමමිතික සංකේතනයකි. එය සාමාන්යයෙන් ID දත්ත සකසන අතර අවශ්ය විටදී කේතාංකය මුල් හැඳුනුම්පතට විකේතනය කර ප්රතිසාධනය කළ හැක, නමුත් යතුර නිසි ලෙස ආරක්ෂා කළ යුතුය.
- ආපසු හැරවිය නොහැකි සංකේතනය: හැෂ් ශ්රිතය දත්ත සැකසීමට භාවිතා කරයි, එය සාමාන්යයෙන් ID දත්ත සඳහා භාවිතා වේ. එය කෙලින්ම විකේතනය කළ නොහැකි අතර සිතියම්කරණ සම්බන්ධතාවය සුරැකිය යුතුය. මීට අමතරව, හෑෂ් ශ්රිතයේ විශේෂාංගය හේතුවෙන්, දත්ත ගැටුමක් ඇති විය හැක.
- Homomorphic encryption: ciphertext homomorphic algorithm භාවිතා වේ. එහි ලක්ෂණය වන්නේ කේතාංක පෙළ ක්රියාකාරිත්වයේ ප්රතිඵලය විකේතනයෙන් පසු සාමාන්ය පෙළ ක්රියාකාරිත්වයට සමාන වීමයි. එබැවින්, එය සංඛ්යාත්මක ක්ෂේත්ර සැකසීම සඳහා බහුලව භාවිතා වන නමුත් කාර්ය සාධන හේතූන් මත එය බහුලව භාවිතා නොවේ.
(3) පද්ධති තාක්ෂණය
මර්දන තාක්ෂණය රහස්යතා ආරක්ෂාවට නොගැලපෙන නමුත් ඒවා ප්රකාශයට පත් නොකරන දත්ත අයිතම මකා හෝ පලිහ කරයි.
- මාස්ක් කිරීම: එය ප්රතිවාදී අංකය, හැඳුනුම්පත තරු ලකුණකින් සලකුණු කිරීම හෝ ලිපිනය කපා හැරීම වැනි ගුණාංග අගය වසන් කිරීමේ වඩාත් සුලභ desensitization ක්රමයට යොමු කරයි.
- දේශීය මර්දනය: විශේෂිත ගුණාංග අගයන් (තීරු) මකා දැමීමේ ක්රියාවලියට යොමු කරයි, අත්යවශ්ය නොවන දත්ත ක්ෂේත්ර ඉවත් කිරීම;
- වාර්තා යටපත් කිරීම: විශේෂිත වාර්තා (පේළි) මකා දැමීමේ ක්රියාවලිය, අත්යවශ්ය නොවන දත්ත වාර්තා මකා දැමීමේ ක්රියාවලියට යොමු වේ.
(4) අන්වර්ථ නාමය තාක්ෂණය
Pseudomanning යනු සෘජු හඳුනාගැනීමක් (හෝ වෙනත් සංවේදී හඳුනාගැනීමක්) ප්රතිස්ථාපනය කිරීමට අන්වර්ථ නාමයක් භාවිතා කරන හඳුනාගැනීමේ ක්රමවේදයකි. අන්වර්ථ නාම ශිල්පීය ක්රම මගින් සෘජු හෝ සංවේදී හඳුනාගැනීම් වෙනුවට එක් එක් තොරතුරු විෂය සඳහා අනන්ය හඳුනාගැනීම් නිර්මාණය කරයි.
- එය මුල් හැඳුනුම්පතට අනුරූප වන පරිදි ස්වාධීනව අහඹු අගයන් උත්පාදනය කළ හැකිය, සිතියම්ගත කිරීමේ වගුව සුරැකිය හැක, සහ සිතියම් වගුව වෙත ප්රවේශය දැඩි ලෙස පාලනය කරයි.
- ඔබට අන්වර්ථ නාම නිෂ්පාදනය කිරීමට සංකේතනය භාවිතා කළ හැක, නමුත් විකේතන යතුර නිසියාකාරව තබා ගත යුතුය;
විවිධ සංවර්ධකයින් එකම පරිශීලකයෙකු සඳහා විවිධ Openids ලබා ගන්නා විවෘත වේදිකාවේ OpenID වැනි ස්වාධීන දත්ත භාවිතා කරන්නන් විශාල සංඛ්යාවක් සම්බන්ධයෙන් මෙම තාක්ෂණය බහුලව භාවිතා වේ.
(5) සාමාන්යකරණ ශිල්පීය ක්රම
සාමාන්යකරණ තාක්ෂණය යනු දත්ත කට්ටලයක තෝරාගත් ගුණාංගවල කැටිති අඩු කරන සහ දත්ත පිළිබඳ වඩාත් සාමාන්ය හා වියුක්ත විස්තරයක් සපයන හඳුනාගැනීමේ ක්රමවේදයකි. සාමාන්යකරණ තාක්ෂණය ක්රියාත්මක කිරීමට පහසු වන අතර වාර්තාගත මට්ටමේ දත්තවල සත්යතාව ආරක්ෂා කළ හැක. එය දත්ත නිෂ්පාදන හෝ දත්ත වාර්තා වල බහුලව භාවිතා වේ.
- රවුම් කිරීම: 100, 500, 1K, සහ 10K ප්රතිඵල ලබා දීම, ඉහළට හෝ පහළට අධිකරණ වෛද්ය විද්යාව වැනි තෝරාගත් ගුණාංගය සඳහා වටකුරු පදනමක් තෝරා ගැනීම ඇතුළත් වේ.
- ඉහළ සහ පහළ කේතීකරණ ක්රම: "ඉහළ X" හෝ "පහළ X" ප්රතිඵලයක් ලබා දෙමින්, ඉහළ (හෝ පහළ) මට්ටම නියෝජනය කරන එළිපත්තකින් එළිපත්තට ඉහළින් ඇති (හෝ පහළ) අගයන් ප්රතිස්ථාපනය කරන්න.
(6) සසම්භාවී කිරීමේ තාක්ෂණික ක්රම
හඳුනාගැනීමේ ක්රමවේදයක් ලෙස, සසම්භාවීකරණ තාක්ෂණය යනු සසම්භාවීකරණය හරහා ගුණාංගයක අගය වෙනස් කිරීම, සසම්භාවීකරණයෙන් පසු අගය මුල් සැබෑ අගයට වඩා වෙනස් වේ. මෙම ක්රියාවලිය මගින් ප්රහාරකයෙකුට එකම දත්ත වාර්තාවේ ඇති අනෙකුත් උපලක්ෂණ අගයන්ගෙන් උපලක්ෂණ අගයක් ලබා ගැනීමට ඇති හැකියාව අඩු කරයි, නමුත් නිෂ්පාදන පරීක්ෂණ දත්ත සමඟ බහුලව දක්නට ලැබෙන ප්රතිඵල දත්තවල සත්යතාවට බලපායි.
පසු කාලය: සැප්-27-2022