1. දත්ත ආවරණ සංකල්පය
දත්ත ආවරණ කිරීම දත්ත ආවරණ කිරීම ලෙසද හැඳින්වේ. එය අප විසින් ආවරණ නීති සහ ප්රතිපත්ති ලබා දී ඇති විට ජංගම දුරකථන අංකය, බැංකු කාඩ්පත් අංකය සහ අනෙකුත් තොරතුරු වැනි සංවේදී දත්ත පරිවර්තනය කිරීම, වෙනස් කිරීම හෝ ආවරණය කිරීම සඳහා වන තාක්ෂණික ක්රමයකි. මෙම තාක්ෂණය ප්රධාන වශයෙන් භාවිතා කරනුයේ විශ්වාස කළ නොහැකි පරිසරයන් තුළ සංවේදී දත්ත සෘජුවම භාවිතා කිරීම වැළැක්වීම සඳහා ය.
දත්ත ආවරණ මූලධර්මය: දත්ත ආවරණ කිරීම මුල් දත්ත ලක්ෂණ, ව්යාපාරික නීති සහ දත්ත අදාළත්වය පවත්වා ගත යුතු අතර එමඟින් පසුකාලීන සංවර්ධනය, පරීක්ෂාව සහ දත්ත විශ්ලේෂණය ආවරණ කිරීමෙන් බලපෑමට ලක් නොවන බව සහතික කෙරේ. ආවරණ කිරීමට පෙර සහ පසු දත්ත අනුකූලතාව සහ වලංගුභාවය සහතික කරන්න.
2. දත්ත ආවරණ වර්ගීකරණය
දත්ත ආවරණ කිරීම ස්ථිතික දත්ත ආවරණ (SDM) සහ ගතික දත්ත ආවරණ (DDM) ලෙස බෙදිය හැකිය.
ස්ථිතික දත්ත ආවරණකරණය (SDM): ස්ථිතික දත්ත ආවරණ කිරීම සඳහා නිෂ්පාදන පරිසරයෙන් හුදකලා කිරීම සඳහා නව නිෂ්පාදන නොවන පරිසර දත්ත සමුදායක් ස්ථාපිත කිරීම අවශ්ය වේ. සංවේදී දත්ත නිෂ්පාදන දත්ත සමුදායෙන් උපුටා ගෙන පසුව නිෂ්පාදන නොවන දත්ත සමුදායේ ගබඩා කරනු ලැබේ. මේ ආකාරයෙන්, සංවේදනය අඩු කරන ලද දත්ත නිෂ්පාදන පරිසරයෙන් හුදකලා කරනු ලබන අතර, එය ව්යාපාරික අවශ්යතා සපුරාලන අතර නිෂ්පාදන දත්තවල ආරක්ෂාව සහතික කරයි.
ගතික දත්ත ආවරණකරණය (DDM): එය සාමාන්යයෙන් නිෂ්පාදන පරිසරය තුළ සංවේදී දත්ත තත්ය කාලීනව සංවේදීකරණය කිරීමට භාවිතා කරයි. සමහර විට, විවිධ අවස්ථාවන්හිදී එකම සංවේදී දත්ත කියවීමට විවිධ මට්ටම් ආවරණ අවශ්ය වේ. උදාහරණයක් ලෙස, විවිධ භූමිකාවන් සහ අවසරයන් විවිධ ආවරණ යෝජනා ක්රම ක්රියාත්මක කළ හැකිය.
දත්ත වාර්තාකරණය සහ දත්ත නිෂ්පාදන ආවරණ යෙදුම
එවැනි අවස්ථා අතර ප්රධාන වශයෙන් අභ්යන්තර දත්ත අධීක්ෂණ නිෂ්පාදන හෝ දැන්වීම් පුවරුව, බාහිර සේවා දත්ත නිෂ්පාදන සහ ව්යාපාර වාර්තා සහ ව්යාපෘති සමාලෝචනය වැනි දත්ත විශ්ලේෂණය මත පදනම් වූ වාර්තා ඇතුළත් වේ.
3. දත්ත ආවරණ විසඳුම
පොදු දත්ත ආවරණ යෝජනා ක්රම අතරට: අවලංගු කිරීම, අහඹු අගය, දත්ත ප්රතිස්ථාපනය, සමමිතික සංකේතනය, සාමාන්ය අගය, ඕෆ්සෙට් සහ වටකුරු කිරීම යනාදිය ඇතුළත් වේ.
අවලංගු කිරීම: අවලංගු කිරීම යනු සංවේදී දත්ත සංකේතනය කිරීම, කප්පාදු කිරීම හෝ සැඟවීමයි. මෙම යෝජනා ක්රමය සාමාන්යයෙන් සැබෑ දත්ත විශේෂ සංකේත (* වැනි) සමඟ ප්රතිස්ථාපනය කරයි. මෙහෙයුම සරලයි, නමුත් පරිශීලකයින්ට මුල් දත්තවල ආකෘතිය දැනගත නොහැක, එය පසුකාලීන දත්ත යෙදුම් වලට බලපෑ හැකිය.
අහඹු අගය: අහඹු අගය යනු සංවේදී දත්ත අහඹු ලෙස ප්රතිස්ථාපනය කිරීමයි (අංක ඉලක්කම් ප්රතිස්ථාපනය කරයි, අකුරු අකුරු ප්රතිස්ථාපනය කරයි, සහ අක්ෂර අක්ෂර ප්රතිස්ථාපනය කරයි). මෙම ආවරණ ක්රමය යම් ප්රමාණයකට සංවේදී දත්තවල ආකෘතිය සහතික කරන අතර පසුව දත්ත යෙදීමට පහසුකම් සපයයි. පුද්ගලයින්ගේ සහ ස්ථානවල නම් වැනි සමහර අර්ථවත් වචන සඳහා ආවරණ ශබ්දකෝෂ අවශ්ය විය හැකිය.
දත්ත ප්රතිස්ථාපනය: දත්ත ප්රතිස්ථාපනය ශුන්ය සහ අහඹු අගයන් ආවරණ කිරීමට සමාන වේ, විශේෂ අක්ෂර හෝ අහඹු අගයන් භාවිතා කිරීම වෙනුවට, ආවරණ දත්ත නිශ්චිත අගයකින් ප්රතිස්ථාපනය වේ.
සමමිතික සංකේතනය: සමමිතික සංකේතනය යනු විශේෂ ප්රතිවර්ත කළ හැකි ආවරණ ක්රමයකි. එය සංකේතාංකන යතුරු සහ ඇල්ගොරිතම හරහා සංවේදී දත්ත සංකේතනය කරයි. කේතාංක පෙළ ආකෘතිය තාර්කික නීතිවල මුල් දත්ත සමඟ අනුකූල වේ.
සාමාන්යය: සංඛ්යානමය අවස්ථා වලදී සාමාන්ය යෝජනා ක්රමය බොහෝ විට භාවිතා වේ. සංඛ්යාත්මක දත්ත සඳහා, අපි පළමුව ඒවායේ මධ්යන්යය ගණනය කර, පසුව අහඹු ලෙස මධ්යන්යය වටා අසංවේදී අගයන් බෙදා හරිමු, එමඟින් දත්තවල එකතුව නියතව තබා ගනිමු.
ඕෆ්සෙට් සහ වටකුරු කිරීම: මෙම ක්රමය අහඹු මාරුව මගින් ඩිජිටල් දත්ත වෙනස් කරයි. ඕෆ්සෙට් වටකුරු කිරීම දත්තවල ආරක්ෂාව පවත්වා ගනිමින් පරාසයේ ආසන්න සත්යතාව සහතික කරයි, එය පෙර යෝජනා ක්රමවලට වඩා සැබෑ දත්ත වලට සමීප වන අතර විශාල දත්ත විශ්ලේෂණ අවස්ථාවෙහිදී විශාල වැදගත්කමක් දරයි.
නිර්දේශ ආකෘතිය "ML-NPB-5660 හඳුන්වා දීම"දත්ත ආවරණකරණය සඳහා"
4. බහුලව භාවිතා වන දත්ත ආවරණ ශිල්පීය ක්රම
(1). සංඛ්යානමය ශිල්පීය ක්රම
දත්ත සාම්පල ලබා ගැනීම සහ දත්ත එකතු කිරීම
- දත්ත සාම්පල ලබා ගැනීම: දත්ත කට්ටලයේ නියෝජිත උප කුලකයක් තෝරා ගැනීමෙන් මුල් දත්ත කට්ටලය විශ්ලේෂණය කිරීම සහ ඇගයීම, හඳුනාගැනීම ඉවත් කිරීමේ ශිල්පීය ක්රමවල ඵලදායීතාවය වැඩි දියුණු කිරීම සඳහා වැදගත් ක්රමයකි.
- දත්ත එකතු කිරීම: ක්ෂුද්ර දත්තවල ගුණාංගවලට යොදන සංඛ්යානමය ශිල්පීය ක්රම (සාරාංශය, ගණන් කිරීම, සාමාන්යකරණය, උපරිම සහ අවම වැනි) එකතුවක් ලෙස, ප්රතිඵලය මුල් දත්ත කට්ටලයේ සියලුම වාර්තා නියෝජනය කරයි.
(2). ගුප්ත ලේඛනකරණය
ක්රිප්ටෝග්රැෆි යනු සංවේදීකරණය අඩු කිරීමේ හෝ කාර්යක්ෂමතාව වැඩි දියුණු කිරීමේ පොදු ක්රමයකි. විවිධ වර්ගයේ සංකේතාංකන ඇල්ගොරිතම මඟින් විවිධ සංවේදීකරණය අඩු කිරීමේ බලපෑම් ලබා ගත හැකිය.
- නිර්ණායක සංකේතනය: අහඹු නොවන සමමිතික සංකේතනයකි. එය සාමාන්යයෙන් ID දත්ත සකසන අතර අවශ්ය විටෙක කේතාංක පෙළ විකේතනය කර මුල් ID වෙත ප්රතිසාධනය කළ හැක, නමුත් යතුර නිසි ලෙස ආරක්ෂා කළ යුතුය.
- ආපසු හැරවිය නොහැකි සංකේතනය: හැෂ් ශ්රිතය දත්ත සැකසීම සඳහා භාවිතා කරයි, එය සාමාන්යයෙන් ID දත්ත සඳහා භාවිතා කරයි. එය කෙලින්ම විකේතනය කළ නොහැකි අතර සිතියම්කරණ සම්බන්ධතාවය සුරැකිය යුතුය. ඊට අමතරව, හැෂ් ශ්රිතයේ විශේෂාංගය නිසා, දත්ත ගැටීම සිදුවිය හැකිය.
- සමරූපී සංකේතනය: කේතාංක පෙළ සමරූපී ඇල්ගොරිතමය භාවිතා වේ. එහි ලක්ෂණය වන්නේ කේතාංක පෙළ ක්රියාකාරිත්වයේ ප්රතිඵලය විකේතනයෙන් පසු සරල පෙළ ක්රියාකාරිත්වයේ ප්රතිඵලයට සමාන වීමයි. එබැවින්, එය සංඛ්යාත්මක ක්ෂේත්ර සැකසීමට බහුලව භාවිතා වන නමුත් කාර්ය සාධන හේතූන් මත එය බහුලව භාවිතා නොවේ.
(3). පද්ධති තාක්ෂණය
රහස්යතා ආරක්ෂාව සපුරා නොමැති දත්ත අයිතම මර්දන තාක්ෂණය මකා දමයි හෝ ආරක්ෂා කරයි, නමුත් ඒවා ප්රකාශයට පත් නොකරයි.
- ආවරණ කිරීම: එය ප්රතිවාදියාගේ අංකය, හැඳුනුම්පත තරු ලකුණකින් සලකුණු කර තිබීම හෝ ලිපිනය කපා දැමීම වැනි ගුණාංග අගය ආවරණය කිරීම සඳහා වඩාත් පොදු desensitization ක්රමයට යොමු වේ.
- දේශීය මර්දනය: නිශ්චිත ගුණාංග අගයන් (තීරු) මකා දැමීමේ ක්රියාවලිය, අත්යවශ්ය නොවන දත්ත ක්ෂේත්ර ඉවත් කිරීම යන්නෙන් අදහස් කෙරේ;
- වාර්තා මර්දනය: නිශ්චිත වාර්තා (පේළි) මකා දැමීමේ ක්රියාවලිය, අත්යවශ්ය නොවන දත්ත වාර්තා මකා දැමීම යන්නෙන් අදහස් කෙරේ.
(4). අන්වර්ථ නාම තාක්ෂණය
Pseudomanning යනු සෘජු හඳුනාගැනීමක් (හෝ වෙනත් සංවේදී හඳුනාගැනීමක්) ප්රතිස්ථාපනය කිරීම සඳහා අන්වර්ථ නාමයක් භාවිතා කරන හඳුනාගැනීම් ඉවත් කිරීමේ තාක්ෂණයකි. සෘජු හෝ සංවේදී හඳුනාගැනීම් වෙනුවට, එක් එක් තොරතුරු විෂය සඳහා අනන්ය හඳුනාගැනීම් නිර්මාණය කිරීමට ව්යාජ නාම ශිල්පීය ක්රම භාවිතා කරයි.
- එය මුල් හැඳුනුම්පතට අනුරූප වීමට, සිතියම්කරණ වගුව සුරැකීමට සහ සිතියම්කරණ වගුවට ප්රවේශය දැඩි ලෙස පාලනය කිරීමට ස්වාධීනව අහඹු අගයන් ජනනය කළ හැකිය.
- ඔබට ව්යාජ නාම නිපදවීමට සංකේතනය භාවිතා කළ හැකිය, නමුත් විකේතන යතුර නිසි ලෙස තබා ගත යුතුය;
මෙම තාක්ෂණය බහුලව භාවිතා වන්නේ ස්වාධීන දත්ත භාවිතා කරන්නන් විශාල සංඛ්යාවක් සිටින අවස්ථාවන්හිදීය, උදාහරණයක් ලෙස විවෘත වේදිකා අවස්ථාවේ OpenID, එහිදී විවිධ සංවර්ධකයින් එකම පරිශීලකයා සඳහා විවිධ Openid ලබා ගනී.
(5). සාමාන්යකරණ ශිල්පීය ක්රම
සාමාන්යකරණ තාක්ෂණය යනු දත්ත කට්ටලයක තෝරාගත් ගුණාංගවල කැටිති බව අඩු කරන සහ දත්ත පිළිබඳ වඩාත් සාමාන්ය සහ වියුක්ත විස්තරයක් සපයන හඳුනාගැනීම් ඉවත් කිරීමේ තාක්ෂණයකි. සාමාන්යකරණ තාක්ෂණය ක්රියාත්මක කිරීමට පහසු වන අතර වාර්තා මට්ටමේ දත්තවල සත්යතාව ආරක්ෂා කළ හැකිය. එය දත්ත නිෂ්පාදන හෝ දත්ත වාර්තා වල බහුලව භාවිතා වේ.
- වටකුරු කිරීම: තෝරාගත් ගුණාංගය සඳහා වටකුරු පදනමක් තෝරා ගැනීම ඇතුළත් වේ, උදාහරණයක් ලෙස ඉහළට හෝ පහළට අධිකරණ වෛද්ය විද්යාව, ප්රතිඵල 100, 500, 1K, සහ 10K ලබා දෙයි.
- ඉහළ සහ පහළ කේතීකරණ ශිල්පීය ක්රම: එළිපත්තට ඉහළින් (හෝ පහළ) අගයන් ඉහළ (හෝ පහළ) මට්ටම නියෝජනය කරන එළිපත්තකින් ප්රතිස්ථාපනය කරන්න, එමඟින් "X ට ඉහළින්" හෝ "X ට පහළින්" ප්රතිඵලයක් ලැබේ.
(6). සසම්භාවීකරණ ශිල්පීය ක්රම
හඳුනාගැනීමේ අක්රිය කිරීමේ තාක්ෂණයක් ලෙස, සසම්භාවීකරණ තාක්ෂණය යනු සසම්භාවීකරණය හරහා ගුණාංගයක අගය වෙනස් කිරීමයි, එවිට සසම්භාවීකරණයෙන් පසු අගය මුල් සැබෑ අගයට වඩා වෙනස් වේ. මෙම ක්රියාවලිය ප්රහාරකයෙකුට එකම දත්ත වාර්තාවේ ඇති අනෙකුත් ගුණාංග අගයන්ගෙන් ගුණාංග අගයක් ලබා ගැනීමේ හැකියාව අඩු කරයි, නමුත් ප්රතිඵලයක් ලෙස ලැබෙන දත්තවල සත්යතාවයට බලපායි, එය නිෂ්පාදන පරීක්ෂණ දත්ත සමඟ බහුලව දක්නට ලැබේ.
පළ කිරීමේ කාලය: සැප්-27-2022