일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 솔딱새과
- 참새목
- structured_array
- 비둘기과
- 딥러닝 공부
- 한국의 새
- 가마우지과
- 맑은소리 스피치학원
- 계수정렬
- 직박구리과
- AI역량평가
- IBK기업은행 인턴
- 비둘기목
- 참새과
- keras
- 딥러닝공부
- 한국의새
- ADsP
- 오리과
- django
- 백로과
- 기러기목
- AI전략게임
- 생일문제
- Python
- python3
- Birthday paradox
- 딱다구리과
- 흰날개해오라기
- SimpleCraft
- Today
- Total
진박사의 일상
빅데이터 가명익명조치기술 전문 교육 2일차 요약 본문
가명처리
KISA 송부키 생성
-> 식별자와 key만 남김 -> 결합률 알 수 있음
->
가명처리 과정
금융정보가명처리
병원정보가명처리
-> 결합
익명처리
식별자 중에서 분석에 꼭 필요한 경우 아니면 제거
준 식별자 중 분석에 불필요한 것은 제거 - 준식별자가 증가하면 Population Uniqueness Issue(식별자가 같은 record가 특정 하나가 될 확률이 커짐)가 발생
민감정보가 포함된 경우 I-다양성과 T-근접성 반드시 적용
변환에 이슈가 되는 record 삭제하는 것도 유효
ARX
SEX, AGE, LOC -> Quasi-identifying
SEX(둘중 하나) -> Hierarchy wizard -> Use masking -> (*)으로
AGE(크기가 있음) -> Hierarchy wizard -> Use Interval(간격) -> range 0~20(bottom coding)과 65~100(top coding) 아웃라이어 처리 -> interval(0,5 -> 5세간격) -> new level을 추가해서 size2로 하면 10세간격
leveling 하는 이유 => 혹시 k익명성을 만족하지 못한다면 더 높은 레벨로 그루핑
LOC -> Hierarchy wizard -> Use Ordering -> 가까운 순으로 order 정렬을 하고 -> 그루핑을 함. 1레벨 2레벨...
-> Privacy models를 k=2인 2-Anonymity로
익명정보화
민감정보(Sensitive)를 추가하면 l-diversity까지 해야함.
Expand Transformation으로 추가해서 더 정보량을 늘릴 수 있음
ARIX-Risk
Chi-square 검정의
(실제값-예상값) 이 +인 것과 -인것을 기준으로 그루핑
정리는 나중에...
'프로그래밍 > 공부' 카테고리의 다른 글
[데베시] 3강 (0) | 2021.09.27 |
---|---|
[정보보안] 3강 - User Authentication (0) | 2021.09.27 |
컴퓨터 일반 요약 공부 - Part1. -2- (0) | 2021.09.16 |
[데베시] 2강 (0) | 2021.09.16 |
빅데이터 가명익명조치기술 전문 교육 1일차 (0) | 2021.09.14 |