진박사의 일상

ADsP 2과목 정리(마지막) 본문

프로그래밍/ADsP

ADsP 2과목 정리(마지막)

진박사. 2021. 8. 6. 17:38

분석 과제 발굴

 

2. 상향식 접근법(***)

(1)다양한 원천 데이터를 대상으로 분석을 수행하여 모든 문제를 도출하는 일련의 과정

문제의 정의 자체가 어려운 경우 데이터 기반 문제 재정의 및 해결 방안을 탐색, 지속적으로 개선하는 방향. 일반적으로 비지도헉습 방법으로 수행 [빅데이터 -> 분석 -> 문제(가치)]

(2)하향식 vs 상향식

-하향식 : 문제 구조 분명하게 분석가에게 주어진 경우 유용 (정형데이터)

-상향식 : 복잡하고 다양한 환경에서 발생하는 문제 경우, 디자인사고 접근법 고려(빅데이터-비정형데이터)

(3)디자인사고(Design Thinking) - 분석적사고(연역적, 귀납적 추리로 분석 -> 이미 시도되고 검증된 것 철저히 고집)와 직관적 사고(문제에 기반을 두지 않고 직감을 중시 -> 사업 체계화 역량 부족으로 성장 지속 문제 봉착)의 대안.

분석적 사고에 기반을 둔 완벽환 숙련과 직관적 사고에 근거한 창조성이 역동적으로 상호작용하면서 균형 유지

디자인사고의 요소 - 공감, 정의, 상상, 프로토타입, 테스트 

(4)지도학습 vs 비지도학습(**)

-지도학습 - 훈련 데이터로 알고리즘 적용해 함수 추론, 알아서 답을 찾도록(input, output 존재), 분류와 예측, 회귀분석

-비지도학습 - 분류를 하지만 답을 알려주지 않고 컴퓨터가 알아서 분류하도록, 그루핑 알고리즘, 군집화

(5) 프로토타이핑 접근법 - 4단계(1단계 - 요구사항 분석, 2단계-4세대언어/CASE도구로 핵심 기능 위주 개발, 3단계-실제 사용함으로 요구사항 이행 확인, 4단계 - 수정과 보완, 수정된 후에는 3단계로)

 

분석 프로젝트 관리 방안

1. 분석과제의 주요 5가지 특성 관리 영역(**)

-(1) 데이터 복잡도 : BI 프로젝트처럼 정형 데이터가 분석 마트로 구성되어 있는 상태에서 분석하는 것과 달리, 텍스트, 오디오, 비디오 등 비정형 데이터 및 다양한 시스템에 산재된 원천 데이터를 통합해 분석 프로젝트를 진행할 때는 초기 데이터 확보 및 통합 외에도 잘 적응할 수 있는 분석 모델의 선정 등에 대한 사전 고려필요

-(2) 데이터 크기 : 분석하고자 하는 데이터 양을 고려한 관리방안 수립

-(3) 속도 : 분석 결과가 도출되었을 때 이를 활용하는 시나리오 측면에서 속도 고려. 상황에 따라 분석 모델의 성능 및 속도를 고려한 개발 및 테스트가 수행되어야 함. Batch vs 실시간

-(4) 정확도 : Accuracy = 모델과 실제 값 사이의 차이가 적다. 활용도 측면 / Precision : 모델을 지속적으로 반복했을 때 편차의 수준이 일괄적으로 동일한 결과를 제시한다. 안정적 측면 / 그러나 Accuracy와 Precision은 Trade off 관계 존재.

-(5) 분석 복잡도 : 분석 모델의 정확도와 복잡도는 Trade off 관계가 존재. 복잡->정확+, 해석-

2. 분석 프로젝트의 특징

-도출된 결과의 재해석을 통한 지속적 반복 및 정규화가 수행되는 경우가 대부분 -> 프로토타이핑 / 애자일 방식의 프로젝트 관리 방식 고려 필요

-관리방안 : 프로젝트 관리 지침 가이드 10개 주제 - (통합, 이해관계자, 범위, 자원, 시간, 원가, 리스크, 품질, 조달, 의사소통)

 

 

분석 마스터 플랜 수립 프레임워크(**)

1. 마스터플랜 수립

데이터 기반 구축을 위해 분석 과제를 대상으로 전략적 중요도, 비즈니스 성과 및 ROI(투자회수율), 분석 과제의 실행 용이성 등 다양한 기준으로 고려해 적용 우선순위를 설정

-> 업무 내재화 적용 수준, 분석 데이터 적용 수준, 기술 적용 수준 고려해 분석 구현 로드맵 수립

(ISP(정보전략계획) 방법론 활용)

-전략적 중요도 : 전략적 필요성(목표 및 업무에 직접 연관 관계가 밀접한 정도), 시급성(요구사항, 업무능률 향상 위해 시급히 수행해야 하는 정도)

- 실행 용이성 : 투자 용이성(기간 및 인력 투입의 용이성 정도, 비용 및 투자 예산 확보 가능성 정도), 기술 용이성 (적용 기술의 안정성 검증 정도)

 

2. ROI(Return on Investment/투자자본수익률) : 투자자의 어떤 자원 투자로 인해 얻어진 이익.

-높은 ROI는 투자가 투자비용 대비 좋은 성과를 낸다는 뜻. 얼마나 효율적으로 투자가 이뤄졌는지, 투자 방법 간의 효율성 측정에 쓰임.

빅데이터를 4V 관점으로 볼 때 3V(Volumn, Variety, Velocity)는 투자비용(Investment), 1V(Value)는 비즈니스 효과(Return)으로 볼 수 있다.(**)

-ROI 관점 분석 과제 우선순위 평가 기준(**)

시급성 : 판단 기준은 전략적 중요도. - 1V(Value) 

난이도 : 비용과 범위 측면을 고려시 바로 적용하기 쉬운지 아닌지 - 3V(Volumn, Variety, Velocity)

-포트폴리오 사분면 분석을 통한 과제 우선순위 선정 기법(***)

분석과제를 4가지 유형으로 구분하여 우선순위 결정. 시급성 우선시 (3->4->2)순, 난이도 우선시(3->1->2)순

1(현재/고난이도) 2(미래/고난이도) 고난이도
3(현재/저난이도) 4(미래/저난이도) 저난이도
시급도-현재 시급도-미래  

1사분면 : 전략적 중요도가 높아 경영에 미치는 영향 크므로 시급한 추진 필요, 난이도가 높아 바로 적용 어려움.

2사분면 : 현재는 전략적 중요도 높지 않지만 중장기적 관점에서는 반드시 추진 필요, 바로 적용하기 어려움.

3사분면 : 전략적 중요도가 높아 시급히 추진 필요. 난이도가 어렵지 않아 우선적으로 바로 적용할 필요서 있음.

4사분면 : 전략적 중요도가 높지 않아 중장기적 관점에서 추진이 바람직. 과제 바로 적용은 어렵지 않음.

 

3. 수행 과제 도출 및 우선순위 평가(*)

분석 과제 도출 -> 우선순위 평가(과제 우선순위 기준 수립) -> 우선순위 정련(분석과제 수행의 선후 관계 분석 통해 순위 조정)

 

4. ISP(Information Strategy Planning)

전사 정보시스템을 기획하는 단계, 조직의 목표 성공을 위한 전략적 측면과 조직의 목표 달성을 위한 시스템 측면의 모형을 기획하고 설정하는 단계. 사업 목표에 일치하는 프로젝트 식별-> 우선순위 결정 포인트 제공. 정보 시스템의 저비용 투자, 고효율 성과를 지향.

 

5. 이행계획 수립

로드맵 수립(사분면 분석 통해 결정된 우선순위 토대로 최종 실행 우선 순위 결정) -> 세부 이행계획 수립(반복적인 정련 과정 통해 완성도 높이는 방식, 데이터 수집 및 확보는 순차적, 모델링은 반복적으로 하는 혼합형 적용)

 

 

분석 거버넌스 체계 수립

1. 거버넌스 체계 : 정책 결정에 있어 정부 주도의 통제와 관리에서 벗어나 다양한 이해당사자가 주체적인 행위자로 협의와 합의 과정을 통하여 정책을 정하고 집행해 나가는 사회적 통치 시스템(존 피에르) / 한 국가의 여러 업무를 관리하기 위하여 정치 경제 및 행정적 권한을 행사하는 것. (유엔)

2. 거버넌스 분석 체계(**) : 기업에서 데이터를 이용한 의사 결정이 장조, 데이터 분석과 활용을 위한 체계적 관리 중요 -> 단순히 대용량 데이터를 수집, 축적보다 어떤 목적으로 어떤 데이터를 어떠헥 분석에 활용할 것인가를 고려한 분석체계

3. 거버넌스 구성 요소 : 분석 기획 및 관리 수행 조직 -> 과제 기획 및 운영 프로세스 -> 분석 관련 시스템 -> 데이터 거버넌스 -> 분석 교육 ->

4. 데이터 분석 수준 진단(***)

-(1) 분석 준비도(**) - 데이터 분석 도입의 수준을 파악하기 위한 진단 방법 / 세부항목 수준파악 -> 전체 요건 중 일정 수준 이상 충족시 분석 업무 도입 -> 충족 못할 시 분석 환경 조성

--ㄱ. 분석 업무 파악 : 발생한 사실 분석 업무, 예측 분석 업무, 시뮬레이션 분석 업무, 최적화 분석 업무, 분석 업무 정기적 개선

--ㄴ. 분석 인력 및 조직 : 분석 전문가 직무 존재, 분석 전문가 교육 훈련 프로그램, 관리자 기본 분석 능력, 전사 분석 업무 총괄 조직 존재, 경영진 분석 업무 이해 능력

--ㄷ. 분석 기법 : 업무별 적합한 분석 기법 사용, 분석 업무 도입 방법론, 분석기법 라이브러리, 분석 기법 효과성 평가, 분석 기법 정기적 개선

--ㄹ. 분석 데이터 : 분석 업무 위한 데이터 충분성& 신뢰성, 적시정, 비구조적 데이터 관리, 외부 데이터 활용 체계, 기준 데이터 관리

--ㅁ. 분석 문화 : 사실에 근거한 의사결정, 관리자의 데이터 중시, 회의 등에서 데이터 활용, 경영진이 직관보다 데이터를 사용하고 있나, 데이터 공유 및 협업 문화

--ㅂ. 분석 인프;라 : 운영 시스템 데이터 통합, EAI, ETL, 등 데이터 유통체계, 분석 전용 서버 및 스토리지, 빅데이터 분석 환경, 비주얼 분석 환경

-(2) 분석 성숙도(***)

CMMI 모델(능력 성숙도 통합 모델) : 소프트웨어 개발 및 전산 장비 운영 업체들의 업무 능력 및 조직의 성숙도 평가하기 위한 모델 - 5단계로 구성.

--ㄱ. 도입 단계 : 분석 시작, 환경 및 시스템 구축

--ㄴ. 활용 단계 : 분서 결과를 실제 업무에 적용

--ㄷ. 확산 단계 : 전사 차원에서 분석을 관리하고 공유

--ㄹ. 최적화 단계 : 분석을 진화시켜 혁신 및 성과 향상에 기여

(비즈니스 부문, 조직/역량 부문, IT 부문에 맞춰 성숙도 수준 파악)

ETL - 추출 변환 적재 - DB 이용의 한 과정 / 특히 DW에서 동일/타 기종의 데이터 소스로부터 추출, 조회/분석 목적으로 포맷이나 구조를 맞춰 저장하기 위해 변환, 최종 대상으로 변환 데이터 삭제

OLAP - 온라인 분석 처리, 의사결정 지원 시스템의 대표예. 

샌드박스 - 외부 접근 및 영향을 차단해 제한된 영역 내에서만 프로그램을 동작 시키는 것.

CoE(Cener of Excellence) : 조직 내 새로운 역량을 만들고 확산하기 위한 전문자들의 조합으로 구성된 조직.

5. 분석 수준 진단 결과(***)

정착형 확산형 성숙도+
준비형 도입형 성숙도-
준비도- 준비도+  

(1) 정착형 : 준비도는 낮지만 조직, 인력, 분석 업무, 기법 등을 제한적으로 사용중이라 정착이 필요

(2) 확산형 : 기업에 필요한 6가지 분석 구성 요소를 갖추고 부분적으로 도입되어 확산이 필요

(3) 준비형 : 조직, 인력, 분석 업무, 기법 등이 적용되어 있지 않아 준비가 필요

(4) 도입형 : 분석 업무, 기법 등은 부족하지만 적용 조직 등 준비가 잘 되어 바로 도입 필요

 

6. 분석 지원 인프라 방안 수립

관리의 복잡도 및 비용의 증대라는 부작용을 막기 위해 장기적으로  안정적으로 활용할 수 있는 확장성을 고려한 플랫폼 구조 도입이 적절.

분석 플랫폼 구성 요소 - 광의의 분석플랫폼(분석 서비스 제공 엔진, 분석 어플리케이션, 분석 서비스 api 제공), 협의의 분석 플랫폼(데이터 처리 프레임워크, 분석엔진/분석라이브러리), 컴퓨터 시스템(운영체제, 하드웨어)

 

7. 데이터 거버넌스 체계 수립

전사 차원의 모든 데이터에 대하여 정책 및 지침, 표준화, 운영 조직 및 책임 들의 표준화된 관리 체계를 수립, 프레임어크 및 저장소를 구축하는 것. 중요 관리 대상 - 마스터 데이터(자주 변하지X, 자료 처리 운용에 기본 자료로 제공되는 자료의 집합), 메타 데이터(데이터에 대한 구조화된 데이터), 데이터 사전(데이터에 관한 정보를 수집, 보관, 제공하기 위한 장치)

-(1) 데이터 거버넌스 구성 요소(*)

-원칙 : 데이터 유지 관리 위한 지침과 가이드 및 보안, 품질 기준, 변경 관리

-조직 : 데이터 관리할 조직의 여할과 책임 및 데이터 관리자, 아키텍트

-프로세스 : 데이터 관리 위한 활동과 체계 및 작업 절차, 모니터링 활동

-(2) 데이터 거버넌스 체계 요소(***)

--1.데이터 표준화 : 데이터 표준 용어 설명, 명명 규칙, 메타데이터/데이터 사전 구축

--2.데이터 관리 체계 : 메타데이터와 데이터사전의 관리 원칙 수립. 빅데이터의 경우 데이터 생명 주기 관리 방안을 수립하지 않으면 데이터 가용성 및 관리 비용의 증대

--3. 데이터 저장소 관리 : 메타데이터 및 표분제이터를 관리하기 위한 전사 차원의 저장소 구성. 데이터 구조변경에 따른 사전영향평가도 수행되어야 효율적 활용 가능

--4. 표준화 활동 : 데이터 거버넌스 체계 구축 후 표준 준수 여부를 주기적 점검, 모니터링

 

8. 데이터 분석 조직 및 인력 방안 수립(***)

(1) 개요 - 다양한 분야의 지식과 경험을 가진 인력과 업무 담당자 등으로 구성된 전사 또는 부서내 조직으로 구성.

조직구조 고려사항 - 비즈니스 질문 선제적 찾기 가능? 분석 전담 조직과 타 부서관 유기적 협조&지원 가능? 내부조직 구조? / 인력 구성 고려 사항 - 비즈니스 & IT 전문가 조합인가? 어떤 경험/스킬 갖춘사람? 통계기법/분석 모델링 전문 인력 별도 구성? 전사 비즈니스 커버 인력 없을시 대책, 인력 규모는?

DSCoE(분석조직)

-(1) 집중구조 : 전사 분석 업무를 별도의 전문 분석 전담 조직에서 담당 / 현업 부서와 분석 부서의 이중화/이원화 가능성 높음

-(2) 기능구조 : 일반적인 분석 수행 구조, 별도 분석 조직 없고 해당 업무 부서에서 분석 수행 / 전사적 핵심 분석이 어려우며 과거 실적에 국한된 분석 수행 가능성 높음

-(3) 분산구조 : 분산 조직 인력들을 현업부서로 직접 배치하여 분석 업무 수행, 전사 차원의 우선순위 수행, 분석 결과에 따른 신속한 액션 가능, 베스트 프랙티스 공유 가능 / 부서 분석 업무와 역할 분담 명확히 해야 함.

인력 구성 - 비즈니스 인력, IT 기술 인력, 분석 전문 인력, (변화 관리 인력, 교육 담당 인력)-겸직가능

 

9. 분석과제 관리 프로세스 수립

(1) 분석 과제 관리 프로세스 : 과제 발굴(분석 아이디어 발굴-> 분석과제 풀(Pool) 관리 -> 분석 과제 확장) -> 과제 수행(분석 수행할 팀 구성 -> 분석 과제 모니터링 -> 과제 결과를 공유 & 개선)

 

10. 분석 교육 및 변화 관리 - 지속적인 교육과 문화 정착 시키는 변화를 관리해야 함. / 분석 기획자(큐레이션 교육), 분석 실무자(분석 기법 및 툴에 대한 교육), 업무 수행자(분석기회 발굴, 구체화, 시나리오 작성법)

'프로그래밍 > ADsP' 카테고리의 다른 글

ADsP 3과목 - 2  (0) 2021.08.10
ADsP 3과목 - 1  (0) 2021.08.08
[TIL] 21.08.03 - ADsP 공부  (0) 2021.08.03
[TIL] 2021.08.01 ADsP 2과목  (0) 2021.08.03
[TIL] 2021.07.23 ADsP 공부  (0) 2021.07.23