1장 데이터의 이해
1절 데이터와 정보
1. 데이터의 정의와 특성
- 정의 : 추론과 추정의 근거를 이루는 사실
- 특성 : 존재적 특성(객관적 사실), 당위적 특성(추론의 근거)
2. 데이터의 유형
- 정성적 데이터(qualitative data) : 언어, 문자등의 비정형 데이터로 통계분석이 어려움
- 정량적 데이터(quantitative data) : 수치, 도형, 기호 등이 있으며 정형화 되어있어 통계분석이 용이
3. 지식경영의 핵심 이슈
- 암묵지(tactic knowledge) : 학습과 경험을 통해 개인에게 체화되어 있지만 겉으로 드러나지 않는 지식, 공유가 어려움
- 형식지(explicit knowledge) : 문서나 매뉴얼처럼 형상화된 지식으로 공유가 용이
- 암묵지 : 개인에게 축적된 내면화된 지식 -> 조직의 지식으로 공통화
- 형식지 : 문서로 표출화된 지식 - > 개인의 지식으로 연결화
Q) 개인에게 내재된 경험을 객관적인 데이터로 문서나 매체에 저장, 가공, 분석하는 과정은?
A) 표출화
4. 데이터와 정보의 관계
- Data : 개별 데이터 자체로는 의미가 중요하지 않은 객관적인 사실
- Information : 데이터의 가공, 처리와 데이터간 연관관계 속에서 의미가 도출된 것
- Knowledge : 데이터를 통해 도출된 다양한 정보를 구조화하여 유의미한 정보를 분류하고 개인적인 경험을 결합시켜 고유의 지식으로 내재화된 것
- Wisdom : 지식의 축적과 아이디어가 결합된 창의적인 산물
2절 데이터베이스 정의와 특징
1. 용어의 연혁
- 1950년대 미국에서 군대의 군비상황을 집중 관리하기 위해 컴퓨터 도서관을 설립하면서 데이터의 기지(base)라는 뜻으로 탄생
2. 데이터베이스의 정의
- 문자, 기호, 음성, 화상, 영상 등 상호 관련된 다수의 콘텐츠를 정보 처리 및 정보통신 기기에 의하여 체계적으로 수집, 축적하여 다양한 용도와 방법으로 이용할 수 있도록 정리한 정보의 집합체 - 데이터분석 전문가 가이드
3. 데이터베이스의 특징
- 통합된 데이터(Integrated data) : 데이터 중복이 없음. 데이터 중복은 관리상 복잡한 부작용 초래
- 저장된 데이터(Stored data) : 컴퓨터가 접근할 수 있는 저장 매체에 저장
- 공용 데이터(Shared data) : 여러 사용자가 서로 다른 목적으로 데이터를 공동으로 이용, 보통 대용량화되고 구조가 복잡
- 변화되는 데이터(Changed data) : 현 시점에서의 데이터를 나타냄, CRUD로 변화하면서도 항상 현재의 데이터 유지
*crud란? create, read, update, delete
- 정보의 축적 및 전달 측면 : 기계가독성, 검색가독성, 원격조작성
- 정보 이용 측면 : 원하는 정보를 정확하고 신속하게 찾을 수 있음
- 정보 관리 측면 : 정보를 일정한 질서와 구조에 따라 정리, 저장, 검색, 관리 할 수 있도록 정보를 체계적으로 축적
- 정보기술 발전 측면 : 네트워크기술의 발전을 견인할 수 있음
- 경제 및 산업 측면 : 다양한 정보를 필요에 따라 신속하게 제공, 이용할 수 있는 인프라로서 특징을 가짐
3절 데이터베이스의 활용
1. 기업내부 데이터베이스
- OLTP(On-Line Transaction Processing) : 여러 단말에서 보내온 메시지에 따라 호스트 컴퓨터가 데이터베이스를 액세스하고, 바로 처리 결과를 돌려보낸는 형태. ex) 주문입력시스템, 재고관리시스템
- OLAP(On-Line Analytical Processing) : 다양한 비즈니스 관점에서 쉽고 빠르게 다차원적인 데이터에 접근하여 의사 결정에 활용할 수 있는 정보를 얻을 수 있게 해주는 기술. OLTP에서 처리된 데이터를 분석해 제품의 판매 추이, 구매 성향 파악, 재무 회계 분석
- CRM(Customer Relationship Management) : 고객과 관련된 자료를 분석해 고객 중심 자원을 극대화하고, 이를 토대로 고객특성에 맞게 마케팅 활동
- SCM(Supply Chain Management) : 기업에서 원재료의 생산 및 유통 등 모든 공급망 단계를 최적화해 수요자가 원하는 제품을 원하는 시간과 장소에 제공
- ERP(Enterprise Resource Planning) : 인사, 재무, 생산 등 기업의 전 부문에 걸쳐 독립적으로 운영되던 각종 관리 시스템의 경영지원을 하나의 통합 시스템으로 재구축함으로써 생산성을 극대화 하려는 경영혁신기법
- BI(Business Intelligence) : 기업이 보유하고 있는 수많은 데이터를 정리하고 분석해 기업의 의사결정에 활용하는 프로세스
2장 데이터의 가치와 미래
1절 빅데이터의 이해
1. 빅데이터의 이해
- 빅데이터는 일반적인 데이터베이스 SW로 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터 : 데이터 규모에 초점
- 빅데이터는 다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출하고 데이터의 초고속 수집, 발굴, 분석을 지원하도록 고안된 차세대 기술 및 아키텍처 : 분석 비용 및 기술에 초점
- 빅데이터는 대용랸 데이터를 활용해 작은 용량에서는 얻을 수 없었던 새로운 통찰이나 가치를 추출해내는 일 : 인재, 조직변화
2. 출현 배경과 변화
- 산업계
- 학계
- 기술발전
3. 빅데이터의 기능
- 산업혁명의 석탄, 철
- 21세기의 원유
- 렌즈
- 플랫폼
4. 빅데이터가 만들어 내는 본질적인 변화
- 사전처리 - > 사후처리
- 표본조사 - > 전수조사
- 질 -> 양
- 인과관계 -> 상관관계
2절 빅데이터의 가치와 영향
1. 빅데이터의 가치
- 빅데이터 가치 산정이 어려운 이유
- 데이터 활용방식
- 새로운 가치 창출
- 분석 기술 발전
2. 빅데이터의 영향
- 기업
- 정부
- 개인
3절 비즈니스 모델
1. 빅데이터 활용 사례
- 기업 :
- 정부 :
- 개인 :
2. 빅데이터를 활용 기본 테크닉
- 연관규칙학습
- 유형분석
- 유전자 알고리즘
- 기계학습
- 회귀분석
- 감정분석
- 사회관계망분석
4절 빅위기 요인과 통제 방안
1. 빅데이터 시대의 위기 요인
- 사생활 침해
- 책임 원칙 훼손
- 데이터 오용
2. 위기 요인에 따른 통제 방안
- 동의에서 책임으로
- 결과 기반 책임 원칙 고수
- 알고리즘 접근 허용
5절 미래의 빅데이터
1. 빅데이터 활용의 3요소
- 데이터
- 기술
- 인력
3장 가치 창조를 위한 데이터 사이언스와 전략 인사이트
1절 빅데이터 분석과 전략 인사이트
1. 빅데이터의 이해
- 빅데이터는 일반적인 데이터베이스 SW로 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터 : 데이터 규모에 초점
- 빅데이터는 다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출하고 데이터의 초고속 수집, 발굴, 분석을 지원하도록 고안된 차세대 기술 및 아키텍처 : 분석 비용 및 기술에 초점
- 빅데이터는 대용랸 데이터를 활용해 작은 용량에서는 얻을 수 없었던 새로운 통찰이나 가치를 추출해내는 일 : 인재, 조직변화
2. 출현 배경과 변화
- 산업계
- 학계
- 기술발전
2절 전략 인사이트 도출을 위한 필요 역량
1. 데이터 사이언스의 의미와 역할
- 의미 :
- 역할 :
2. 데이터 사이언스의 구성요소
- IT :
- Analytics :
- 비즈니스 분석
3. 데이터 사이언티스트의 역량
- Hard Skill :
- Soft Skill :
- 역할 :
4. 데이터 사이언스 : 과학과 인문의 교차로
- 스토리텔링, 커뮤니케이션 도 중요
5. 전략적 통찰력과 인문학의 부활
- convergence -> divergence :
- 생산 -> 서비스 :
- 생산 -> 시장창조 :
3절 빅데이터 그리고 데이터 사이언스의 미래
1. 빅데이터의 시대
- 의미 :
- 역할 :
2. 빅데이터 회의론을 넘어 가치 패러다임의 변화
- 의미 :
- 역할 :
3. 데이터 사이언스의 한계와 인문학
- 한계 :
- 인문학 :
반응형