ADP 1과목 데이터 이해

2021. 10. 12. 17:26·Data/ADP(데이터분석 전문가)

1장 데이터의 이해

 

1절 데이터와 정보

 

1. 데이터의 정의와 특성

  • 정의 : 추론과 추정의 근거를 이루는 사실
  • 특성 : 존재적 특성(객관적 사실), 당위적 특성(추론의 근거)

2. 데이터의 유형

  • 정성적 데이터(qualitative data) : 언어, 문자등의 비정형 데이터로 통계분석이 어려움
  • 정량적 데이터(quantitative data) : 수치, 도형, 기호 등이 있으며 정형화 되어있어 통계분석이 용이 

3. 지식경영의 핵심 이슈

  • 암묵지(tactic knowledge) : 학습과 경험을 통해 개인에게 체화되어 있지만 겉으로 드러나지 않는 지식, 공유가 어려움
  • 형식지(explicit knowledge) : 문서나 매뉴얼처럼 형상화된 지식으로 공유가 용이
  • 암묵지 : 개인에게 축적된 내면화된 지식 -> 조직의 지식으로 공통화
  • 형식지 : 문서로 표출화된 지식 - > 개인의 지식으로 연결화

Q) 개인에게 내재된 경험을 객관적인 데이터로 문서나 매체에 저장, 가공, 분석하는 과정은?

A) 표출화

 

4. 데이터와 정보의 관계

  • Data : 개별 데이터 자체로는 의미가 중요하지 않은 객관적인 사실
  • Information : 데이터의 가공, 처리와 데이터간 연관관계 속에서 의미가 도출된 것
  • Knowledge : 데이터를 통해 도출된 다양한 정보를 구조화하여 유의미한 정보를 분류하고 개인적인 경험을 결합시켜 고유의 지식으로 내재화된 것
  • Wisdom : 지식의 축적과 아이디어가 결합된 창의적인 산물

 

2절 데이터베이스 정의와 특징

 

1. 용어의 연혁

  • 1950년대 미국에서 군대의 군비상황을 집중 관리하기 위해 컴퓨터 도서관을 설립하면서 데이터의 기지(base)라는 뜻으로 탄생

2. 데이터베이스의 정의

  • 문자, 기호, 음성, 화상, 영상 등 상호 관련된 다수의 콘텐츠를 정보 처리 및 정보통신 기기에 의하여 체계적으로 수집, 축적하여 다양한 용도와 방법으로 이용할 수 있도록 정리한 정보의 집합체 - 데이터분석 전문가 가이드

3. 데이터베이스의 특징

  • 통합된 데이터(Integrated data) : 데이터 중복이 없음. 데이터 중복은 관리상 복잡한 부작용 초래
  • 저장된 데이터(Stored data) : 컴퓨터가 접근할 수 있는 저장 매체에 저장
  • 공용 데이터(Shared data) : 여러 사용자가 서로 다른 목적으로 데이터를 공동으로 이용, 보통 대용량화되고 구조가 복잡
  • 변화되는 데이터(Changed data) : 현 시점에서의 데이터를 나타냄, CRUD로 변화하면서도 항상 현재의 데이터 유지

*crud란? create, read, update, delete

 

  • 정보의 축적 및 전달 측면 : 기계가독성, 검색가독성, 원격조작성
  • 정보 이용 측면 : 원하는 정보를 정확하고 신속하게 찾을 수 있음
  • 정보 관리 측면 : 정보를 일정한 질서와 구조에 따라 정리, 저장, 검색, 관리 할 수 있도록 정보를 체계적으로 축적
  • 정보기술 발전 측면 : 네트워크기술의 발전을 견인할 수 있음
  • 경제 및 산업 측면 : 다양한 정보를 필요에 따라 신속하게 제공, 이용할 수 있는 인프라로서 특징을 가짐

 

3절 데이터베이스의 활용

1. 기업내부 데이터베이스

  • OLTP(On-Line Transaction Processing) : 여러 단말에서 보내온 메시지에 따라 호스트 컴퓨터가 데이터베이스를 액세스하고, 바로 처리 결과를 돌려보낸는 형태. ex) 주문입력시스템, 재고관리시스템
  • OLAP(On-Line Analytical Processing) : 다양한 비즈니스 관점에서 쉽고 빠르게 다차원적인 데이터에 접근하여 의사 결정에 활용할 수 있는 정보를 얻을 수 있게 해주는 기술. OLTP에서 처리된 데이터를 분석해 제품의 판매 추이, 구매 성향 파악, 재무 회계 분석
  • CRM(Customer Relationship Management) : 고객과 관련된 자료를 분석해 고객 중심 자원을 극대화하고, 이를 토대로 고객특성에 맞게 마케팅 활동
  • SCM(Supply Chain Management) : 기업에서 원재료의 생산 및 유통 등 모든 공급망 단계를 최적화해 수요자가 원하는 제품을 원하는 시간과 장소에 제공
  • ERP(Enterprise Resource Planning) : 인사, 재무, 생산 등 기업의 전 부문에 걸쳐 독립적으로 운영되던 각종 관리 시스템의 경영지원을 하나의 통합 시스템으로 재구축함으로써 생산성을 극대화 하려는 경영혁신기법
  • BI(Business Intelligence) : 기업이 보유하고 있는 수많은 데이터를 정리하고 분석해 기업의 의사결정에 활용하는 프로세스

 

2장 데이터의 가치와 미래

 

1절 빅데이터의 이해

 

1. 빅데이터의 이해

  • 빅데이터는 일반적인 데이터베이스 SW로 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터 : 데이터 규모에 초점
  • 빅데이터는 다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출하고 데이터의 초고속 수집, 발굴, 분석을 지원하도록 고안된 차세대 기술 및 아키텍처 : 분석 비용 및 기술에 초점
  • 빅데이터는 대용랸 데이터를 활용해 작은 용량에서는 얻을 수 없었던 새로운 통찰이나 가치를 추출해내는 일 : 인재, 조직변화

2. 출현 배경과 변화

  • 산업계
  • 학계
  • 기술발전

3. 빅데이터의 기능

  • 산업혁명의 석탄, 철
  • 21세기의 원유
  • 렌즈
  • 플랫폼

4. 빅데이터가 만들어 내는 본질적인 변화

  • 사전처리 - > 사후처리
  • 표본조사 - > 전수조사
  • 질 -> 양
  • 인과관계 -> 상관관계

 

2절 빅데이터의 가치와 영향

 

1. 빅데이터의 가치

- 빅데이터 가치 산정이 어려운 이유

  • 데이터 활용방식
  • 새로운 가치 창출
  • 분석 기술 발전

2. 빅데이터의 영향

  • 기업
  • 정부
  • 개인

 

3절 비즈니스 모델

 

1. 빅데이터 활용 사례

  • 기업 : 
  • 정부 : 
  • 개인 : 

2. 빅데이터를 활용 기본 테크닉

  • 연관규칙학습
  • 유형분석
  • 유전자 알고리즘
  • 기계학습
  • 회귀분석
  • 감정분석
  • 사회관계망분석

 

4절 빅위기 요인과 통제 방안

 

1. 빅데이터 시대의 위기 요인

  • 사생활 침해
  • 책임 원칙 훼손
  • 데이터 오용

2. 위기 요인에 따른 통제 방안

  • 동의에서 책임으로
  • 결과 기반 책임 원칙 고수
  • 알고리즘 접근 허용

 

5절 미래의 빅데이터

 

1. 빅데이터 활용의 3요소

  • 데이터
  • 기술
  • 인력

 

3장 가치 창조를 위한 데이터 사이언스와 전략 인사이트

 

1절 빅데이터 분석과 전략 인사이트

 

1. 빅데이터의 이해

  • 빅데이터는 일반적인 데이터베이스 SW로 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터 : 데이터 규모에 초점
  • 빅데이터는 다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출하고 데이터의 초고속 수집, 발굴, 분석을 지원하도록 고안된 차세대 기술 및 아키텍처 : 분석 비용 및 기술에 초점
  • 빅데이터는 대용랸 데이터를 활용해 작은 용량에서는 얻을 수 없었던 새로운 통찰이나 가치를 추출해내는 일 : 인재, 조직변화

2. 출현 배경과 변화

  • 산업계
  • 학계
  • 기술발전

 

2절 전략 인사이트 도출을 위한 필요 역량

 

1. 데이터 사이언스의 의미와 역할

  • 의미 : 
  • 역할 : 

2. 데이터 사이언스의 구성요소

  • IT :
  • Analytics :
  • 비즈니스 분석

3. 데이터 사이언티스트의 역량

  • Hard Skill : 
  • Soft Skill : 
  • 역할 : 

4. 데이터 사이언스 : 과학과 인문의 교차로

  • 스토리텔링, 커뮤니케이션 도 중요

5. 전략적 통찰력과 인문학의 부활

  • convergence -> divergence : 
  • 생산 -> 서비스 : 
  •  생산 -> 시장창조 : 

 

3절 빅데이터 그리고 데이터 사이언스의 미래

1. 빅데이터의 시대

  • 의미 : 
  • 역할 : 

2. 빅데이터 회의론을 넘어 가치 패러다임의 변화

  • 의미 : 
  • 역할 : 

3. 데이터 사이언스의 한계와 인문학

  • 한계 : 
  • 인문학 : 
반응형
'Data/ADP(데이터분석 전문가)' 카테고리의 다른 글
  • ADP 4과목 2장 R프로그래밍 기초
  • ADP 4과목 1장 데이터 분석 개요
  • ADP 3과목 데이터 분석 기획
  • ADP 2과목 데이터 처리 기술의 이해
수영하는 두루미
수영하는 두루미
한국체육대학교에서 스포츠 AI빅데이터를 공부하고 있습니다. B.S. Computer Science
  • 수영하는 두루미
    두루미의 스포츠 데이터분석실
    수영하는 두루미
  • 전체
    오늘
    어제
    • 분류 전체보기 (94)
      • 스포츠 AI·빅데이터(2024~) (21)
        • 2024-2 (0)
        • 빅데이터기반 스포츠경기분석 (10)
        • 스포츠와 소셜텍스트분석 (4)
        • 영상기반 데이터 수집기법 (3)
        • 2025-1 (0)
        • 스포츠와 AI 모델링 기초 (0)
        • 스포츠와 프로그램 코딩(Python) (0)
        • 운동역학 (0)
        • 2025-2 (0)
        • 스포츠 AI빅데이터 연구 세미나 (1)
        • 스포츠 딥러닝 (0)
        • 운동생리학 (0)
        • etc. (0)
      • Data (13)
        • ADsP (1)
        • SQLD (1)
        • 빅데이터분석기사 (4)
        • ADP(데이터분석 전문가) (5)
        • 키다리아저씨(2021.12.05~) (2)
        • 파이썬 자격과정(2021.07.22-23) (0)
      • 정보처리기사 (1)
      • CSTS (10)
      • 블록체인과 암호화폐 (0)
        • 블록체인 (0)
      • Algorithm (44)
        • 백준 (42)
        • 자료구조 (2)
      • CSOS (0)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    heapsort
    명세기반테스트
    데이터분석
    동적테스트
    알고리즘
    csts
    자료구조
    한체대
    정적테스트
    한체대대학원
    구조기반테스트
    스포츠ai빅데이터
    Python
    스포츠데이터
    빅데이터분석기사
    C언어
    경험기반테스트
    백준
    스포츠빅데이터
    스포츠데이터분석
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.6
수영하는 두루미
ADP 1과목 데이터 이해
상단으로

티스토리툴바