logo logo
김희준
김희준

Feb 04, 2024업데이트

비즈니스를 운영하고, 경영 전략을 수립하는 일은 많은 판단의 연속이기도 합니다. 우리는 클라이언트와 동료, 주주 모두가 납득할 수 있는 의사 결정을 수립하기 위해 최대한 객관적 지표와 정량화된 수치를 활용합니다. 한편, IT 및 통신의 발달에 따라, 이를 뒷받침할 수 있는 마케팅 데이터의 종류와 양도 폭발적으로 늘어났습니다. 자연스럽게, 경영의 의사결정과정은 데이터 사이언스와 밀접한 관련을 갖게 되었습니다.

이번 글에서는, 데이터 사이언스 관점의 의사 결정 나무와 의사 결정 나무 알고리즘에 대한 설명을 개괄합니다. 그리고 구체적인 활용분야와 함께, 경영전략 수립 및 PT에서 이용할 수 있는 시각 자료를 아름답고 빠르게 작성하는 법을 소개하겠습니다.

Part1:의사 결정 나무

1. 의사 결정 나무(Decision Tree)란?

의사 결정 나무 일러스트

의사결정 나무는 의사결정이 연속적인 단계로 이루어지는 경우 활용할 수 있는 분석 기법으로, 데이터마이닝 및 인공지능 학습에 주로 이용되고 있습니다. 의사결정나무는 결정 나무, 또는 의사 결정 트리, 결정트리 등의 용어로 불리기도 합니다.

의사결정에 관여하는 다양한 변수를 목록화해 통제할 수 있으므로, 의사 결정에 수치적 근거를 제공하고 의사 결정에 소요되는 시간을 효율적으로 단축할 수 있습니다. 때문에, 경영 분야에서도 활발히 사용되고 있습니다.

2. 의사 결정 나무의 종류 및 특징

의사 결정 나무는 변수의 종류에 따라 두가지로 나눌 수 있습니다.

분류 나무(Classification Tree)

목표 변수(산출값)이 범주로 구성되는 경우입니다. 이 경우에는 끝마디가 소속 집단을 나타냅니다.

회귀 나무(Regression Tree)

목표 변수가 수치형 변수로 구성됩니다. 이 경우, 끝마디는 집단의 평균입니다.

데이터 사이언스 관점에서 의사 결정 나무 알고리즘의 종류를 조금 더 덧붙이겠습니다. 의사 결정 나무 알고리즘을 분류/평가하는 기준은 다음과 같습니다.

  • 분산을 어떻게 계산하는가?
  • 종속변수가 연속형or이산형인가?
  • 오버피팅 통제 여부 및 방법
  • 불완전한 데이터 분석 가능 여부

*오버피팅: 인공지능이 공통특성 외 지엽적 특성까지 반영한 학습으로 인해 새로운 데이터를 예측하지 못하는 상태

  • ID3(Internative Dichotomizer): Ross Quinlan에 의해 개발된 결정트리 알고리즘. 정보 이득(Information Gain)을 계산해 피쳐의 Threshold 값을 얻을 때, 섀넌 엔트로피를 사용합니다.
  • 5: 이것 또한 Quinlan의 알고리즘으로, ID3과의 차이점은 연속형/이산형 변수를 모두 받아들일 수 있고, 불완전한 데이터를 다룰 수 있습니다. 또한 Prunning으로 오버피팅 문제를 해결할 수 있고 훈련 데이터를 구성하는 변수에 다른 가중치를 적용할 수 있습니다.
    현재는 모든 의사 결정 나무 알고리즘이 ‘연속/불연속 변수, 불완전 데이터를 다룰 수 있고 오버피팅을 해결’할 수 있습니다.
  • CART(Classification and Regression Trees): 의사 결정 나무와 종종 동의어로 사용되는 대표적 알고리즘입니다. C4.5와 유사하지만, C4.5가 법칙집합을 만드는 즉각적 단계를 포함하는 반면 CART는 반복적으로 데이터에 적용된 수치적 분할기준에 기반한 결정 트리를 만드므로, Purity가 높습니다.
  • 0: Quinlan의 가장 최근 알고리즘으로, 현재는 저작권이 걸려있어 접근 및 사용이 다소 어렵습니다.
  • CHAID(Chi-square Automatic Interaction Detector): 이 알고리즘은 명목 종속변수에 대한 알고리즘으로, 종속변수를 포함한 이산형 변수의 상호관계를 밝힐 수 있습니다.

3. 의사 결정 나무의 중요성

높은 정확도와 예측력을 요구하는 분석은 의사 결정 나무보다 신경망 알고리즘, 회귀 분석 등 다른 모델을 이용하는 것이 더 적합할 수도 있습니다. 그러나 의사 결정 나무는 시각화가 용이하고 설명력이 좋다는 점을 큰 특징이자 장점으로 가지고 있습니다. 따라서, 비즈니스의 제안서, 프레젠테이션 등을 준비할 때 시각 자료로 활용하면 팀원의 이해도와 주목도를 크게 제고할 수 있습니다. 또한, 각 노드로 변수를 목록화 할 수 있다는 점도 문제 상황과 프로젝트를 분석하는데 도움이 됩니다.

4. 활용분야

의사 결정 나무는 DB마케팅, CRM, 시장조사, 광고조사, 의학 연구, 품질 관리 등 수없이 많은 분야에서 활용되고 있습니다. 더욱 구체적으로는, 응답 분석, 고객 타겟팅, 반응 분석, 고객/시장 세분화, 광고 효과 측정, 브랜드 이미지 테스트 등이 있습니다.

Part2: Boardmix로 의사 결정 나무 그리기

Boardmix는 클라우드 기반으로 협업 기능을 제공하는 화이트보드 도구입니다. 창의성 뿐만 아니라 IT, 비즈니스, 마케팅 분야에 활용할 수 있는 템플릿도 다양하게 제공하고 있어 프레젠테이션 자료 및 회의 도구로 활용하기 적합합니다. 여러분께, Boardmix로 의사 결정 나무 그리는 방법을 소개하겠습니다.

1. 새 화이트보드 만들기

의사 결정 나무 일러스트2

Boardmix.com에 접속하고, 이메일로 로그인합니다. 회원 등록 및 이용은 무료입니다.

우측 상단의 [Go to Workspace]를 클릭하세요.

2. 도구 이용

의사 결정 나무 일러스트3

Boardmix가 훨씬 빠르고 아름답게 시각 자료를 구성할 수 있게 만들어주는 강력한 기능 중 하나를 소개합니다. Layout 도구를 선택하면, 글상자와 화살표를 빠르게 생성해 종속관계나 인과관계, 흐름 등을 쉽게 나타낼 수 있습니다.

의사 결정 나무 일러스트4

[Layout] 도구를 선택하고 화이트보드를 클릭합니다. 하위 단계를 만들고 싶은 개체를 선택하면 [+]버튼이 활성화됩니다. [+] 버튼을 클릭해 개체를 추가하고, 개체를 선택한 상태에서 [Delete] 키를 눌러 삭제하세요. 개체를 한 번 클릭 한 상태에서는 팝업 메뉴가 활성화되고, 색상 등 도형 서식을 변경할 수 있습니다.

의사 결정 나무 일러스트5

개체를 더블클릭하면 텍스트를 편집할 수 있습니다. 팝업 메뉴로 글꼴 서식을 편집할 수 있습니다.

의사 결정 나무 일러스트6

이제 제목을 추가해봅시다. 좌측의 사이드바에서 텍스트 도구를 클릭하거나, 빈 곳을 더블 클릭해서 글 상자를 만들 수 있습니다. Boardmix의 모든 개체는 스냅으로 정렬되기 때문에 쉽게 깔끔한 표를 만들 수 있습니다.

의사 결정 나무 일러스트7

텍스트박스로 각 분기점을 표시했지만, 화살표 색상을 변경하는게 더 깔끔할 수도 있습니다. 개체를 선택하고 [Branch Color] 메뉴를 선택하세요. 개체에 연결되어있는 화살표 색상을 변경할 수 있습니다.

3. 내보내기 및 기타 기능

의사 결정 나무 일러스트8

작성한 화이트보드는 자동으로 저장되어 클라우드에 백업됩니다. 작업 파일을 잃어버릴 염려가 전혀 없겠죠. 만약 이미지, 벡터 파일, 문서로 다운받고 싶은 경우에는 좌측 상단의 내보내기 아이콘을 클릭하세요.

의사 결정 나무 일러스트9

또는, URL로 문서를 바로 공유할 수 있습니다. 아니면 이메일로 친구를 추가하세요. 동시에 화이트보드를 편집할 수 있습니다.

의사 결정 나무 일러스트10

간단한 의사 결정 나무 예시가 완성되었습니다. 단 5분도 걸리지 않습니다!

마무리

의사 결정 나무에 대한 설명이 되었나요? 머신러닝 분야에서 주로 이용되는 알고리즘이기 때문에, 통계 분석과 관련된 자세한 사항을 이해하는 것은 어려울 수 있습니다. 그러나, 비즈니스 프레젠테이션을 준비하거나 경영 전략을 수립해야 할 때, 의사 결정 나무로 결정 사항을 목록화하고, 이에 따르는 경우의 수를 시각화 하는 일은 판단을 빠르게 만들어주는데다, 의사 결정 과정에 참여하는 모든 인원이 직관적으로 결정 단계를 이해할 수 있게 해줍니다. 의사 결정 나무를 빠르고 아름답게 그릴 수 있는 Boardmix도 여러분께 소개해드렸으니, 꼭 이를 이용하셔서, 사업 전략을 설명할 수 있는 탄탄한 근거로 활용하시길 바랍니다.

무료 이용 arrow

go to back
twitter share
facebook share