역할 분담, 모델링 및 대시보드 논의

카테고리 없음

역할 분담, 모델링 및 대시보드 논의_2026.04.27(월)

nom_de_plume 2026. 4. 27. 22:25

📌 회의록 내용: 최종 프로젝트 역할 분담, 모델링 및 대시보드 구성 논의

1. 회의 정보

일시: 2026년 4월 27일 오후 7:30
주제: 최종 프로젝트 역할 분담, 모델링 및 대시보드 구성 논의

2. 제연 튜터님 주요 조언

2-1. 모델링 파트 조언

모델링을 담당하는 팀원은 먼저 “어떤 모델을 만들 것인지”보다, 모델의 입력값과 출력값을 명확히 정의한 기획서를 작성하기로 하였다.

기획서에는 다음 내용이 포함되어야 한다.

모델의 목적
모델에 들어가는 입력 컬럼
모델이 예측하거나 분류해야 하는 출력값
예측 결과를 운영에서 어떻게 활용할 수 있는지

예를 들어, 특정 광고의 예상 소진율, 예상 완료율, 광고 품질 점수 등을 출력값으로 설정할 수 있다.

입력과 출력이 정리되면, 이후 튜터님과 함께 회귀 모델, CatBoost 등 적절한 모델을 선정하기로 하였다.

2-2. 대시보드 파트 조언

대시보드 파트는 먼저 와이어프레임을 만들고, 어떤 지표와 화면이 필요한지 구체화하기로 하였다.

튜터님은 Streamlit 화면을 구현하는 방식과 Claude Code를 활용하는 방법을 시연해줄 예정이라고 하였다.

따라서 어떤 화면에서 어떤 판단을 할 수 있는지 먼저 정리한 뒤 개발에 들어가기로 하였다.

3. 역할 분담

현재 기준으로 역할은 다음과 같이 나누기로 하였다.

모델링: 관후
Streamlit 대시보드: 규리, 재민
EDA 및 통계: 혜림, 상원

모델링은 여러 명이 동시에 진행하기보다는 한 명이 중심을 잡고 진행하는 것이 효율적이라고 판단하였다.

EDA와 통계는 두 명이 함께 진행하면 속도를 낼 수 있으므로, 이후 여유가 생기면 Tableau까지 확장할 수 있을지 검토하기로 하였다.

4. Tableau 진행 여부

초기 계획은 EDA/통계, Streamlit, 모델링을 중심으로 진행하는 것이었다.

다만 일정에 여유가 있다면 Tableau까지 추가해보자는 의견이 있었다.

그러나 Tableau를 처음 사용하는 팀원도 있기 때문에, 5월 4일 이후에 시작하기보다는 조금 더 일찍 판단하는 것이 좋다는 의견이 나왔다.

이에 따라 금요일에 진행 상황을 다시 확인하고, EDA/통계와 Streamlit 준비가 어느 정도 진척되었다면 주말부터 Tableau 작업을 시작할지 결정하기로 하였다.

5. EDA 및 통계 분석 방향

5-1. 분석 축에 대한 논의

현재 프로젝트의 분석 축은 크게 다음 세 가지로 나누어 생각하고 있다.

광고 축
유저 축
시간 축

광고 성과 최적화를 위해 위 세 가지 축을 기준으로 분석을 진행하는 방향은 적절하다고 보았다.

다만 수익성 분석을 별도의 축으로 분리할지, 광고 축과 시간 축 안에 나누어 포함할지에 대한 논의가 있었다.

수익은 광고 성과와 시간대 운영 모두에 연결될 수 있으므로, 하나의 독립 파트로 분리해도 되고 각 분석 축에 나누어 포함해도 된다는 의견이 나왔다.

최종적으로는 수익성이 운영 관점에서 중요한 지표이기 때문에, 초반 문제정의에서 수익성과 관련된 핵심 질문을 명확히 제시하고, 이후 광고/시간/유저 분석과 자연스럽게 연결하는 방향이 적절하다고 정리하였다.

5-2. 핵심 질문 설정 필요성

좋은 분석이 되기 위해서는 단순히 여러 그래프를 나열하는 방식이 아니라, 초반에 핵심 질문을 명확히 설정해야 한다는 의견이 있었다. 수익성에 대한 부분도 핵심 질문으로 던지고 답해나가는 과정으로 진행을 고려.

예상 핵심 질문은 다음과 같이 정리할 수 있다.

어떤 광고가 실제로 성과가 좋은 광고인가?
광고 성과는 광고 자체의 특성 때문인가, 특정 매체나 시간대의 영향 때문인가?
수익성과 완료율이 동시에 좋은 광고는 무엇인가?
특정 광고나 매체에 성과가 과도하게 집중되어 있는가?
운영팀은 어떤 광고를 우선적으로 노출하거나 관리해야 하는가?

EDA와 통계는 위 질문에 대한 근거를 찾는 방식으로 진행하기로 하였다.

5-3. 통계 분석에 대한 의견

통계 분석은 EDA보다 직관적인 인사이트가 바로 드러나지는 않지만, EDA에서 발견한 패턴이 실제로 의미 있는 차이인지 검증하는 역할을 한다고 보았다.

따라서 EDA를 먼저 진행하고, 그 결과를 바탕으로 필요한 부분에 통계 검정을 붙이는 방식이 적절하다고 판단하였다.

EDA와 통계는 이번 주까지 어느 정도 마무리하는 것을 목표로 한다.

6. 모델링 아이디어 논의

6-1. 시계열 및 딥러닝 검토

시계열 딥러닝도 고려했지만, 현재 주요 분석 데이터가 한 달치에 가깝기 때문에 딥러닝 모델로 충분한 성능을 내기에는 데이터가 부족할 수 있다는 의견이 있었다.

다만 1년치 시간대별 리포트 데이터를 활용하면 시계열 관점의 분석이나 간단한 예측 모델은 검토할 수 있을 것으로 보았다.

6-2. 모델링 후보 아이디어

논의된 모델링 후보는 다음과 같으며, 주요한 후보는 예측 모델(혹은 광고품질점수화 모델)과 클러스터링 모델 2개로 좁혀졌다.

광고 성과 예측 모델
- 광고 유형, 카테고리, 보상 단가, 시간대 등의 정보를 활용하여 완료율이나 성과를 예측하는 모델
광고 품질 점수화 모델
- 완료율, 재참여 가능성, 마진 등을 종합하여 광고별 품질 점수를 산출하는 방식
- 점수가 높은 광고를 우선 노출하거나 운영 관리 대상으로 삼을 수 있음
예상 소진율 예측 모델
- 광고 예산 또는 성과가 빠르게 소진될 가능성을 예측하는 모델
- 운영팀이 예산 관리나 노출 조정에 활용할 수 있음
클러스터링
- 유저 또는 광고를 비슷한 특성끼리 묶어 세그먼트를 도출하는 방식
- 예측 모델보다 비중은 작게 가져가되, 보조 분석으로 활용 가능
광고 문구 기반 성과 예측
- 광고 문구가 전환율 예측에 기여하는지 확인하는 방향
- 다만 유형별로 성과 구조가 다를 수 있으므로, 게임형/참여형 등으로 유형을 나누어 보는 것이 필요함

6-3. BERT Topic의 위치

BERT Topic은 최종 머신러닝 모델이라기보다는 광고 문구나 카테고리를 정리하기 위한 전처리 또는 보조 분석 도구에 가깝다고 보았다.

따라서 머신러닝 파트에서 깊게 다루기보다는, 광고 유형 및 카테고리 정리를 위한 참고 도구 정도로 언급하는 방향이 적절하다고 판단하였다.

7. 이상치 및 어뷰징 탐지 논의

이상치 탐지는 시간이 남을 경우 추가로 진행하는 방향으로 논의하였다.

EDA와 통계가 충분히 마무리된다면 Tableau 대신 이상탐지 파트를 확장하는 방안도 검토할 수 있다.

다만 어뷰징을 정의하는 기준이 명확해야 한다.

단순히 클릭 수가 많다는 이유만으로 어뷰징이라고 판단하기는 어렵기 때문에, 다음과 같은 기준을 추가로 고민해야 한다.

특정 유저의 비정상적으로 높은 반복 클릭
짧은 시간 내 과도한 참여
특정 광고 또는 매체에 대한 비정상적인 집중
완료 없이 클릭만 반복되는 패턴
동일 IP 또는 동일 유저의 과도한 반복 행동

어뷰징 탐지는 운영 관점에서 차단 또는 모니터링 대상 선정에 활용될 수 있다.

다만 현재 프로젝트의 핵심 흐름에서 벗어나지 않도록 우선순위는 조정하기로 하였다.

8. 대시보드 및 AI Agent 방향

8-1. AI Agent 대상 논의

AI Agent의 주요 대상은 광고주보다 운영기획팀이 더 적절하다고 판단하였다.

광고주는 본인 광고의 성과만 확인할 가능성이 높아 화면과 기능이 제한될 수 있다.

반면 운영기획팀은 여러 광고, 매체, 시간대, 수익성, 완료율 등을 종합적으로 확인하고 의사결정을 해야 하므로 AI Agent 활용 목적과 더 잘 맞는다.

따라서 AI Agent와 대시보드는 운영기획팀을 주요 사용자로 설정하기로 하였다.

8-2. AI Agent의 역할

AI Agent는 운영팀이 자연어로 질문하면 준비된 데이터와 지표를 조회하여 요약과 판단을 제공하는 인터페이스로 정의하였다.

예상 질문 예시는 다음과 같다.

어떤 광고의 전환율이 떨어졌는가?
지금 우선 노출을 올려야 할 광고는 무엇인가?
완료율은 높은데 수익성이 낮은 광고는 무엇인가?
특정 시간대에 성과가 좋은 광고 유형은 무엇인가?
위험 신호가 있는 광고나 매체는 무엇인가?

프로그래밍 언어에 익숙하지 않은 운영기획팀이 자연어로 질문하고, 데이터 기반 답변을 받을 수 있게 하는 것이 핵심 목적이다.

8-3. 대시보드 구성안

대시보드는 우선 핵심 기능에 집중하기로 하였다.

너무 많은 기능을 넣으면 웹 개발 중심으로 흐를 수 있으므로, 분석 결과와 운영 판단을 연결하는 화면을 우선 구성한다.

현재 논의된 대시보드 구성은 총 3개이다.

KPI 및 광고 탐색 대시보드
- 주요 KPI를 한눈에 확인
- 광고 유형별, 시간대별 성과 비교
- 필터를 활용하여 특정 조건의 광고 성과 탐색
광고 성과 예측 및 점수 관리 대시보드
- 광고별 예상 성과 또는 품질 점수 확인
- 점수에 따라 우선 관리 또는 노출 조정이 필요한 광고 파악
AI Agent 화면
- 운영자가 자연어로 질문
- 데이터 기반 요약, 인사이트, 운영 액션 제안 제공

추가 의견으로 광고주용 대시보드도 언급되었으나, 현재 우선순위는 운영기획팀 대상 대시보드로 정리하였다.

9. 시간대 기준 논의

시간대 분석을 위해 시간대를 구간화하는 방안도 논의하였다.

예시 기준은 다음과 같다.

새벽: 0시 ~ 6시
오전: 7시 ~ 11시
오후: 12시 ~ 17시
밤: 18시 ~ 23시

다만 이 기준 같이 보편적인 시간 구분으로 할 것 인지 프로젝트 내부에서 정의한 기준(출근시간/퇴근시간 등)인지 근거를 명확히 해야 한다.

10. 결정 사항

이번 회의를 통해 정리된 결정 사항은 다음과 같다.

프로젝트는 EDA/통계, 모델링, Streamlit 대시보드를 중심으로 진행한다.
Tableau는 금요일 진행 상황을 확인한 뒤 추가 여부를 결정한다.
모델링 담당자는 입력값과 출력값을 정의한 기획서를 먼저 작성한다.
대시보드 담당자는 와이어프레임(화면 설계도)과 필요한 화면 구성을 먼저 정리한다.
EDA와 통계는 이번 주까지 마무리하는 것을 목표로 한다.
AI Agent와 대시보드의 주요 대상은 광고주가 아니라 운영기획팀으로 설정한다.
대시보드는 KPI/탐색, 광고 성과 예측/점수화, AI Agent의 세 가지 화면을 우선 구성한다.
수익성은 프로젝트의 핵심 문제정의에 포함하고, 광고/시간/유저 분석과 연결한다.
이상탐지와 어뷰징 분석은 시간이 남을 경우 확장한다.

11. 후속 작업

공통

내일부터 각자 맡은 파트별로 본격적으로 작업 진행
작업 결과는 팀 내에서 공유
금요일에 진행 상황을 확인하고 Tableau 진행 여부 결정

EDA/통계 파트

현재까지 진행한 EDA 파일 정리
내일 오전까지 EDA 관련 파일 공유
광고 축, 시간 축, 유저 축에 맞춰 분석 흐름 정리
수익성과 연결되는 핵심 질문 정리
EDA 결과에서 통계 검정으로 이어질 수 있는 부분 선별
이번 주까지 EDA 및 통계 분석 마무리 목표

모델링 파트

모델링 기획서 작성
모델의 입력 컬럼과 출력값 정의
광고 성과 예측, 광고 품질 점수화, 예상 소진율 예측, 클러스터링 중 우선순위 검토
구현 가능성과 프로젝트 적합성을 기준으로 모델 후보 정리
튜터님 피드백을 받아 최종 모델 방향 결정

대시보드 파트

Streamlit 대시보드 와이어프레임 작성
KPI 화면, 광고 탐색 화면, AI Agent 화면 구성안 정리
광고 유형별/시간대별 필터 구조 검토
광고 성과 예측 또는 점수화 결과를 대시보드에 어떻게 보여줄지 기획
Claude Code 또는 Gemini API 활용 방식 검토

12. 요약

이번 회의에서는 프로젝트의 큰 방향을 EDA 및 통계/ 모델링 /대시보드로 나누고 각 파트의 역할을 구체화하였다.

특히 AI Agent와 대시보드의 주요 대상을 광고주가 아닌 운영기획팀으로 설정하면서, 프로젝트의 활용 방향이 더 명확해졌다.

EDA와 통계는 단순 시각화가 아니라 광고 성과 최적화라는 문제를 설명하는 근거로 활용하고, 모델링은 광고 성과 예측이나 품질 점수화처럼 운영 의사결정에 연결될 수 있는 방향으로 기획하기로 하였다.

대시보드는 과도한 웹 개발보다 분석 결과를 실무적으로 보여주는 데 집중하며, KPI/탐색, 광고 성과 예측/점수화, AI Agent의 세 가지 화면을 중심으로 구성하기로 하였다.

현재글역할 분담, 모델링 및 대시보드 논의_2026.04.27(월)

TIL

파이썬 #파이썬기초 #데이터분석 #데이터분석입문 #코딩입문 #코딩초보 #구글코랩 #판다스, #파이썬 #파이썬기초 #코딩입문 #코딩처음 #데이터분석 #데이터분석입문 #구글코랩 #비전공자코딩 #중학생코딩,

Today :
Yesterday :

TIL