전체 글 250

역할 분담, 모델링 및 대시보드 논의_2026.04.27(월)

📌 회의록 내용: 최종 프로젝트 역할 분담, 모델링 및 대시보드 구성 논의 1. 회의 정보일시: 2026년 4월 27일 오후 7:30주제: 최종 프로젝트 역할 분담, 모델링 및 대시보드 구성 논의2. 제연 튜터님 주요 조언2-1. 모델링 파트 조언모델링을 담당하는 팀원은 먼저 “어떤 모델을 만들 것인지”보다, 모델의 입력값과 출력값을 명확히 정의한 기획서를 작성하기로 하였다.기획서에는 다음 내용이 포함되어야 한다.모델의 목적모델에 들어가는 입력 컬럼모델이 예측하거나 분류해야 하는 출력값예측 결과를 운영에서 어떻게 활용할 수 있는지예를 들어, 특정 광고의 예상 소진율, 예상 완료율, 광고 품질 점수 등을 출력값으로 설정할 수 있다.입력과 출력이 정리되면, 이후 튜터님과 함께 회귀 모델, CatBoost ..

카테고리 없음 2026.04.27

분석 정리 및 계획_26.04.24(금)

0424 회의록 주제 : 주말 간 분석 진행 방향 정리주요 내용 1. mdx_idx = 980 추가 탐색- mdx_idx = 980은 마진이 특이하게 높게 나온 매체번호로 확인됨.- 주말 동안 추가로 탐색하되, 프로젝트 전체 흐름에서 벗어나지 않는 선에서 진행하기로 함.- 980을 별도 주제로 과도하게 확장하기보다는, 전체 분석 결과에 영향을 주는 특이 세그먼트인지 확인하는 방향으로 접근함 .2. 광고타입 중심 분석- 현재 프로젝트 방향상 최종 분석의 중심은 매체번호보다 광고타입이 될 가능성이 높음.- 광고타입별 성과 차이, 완료율, 마진 구조 등을 추가로 확인하기로 함.- 추후 BERT Topic 결과가 완료되면 광고타입 분류에 다시 반영할 예정임.- 세부 수치는 달라질 수 있으나, 전체적인 그래프 ..

카테고리 없음 2026.04.24

전처리 재정립 및 eda_2026.04.23(목)

[회의록]일시: 2026-04-23 오전 9:51회의 목적: 분석 진행상황 점검, 역할 분담 확인, 제출 일정 정리4월 22일자 EDA 정리DAU 추이에서 2025-08-09, 2025-08-20 두 번의 주요 spike가 확인됨2025-08-09는 신규 유저 비중이 높아 신규 획득 중심 spike로 해석함2025-08-20은 기존 유저 비중이 높아 복귀 유저 재활성화 중심 spike로 해석함2025-08-09 spike는 특정 광고 매체에 유입이 집중되었을 가능성이 높다고 판단함다만 2025-08-09 유입 유저의 이후 방문 패턴을 보면 1회 방문 비중이 매우 높아, 유입 규모 대비 유지력은 낮을 수 있다고 봄요일별 평균 DAU는 금요일·토요일이 높고 월요일이 낮아, 날짜 성과 해석 시 요일 효과를 보..

카테고리 없음 2026.04.23

전처리 기준 확립_2026.04.21(화)

[회의록]일시: 2026-04-21 오전 10:20 ~ 오후 20:00회의 주제: 전처리 기준 확정 및 EDA 진입 전 정리 오늘 진행 방향각자 맡은 테이블 전처리를 마무리한다.전처리 완료 후 바로 EDA로 넘어가기보다, 한 번 더 점검과 피드백을 거친 뒤 진행한다.이후 분석에 필요한 컬럼이 추가로 생기면, 목적에 맞춰 분석 테이블을 보완하는 방식으로 진행한다.기준 날짜 사용 원칙click_date는 클릭 수, DAU, 재방문 등 행동 관찰 지표 기준으로 사용한다.regdate는 완료 수, 적립 시점, 완료 기준 성과, 마진 발생 시점 기준으로 사용한다.같은 테이블 안에 두 날짜가 함께 있더라도, 해석 기준은 분리해서 사용한다.재무 테이블 전처리 방향재무 테이블에서는 click_date와 regdate ..

카테고리 없음 2026.04.21

분석 테이블 선정_2026.04.17(금)

회의 일시 - 오전 9:31 2026-04-17 ~ 회의 주제 - 분석용 테이블 설계 방향 정리 - 퍼널 분석 중심축 확정 - 테이블별 1행 기준과 조인 기준 정리 - 운영/성과/행동/재무 분석 구조 분리 현재 상태 - 아직 분석용 테이블은 실제로 만들지 않았음. - 현재 단계는 어떤 테이블을 어떤 기준으로 만들지 설계·구상하는 단계임. - 따라서 지금 가장 중요한 것은 컬럼을 많이 모아 한 번에 붙이는 것이 아니라, 각 테이블의 행 기준과 조인 기준을 먼저 확정하는 것이라고 정리함. 1. 전체 방향 정리 - 기존에는 바로 최종 분석용 테이블을 만들고 그 위에서 분석하는 흐름을 생각했음. - 그러나 추가 피드백을 반영한 결과, 현재 데이터는 테이블마다 1행의 의미가 다르기 때문에 처음부터 하나의 큰..

카테고리 없음 2026.04.17

분석 테이블 선정 고민_2026.04.16(목)

메인 퍼널 분석 테이블 (행동 지표)(클릭/적립 1건 = 1행)클릭수완료 수완료시간광고 타입별 전환율보상금별 전환율=============click_key (클릭키)ads_idx (광고번호)dvc_idx (참여 기기 고유번호)mda_idx (광고를 소비한 매체 번호)click_date (클릭 일시)click_time (클릭 시간)regdate (광고 참여 완료 일시)ctit ((지급-클릭) 지연시간(초))ads_type (1.설치형, 2.실행형, ...)ads_category (광고 카테고리)ads_reward_price (유저에게 준 리워드 금액)ads_rejoin_type (재참여 가능 타입) CVR (전체 전환율) = (rpt_time_turn (전환수) / rpt_time_turn (클릭수)) *..

카테고리 없음 2026.04.16

전처리방안고민_2026.04.15(수)

참여 = 적립 = 리포트 필드adv_price = rpt_time_scost = rpt_time_scostcontract_price = rpt_time_acost = rpt_time_acostmedia_price = rpt_time_earn = rpt_time_earnreward_price = rpt_time_cost = rpt_time_cost ### df_list -- IVE_광고목록.xlsx- ads_order(광고 순서): - 5분마다 바뀐다고 봐도 무방합니다. 바뀔 수 있는 경우는 아래와 같습니다. - 관리자가 수동으로 변경하는 경우도 많음. 참여가 쉬워보이거나 광고주 요청으로 인해서 위로 - 소진량 추이에 따라서 같은 ads_type이나 ads_category..

카테고리 없음 2026.04.15

SQL 알고리즘 코드카타(있었는데요 없었습니다) 26.04.14(화)

1. 문제 링크:https://school.programmers.co.kr/learn/courses/30/lessons/590432. 정답 코드: select ai.animal_id, ai.namefrom animal_ins as aijoin animal_outs as ao on ai.animal_id = ao.animal_idwhere ai.datetime > ao.datetimeorder by ai.datetime asc;3. 오류 상황:select ai.animal_id, ai.namefrom animal_ins as aijoin animal_outs as ao on ai.animal_id = ao.animal_idwhere ai.datetime => 부등호 방향 오..

SQL 알고리즘 코드카타(카테고리 별 도서 판매량 집계하기) 26.04.14(화)

1. 문제 링크:https://school.programmers.co.kr/learn/courses/30/lessons/1448552. 정답 코드: select b.category, sum(bs.sales) as total_salesfrom book as bjoin book_sales as bs on b.book_id = bs.book_idwhere bs.sales_date like '2022-01%'group by b.categoryorder by b.category asc;3. 오류 상황:SELECT b.category, count(bs.sales) as total_salesfrom book as binner join book_sales as bs on b.book_..