카테고리 없음

전처리방안고민_2026.04.15(수)

nom_de_plume 2026. 4. 15. 21:06

참여 = 적립 = 리포트 필드
adv_price = rpt_time_scost = rpt_time_scost
contract_price = rpt_time_acost = rpt_time_acost
media_price = rpt_time_earn = rpt_time_earn
reward_price = rpt_time_cost = rpt_time_cost

 

 

### df_list -- IVE_광고목록.xlsx
- ads_order(광고 순서):
    - 5분마다 바뀐다고 봐도 무방합니다. 바뀔 수 있는 경우는 아래와 같습니다.
        - 관리자가 수동으로 변경하는 경우도 많음. 참여가 쉬워보이거나 광고주 요청으로 인해서 위로
        - 소진량 추이에 따라서 같은 ads_type이나  ads_category 중에서 소진량이 낮은게 위로 올라가는 경우도 있음. 특정 기간까지 광고소진을 해야하는 경우.
        - 소진잘되는 광고인지 특정 광고주의 광고인지 판단해서 올리는 경우
        - 여러제휴사에서 요청이 들어오는 광고의 경우 올림
    - 숫자가 높을수록 상위 노출
    - 같은 광고에 상관없이 새 ads_order 발생 가능..?
    => 컨트롤 불가..
- ads_category(광고 카테고리):
    - 9: 데이터 설명 누락
    => 제거..?
- ads_type(광고 구분):
    - 대부분 광고가 1,2,3에 몰려있어서 기존에 네이버, 페이스북으로 들어오던 경우도 참여형(3)으로 세팅되거나 제휴사에서 참여형으로 들어오는 경우들이 많아졌습니다. 이는 특정타입에서도 미션이 너무 다양해져서 참여형으로 들어오는듯 합니다. 그래서 참여형으로 너무 많은 광고가 들어와서 새로운 기준이 필요해서 카테고리가 추가되었습니다.
    - 지금은 ads_type 인스타로 등록되는 경우는 거의 없고 참여형으로 등록되고 있음. 인스타 광고인지 구분하려면 **광고참여방법**이나 **제목 텍스트 값**을 가지고 분석해야함.
    => ads_name(광고명), ads_summary(광고 요약 설명) 으로 인스타 광고인지 구분 가능할지도
- regdate(등록일):
    - 해당 광고가 등록된 날짜
    - 실제 광고가 노출되는 날짜는 ads_sdate, ads_edate값으로 다를 수 있습니다. 미래의 광고를 미리 등록해두기 때문
    => ads_sdate - regdate, ads_edate - regdate, ads_edate - ads_sdate 비교 해보면 좋을 듯
- ads_name(광고명):
    - 힘합퍼 회원가입, 힙합퍼(회원가입) 같이 유사한 값 확인
    => 다른 컬럼값들을 비교했을때 유사도 확인 필요 -> 유사하다면 합친다?

 

 

### df_participation -- IVE_광고참여정보.xlsx
- dvc_idx(디바이스키)
    - 0은 결측치가 아니다
        - 유저가 앱에서 참여한게 아니라 웹에서 참여하여 값이 없는 경우
    => 0 자체로 의미 보유. 지우면 안될 듯
- network(MOBILE/WIFI)
    -  wifi/mobile 또는 wifi(1)/mobile(2)로 수집되는 듯
    - 나머지 0이나 다른 값들은 무시해도 될 듯
        - 0, WIFI, MOBILE, LTE, 2
    => 0, LTE, 2 drop 고려- 보통 광고참여를 한 유저는 dvc_idx를 기준으로 성별,나이, 간혹(관심사태그)가 있는것이 일반적입니다. ( 가능하면 추가로 작성해서 제공하겠지만, device_id를 기준으로 랜덤 생성하셔도 좋을 듯 합니다. )
    => 더미 데이터 생성?

 

 

### df_earn -- IVE_광고적립.xlsx### df_report -- IVE_시간별_적립_보고서.xlsx
- rpt_time_scost   ‘광고주 보여주기금액‘, 700 (광고대행사가 받을돈)
    - rpt_time_scost = show_cost
- rpt_time_acost ‘광고 소진금액‘, 500 (아이브가 받을돈) <------------------- 아이브가 받을돈
    - rpt_time_acost = adv_cost
- rpt_time_earn  ‘매체사 수익금액‘, 400 (아이브가 매체사한태 줘야할 금액) <- 아이브가 줄돈
    - rpt_time_earn = earn_cost
- rpt_time_cost ‘유저 리워드지급금액’, 매체사가 정한비율대로 유저에게 지급리포트 = 적립
    - rpt_time_cost = rwd_cost
    => 컬럼명 테이블 달라도 통일시키면 편할듯- 매체수익금액에서 일부를 매체가 유저에게 주는 구조 입니다. 유저지급금액은 매체수익금액에 포함
    => earn_cost(매체사 단가) 안에 rwd_cost(유저 지급 단가) 포함되는지 확인 필요
    => 포함된다면 show_cost(광고주 단가), adv_cost(광고 단가), earn_cost(매체사 단가)를 모두 더하면 총 단가 계산 가능한가