新用戶(hù)登錄后自動(dòng)創(chuàng )建賬號
登錄基于消費行為的用戶(hù)特征分析在網(wǎng)絡(luò )營(yíng)銷(xiāo)領(lǐng)域得到廣泛關(guān)注。大數據環(huán)境背景下,將傳統領(lǐng)域的成熟方法提煉改進(jìn)后應用于新場(chǎng)景,能夠更好地滿(mǎn)足網(wǎng)絡(luò )營(yíng)銷(xiāo)領(lǐng)域應用的需求。
本文基于數據分析對用戶(hù)特征進(jìn)行量化,采用分批迭代的方法并在此基礎上對該方法進(jìn)行拓展,通過(guò)各種指標進(jìn)行獨立和組合研究,實(shí)現用戶(hù)價(jià)值度量,使其結果能夠有效地適用于多種網(wǎng)絡(luò )營(yíng)銷(xiāo)領(lǐng)域的應用。
用戶(hù)價(jià)值度量指標概述
對用戶(hù)特征進(jìn)行分析,是為了深入了解用戶(hù),可以從用戶(hù)的人口統計特征、消費行為特征等多個(gè)角度完成。而基于消費行為的用戶(hù)特征分析廣泛應用于網(wǎng)絡(luò )營(yíng)銷(xiāo)領(lǐng)域,其主流分析思路和技術(shù)是基于數據分析的用戶(hù)特征分析?;跀祿治龅姆椒梢詫τ脩?hù)特征進(jìn)行量化,量化結果可以準確有效地指導營(yíng)銷(xiāo)領(lǐng)域的應用,這個(gè)過(guò)程可以通過(guò)度量用戶(hù)價(jià)值來(lái)實(shí)現。首先需要選取和確定衡量用戶(hù)價(jià)值的指標,常用的指標包括:
第一,用戶(hù)最近消費時(shí)間:用戶(hù)在某個(gè)周期內最近一次消費的時(shí)間。
第二,用戶(hù)消費頻率:用戶(hù)在某個(gè)周期內所消費的次數。
第三,用戶(hù)消費總金額:用戶(hù)在某個(gè)周期內消費的金額。
第四,用戶(hù)消費最高單價(jià):用戶(hù)在某個(gè)周期內消費的商品最高價(jià)格。
第五,特價(jià)商品消費比重:用戶(hù)在某個(gè)周期內消費的特價(jià)商品的金額在其消費總金額中的比重。
第六,高單價(jià)商品消費比重:用戶(hù)在某個(gè)周期內高單價(jià)商品消費數量占其消費商品總數量的比重。
用戶(hù)價(jià)值可以通過(guò)上述指標進(jìn)行單項分析,也可以組合在一起進(jìn)行綜合分析,盡可能多角度全面地度量用戶(hù)價(jià)值。本文結合應用場(chǎng)景和數據基礎,選取前三個(gè)指標進(jìn)行單項和組合研究。
用戶(hù)價(jià)值度量方法分析
(一)用戶(hù)價(jià)值度量基礎
以用戶(hù)的最近消費時(shí)間(R)、消費頻率(F)、消費總金額(M)為例,若考察單項指標,用戶(hù)的最近消費時(shí)間最短、消費頻率最高、消費總金額最大代表用戶(hù)的價(jià)值越大;若考察指標組合,需要通過(guò)確定各指標權重計算綜合值,來(lái)度量用戶(hù)的價(jià)值。對于權重的確定,以往研究多采用層次分析法,但此方法受到專(zhuān)業(yè)主觀(guān)因素的影響。吉林大學(xué)段書(shū)勇從數據出發(fā),提出通過(guò)數據分批迭代計算指標權重的方法,客觀(guān)合理度量了用戶(hù)價(jià)值。
該方法的核心思想是:
1.以消費總金額為參考標準確定最有價(jià)值用戶(hù)。將某年度第六個(gè)月的消費用戶(hù)按照消費總金額劃分為3個(gè)等級,處于最高等級的用戶(hù)為最有價(jià)值用戶(hù)。
2.計算過(guò)去某段時(shí)間內不同等級消費用戶(hù)占最有價(jià)值用戶(hù)的比例。將某年度前五個(gè)月的消費用戶(hù)按照消費金額分為7個(gè)等級,對每個(gè)等級用戶(hù)再按消費頻率分為7個(gè)等級,這樣前五個(gè)月消費用戶(hù)被分為49個(gè)等級。計算最有價(jià)值用戶(hù)在49個(gè)等級中的比例。按照此方法確定最近消費時(shí)間、消費頻率和消費總金額對最有價(jià)值用戶(hù)的影響程度。
3.依據最近消費時(shí)間、消費頻率和消費總金額對最有價(jià)值用戶(hù)的影響程度。采用數據分批迭代方法計算指標權重a、b、c,再根據公式計算用戶(hù)價(jià)值:RFM_SCORE=a×R_SCORE+b×F_SCORE+c×M_SCORE。其中,RFM_SCORE為用戶(hù)價(jià)值;R_SCORE、F_SCORE、M_SCORE為用戶(hù)在最近消費時(shí)間、消費頻率和消費總金額指標上的等級;a、b、c為指標權重。
本文關(guān)于用戶(hù)價(jià)值的度量需要結合實(shí)際場(chǎng)景和應用,才能有效和準確的對用戶(hù)價(jià)值度量,需要在借鑒該方法的基礎上進(jìn)行拓展,包括:第一,定義多個(gè)角度的最有價(jià)值用戶(hù)的標準,除消費總金額外,也分別選擇消費頻率、最近消費時(shí)間以及三者組合作為標準,從不同的角度對用戶(hù)價(jià)值進(jìn)行度量。第二,面對不同類(lèi)型的商品,用戶(hù)的消費特征不同,由此產(chǎn)生的用戶(hù)價(jià)值可能不同。因此,需要針對不同類(lèi)型、不同層次商品的消費,對用戶(hù)價(jià)值進(jìn)行深入評價(jià)和度量。
(二)用戶(hù)價(jià)值度量路徑
1.定義最有價(jià)值用戶(hù)標準,確定最有價(jià)值用戶(hù)群。
確定最有價(jià)值用戶(hù)群,要對指標數據進(jìn)行離散化,有兩種方式:
第一,獨立式離散化。按照最近消費時(shí)間(R_14) 對用戶(hù)進(jìn)行降序排列并按數量進(jìn)行等分,比如等分為3份。對于消費頻率(F_14)和消費總金額(M_14)兩個(gè)指標也分別采用降序排列和等分的方法將用戶(hù)等分,這樣可以得到在最近消費時(shí)間(R_14)、消費頻率(F_14)和消費總金額(M_14)指標下的用戶(hù)等級。
第二,嵌套式離散化。先按照最近消費時(shí)間(R_14)將用戶(hù)等分為3份;在此基礎上,對3份用戶(hù)中的每1份用戶(hù)按照消費頻率(F_14)再劃分為3份,得到9份用戶(hù)集合;在此基礎上,對9份用戶(hù)中的每1份用戶(hù)再按消費總金額(M_14)劃分為3份,最終得到27份用戶(hù)集合。
在本文中采用獨立式離散化方法,選取2014年1月某網(wǎng)站用戶(hù)群A的消費數據,按照最近消費時(shí)間(R_14)、消費頻率(F_14)和消費總金額(M_14)指標對用戶(hù)群A數據分別進(jìn)行離散化(得分分別用R_14_SCORE、F_14_SCORE、M_14_SCORE表示),將用戶(hù)劃分為“高”、“中”、“低”三個(gè)級別,用“3”、 “2”、 “1”標注。
數據離散化完成后,針對用戶(hù)群A,分別選擇最近消費時(shí)間(R_14)、消費頻率(F_14)和消費總金額(M_14)作為參考標準,定義最有價(jià)值用戶(hù)群*_MVU_A(依據參考標準不同,*代表R_14、F_14、M_14、RFM_14),如表1所示。
當以R_14作為參考標準,最有價(jià)值用戶(hù)群R_14_MVU_A為R_14_SCORE取值為“3”對應的用戶(hù)集合,即用戶(hù)群A中最近消費時(shí)間等級為3的用戶(hù)集合。
當以F_14作為參考標準,最有價(jià)值用戶(hù)群F_14_MVU_A為F_14_SCORE取值為“3”對應的用戶(hù)集合,即用戶(hù)群A中消費頻率等級為3的用戶(hù)集合。
當以M _14作為參考標準,最有價(jià)值用戶(hù)群M _14_MVU_A為M _14_SCORE取值為“3”對應的用戶(hù)集合,即用戶(hù)群A中消費總金額等級為3的用戶(hù)集合。
當以RFM_14作為參考標準,最有價(jià)值用戶(hù)群RFM_14_MVU_A為R_14_SCORE、 F_14_SCORE、 M_14_SCORE至少兩項取值為“3”對應的用戶(hù)集合,指的是:
{R_14_SCORE=3,F_14_SCORE=1,M_14_SCORE=3}{R_14_SCORE=3,F_14_SCORE=2,M_14_SCORE=3}、{R_14_SCORE=3,F_14_SCORE=3,M_14_SCORE=3}、{R_14_SCORE=2,F_14_SCORE=3,M_14_SCORE=3}、{R_14_SCORE=1,F_14_SCORE=3,M_14_SCORE=3}、{R_14_SCORE=3,F_14_SCORE=3,M_14_SCORE=1}、{R_14_SCORE=3,F_14_SCORE=3,M_14_SCORE=2}對應的用戶(hù)集合。
即用戶(hù)群A中滿(mǎn)足消費時(shí)間、消費頻率、消費總金額中有兩項等級為3的用戶(hù)集合;或用戶(hù)群A中消費時(shí)間、消費頻率、消費總金額中等級均為3的用戶(hù)集合。
2.確定用戶(hù)在最有價(jià)值用戶(hù)群中的比例。選取2013年1月-12月某網(wǎng)站用戶(hù)群B的消費數據,按照最近消費時(shí)間(R_13)、消費頻率(F_13)和消費總金額(M_13)指標分別對用戶(hù)群B進(jìn)行離散化(得分分別用R_13_SCORE、F_13_SCORE、M_13_SCORE表示),將用戶(hù)劃分為“高”、“中”、“低”三個(gè)級別,分別用“3”、“2”、“1”標注。對用戶(hù)群B,分別按照最近消費時(shí)間(R_13)、消費頻率(F_13)、消費金額(M_13)劃分的3個(gè)等級,計算處于不同等級的用戶(hù)群B中的用戶(hù)在最有價(jià)值用戶(hù)群*_MVU_A中出現的人數(#_Ct_BMA)占用戶(hù)群B人數(#_Ct_B)的比例(#_Res_Rate)。以最近消費時(shí)間(R_14)作為標準劃分的最佳用戶(hù)群R_14_MVU_A進(jìn)行#_Res_Rate計算為例(依據劃分標準不同,#_代表R、F、M),計算要素如表2所示(其他參考標準的最有價(jià)值用戶(hù)群的#_Res_Rate計算,同理)。
3.確定各指標對最有價(jià)值用戶(hù)的影響程度。在表2中,對各等級的R_Res_Rate、F_Res_Rate、M_Res_Rate進(jìn)行降序排列,等級為3的R_Res_Rate、F_Res_Rate、M_Res_Rate排列結果反映了R、F、M對最有價(jià)值用戶(hù)的影響程度。
4.確定指標權重,按照公式RFM_SCORE=a×R_SCORE+b×F_SCORE+c×M_SCORE計算用戶(hù)綜合價(jià)值。假定由(3)得到F_Res_Rate>R_Res_Rate>M_Res_Rate,按照RFM_SCORE=a×R_SCORE+b×F_SCORE+c×M_SCORE計算用戶(hù)綜合價(jià)值的方法步驟如下:
第一,將R_SCORE、F_SCORE、M_SCORE標準化。第二,計算a、b、c權重值。根據假定F_Res_Rate>R_Res_Rate>M_Res_Rate,得到b>a>c,并且a+b+c=1。那么,滿(mǎn)足這兩個(gè)條件的權重組合有:{a=0.2,b=0.7,c=0.1}{a=0.3,b=0.6,c=0.1}{a=0.4,b=0.5,c=0.1}{a=0.3,b=0.5,c=0.2}。第三,假定選擇最近消費時(shí)間(R_14)作為參考標準,找到同時(shí)出現在最有價(jià)值用戶(hù)群R_14_MVU_A和用戶(hù)群B中的用戶(hù),應用第二步中的四組權重,計算RFM_SCORE,其結果按照[0,0.25)、[0.25,0.5)、[0.5,0.75)、[0.75,1]分成4組。其中,[0.75,1]對應的用戶(hù)群人數記為Ct_RFM_MVU_A。第四,應用第二步中的四組權重計算用戶(hù)群B的RFM_SCORE,按照[0,0.25)、[0.25,0.5)、[0.5,0.75)、 [0.75,1]分成4組。其中,[0.75,1]對應的用戶(hù)群人數記為Ct_RFM_MVU_B。第五,計算W_Rate=Ct_RFM_MVU_A/ Ct_RFM_MVU_B,最高值對應的權重組合為最佳權重。第六,按照公式RFM_SCORE=a×R_SCORE+b×F_SCORE+c×M_SCORE計算用戶(hù)綜合價(jià)值。
5.針對不同類(lèi)型和層次的商品進(jìn)行用戶(hù)價(jià)值計算。將商品分類(lèi),針對不同類(lèi)型和層次商品對應的用戶(hù)集重復上述步驟,計算參考商品類(lèi)別劃分的用戶(hù)價(jià)值。
用戶(hù)價(jià)值度量實(shí)驗
(一)實(shí)驗數據說(shuō)明
根據用戶(hù)價(jià)值度量思路,選取某網(wǎng)站2014年1月用戶(hù)數據作為用戶(hù)群A,選取2013年1月-12月用戶(hù)數據作為用戶(hù)群B。結合商品分類(lèi),其對應的用戶(hù)群記錄數如表3所示。
(二)實(shí)驗結果與分析
1.基于不同最有價(jià)值用戶(hù)群針對單一類(lèi)型商品的指標權重定義分析。本實(shí)驗選擇“日用百貨”類(lèi)商品消費對應的用戶(hù)進(jìn)行價(jià)值度量分析。依據度量思路,呈現其中兩個(gè)重要的結果:
一是計算Res_Rate。參照最有價(jià)值用戶(hù)群,計算Res_Rate,根據其結果判斷權重值a、b、c的大小關(guān)系。針對用戶(hù)群A,在商品分類(lèi)情況下,以最近消費時(shí)間(R_14)做參考標準為例,確定最有價(jià)值用戶(hù)群R_14_MVU_A。針對用戶(hù)群B,按最近消費時(shí)間(R_13)、消費頻率(F_13)、消費總金額(M_13)計算R_Res_Rate、F_Res_Rate、M_Res_Rate。
從表4中得到:
等級3:F_Res_Rate(0.029)>R_Res_Rate(0.028)>M_Res_Rate(0.024)
等級2:F_Res_Rate(0.013)>R_Res_Rate(0.012)=M_Res_Rate(0.012)
等級1:M_Res_Rate(0.010)>F_Res_Rate(0.009)>R_Res_Rate(0.006)
選擇等級為3的結果作為判斷權重大小的標準,進(jìn)而得到權重b>a>c,并且a+b+c=1,a、b、c取值步長(cháng)定義為0.1。滿(mǎn)足上述條件的組合有{a=0.2,b=0.7,c=0.1}、{a=0.3,b=0.6,c=0.1}、{a=0.4,b=0.5,c=0.1}、{a=0.3,b=0.5,c=0.2}。
二是計算a、b、c權重值。以最近消費時(shí)間(R_14)作為參考標準,找到同時(shí)出現在最有價(jià)值用戶(hù)群R_14_MVU_A和用戶(hù)群B中的用戶(hù),分別應用四組權重組合{a=0.2,b=0.7,c=0.1}、{a=0.3,b=0.6,c=0.1}、{a=0.4,b=0.5,c=0.1}、{a=0.3,b=0.5,c=0.2},計算RFM_SCORE,其結果按照[0,0.25)、[0.25,0.5)、[0.5,0.75)、[0.75,1]分成4組。其中,[0.75,1]對應的用戶(hù)群人數記為Ct_RFM_MVU_A。
接下來(lái),應用四組權重組合{a=0.2,b=0.7,c=0.1}、{a=0.3,b=0.6,c=0.1}、{a=0.4,b=0.5,c=0.1}、{a=0.3,b=0.5,c=0.2},計算用戶(hù)群B的RFM_SCORE,按照[0,0.25)、[0.25,0.5)、[0.5,0.75)、 [0.75,1]分成4組。其中,[0.75,1]對應的用戶(hù)群人數記為Ct_RFM_MVU_B。
計算W_Rate=Ct_RFM_MVU_A/ Ct_RFM_MVU_B,最高值對應的權重組合為最佳權重,結果如表5所示。在表5中,從依據四組權重計算W_Rate的結果看到,{a=0.4,b=0.5,c=0.1}和{a=0.3,b=0.5,c=0.2}對應的W_Rate(0.032)相等并且大于{a=0.2,b=0.7,c=0.1}、{a=0.3,b=0.6,c=0.1}對應的W_Rate。因此,以{a=0.4,b=0.5,c=0.1}和{a=0.3,b=0.5,c=0.2}兩組平均值{a=0.35,b=0.5,c=0.15}作為最佳權重進(jìn)行用戶(hù)價(jià)值的度量。
(三)基于不同最有價(jià)值用戶(hù)群針對不同類(lèi)型商品的權重綜合比較分析
本實(shí)驗分別按照最近消費時(shí)間、消費頻率、消費金額及三項綜合指標定義最有價(jià)值用戶(hù)群,針對不分類(lèi)商品和分類(lèi)后的4類(lèi)商品按照用戶(hù)價(jià)值度量思路,進(jìn)行a、b、c權重計算,對權重進(jìn)行綜合分析和比較,結果如表6所示。得到如下結論:
第一,無(wú)論是在商品分類(lèi)還是不分類(lèi)情況下,針對不同類(lèi)型的最有價(jià)值用戶(hù)群,消費金額對最有價(jià)值用戶(hù)群的影響是最弱的。在20組權重比較結果中,有14組最近消費時(shí)間對最有價(jià)值用戶(hù)群的影響最大,消費頻率的影響次之。
第二,在商品不分類(lèi)的情況下,針對不同類(lèi)型最有價(jià)值用戶(hù)群,各指標的影響程度是一致的,即最近消費時(shí)間影響最大;消費頻率次之;消費金額最弱。
第三,在商品分類(lèi)的情況下表現出如下特征:
一是針對不同類(lèi)型最有價(jià)值用戶(hù)群,面向“電腦整機”和“家用電器”兩類(lèi)商品的8組權重比較中,影響力排名第一的是最近消費時(shí)間;有7組顯示影響力排名第二的是消費頻率,只有1組消費金額影響力第二;有2組消費頻率和消費金額的影響力相同。
二是針對不同類(lèi)型最有價(jià)值用戶(hù)群,面向“日用百貨”和“手機數碼”兩類(lèi)商品的8組權重比較中,有7組影響力排名第一的是消費頻率;有6組顯示影響力排名第二的是最近消費時(shí)間。
結論
用戶(hù)價(jià)值度量滿(mǎn)足了網(wǎng)絡(luò )營(yíng)銷(xiāo)領(lǐng)域對基于消費行為的用戶(hù)特征量化的需求。本文基于數據分析的方法對用戶(hù)特征進(jìn)行量化,先用定性方式確定最近消費時(shí)間、消費頻率和消費總金額對用戶(hù)價(jià)值的影響程度;再用數據分批迭代的定量方式確定三個(gè)指標的權重值。并在此基礎上對其進(jìn)行拓展,選擇不同最有價(jià)值用戶(hù)群作為參考標準,結合商品分類(lèi),從多個(gè)角度和層次對用戶(hù)價(jià)值進(jìn)行度量,以得到最佳度量結果,使其結果能夠有效的適用于多種網(wǎng)絡(luò )營(yíng)銷(xiāo)領(lǐng)域的應用。
*本文轉載自199IT互聯(lián)網(wǎng)數據中心(ID:i199it)。