第一篇:電子商務數據分析指標體系
電子商務數據分析指標體系
數據分析指標體系:
1、網站運營指標;
2、銷售指標;
3、營銷活動指標;
4、經營環境指標;
5、客戶價值指標;
1、網站運營指標:
流量指標:流量數據指標(PV、UV)、流量質量指標(PV/UV、銷售額/UV)、流量轉化指標(下單轉換率、成交訂單轉化率(訂單有效性)、轉換次數);
商品類目指標:商品類目結構占比、商品類目銷售額占比、類目銷售SKU集中度、庫存周轉率、商品類目的斷貨率;
供應鏈指標:壓單占比(分倉庫)、系統/實物報缺率、上架完成率/出庫及時率、出庫率、次日到達率/未到達占比;
2、銷售指標:
網站指標:下單次數、加入購物車次數、在線支付次數、購物車轉化率、下單轉化率、支付轉化率、成交轉化率;
訂單指標:訂單有效率(成交率)、訂單金額、客單價、訂單轉化率、毛利率、退換貨率、重復購買率;
3、營銷活動指標:
市場營銷活動指標:新增訪客人數、總訪問次數、訂單數量、下單轉化率、ROI;廣告投放指標:新增訪客人數、總訪問次數、訂單數量、下單轉化率、ROI;商務合作指標
4、經營環境指標:
內部購物指標:
運營指標:PV、UV、購物車轉化率、下單轉化率、成交轉化率、訂單數量、訂單金額;功能指標:支付方式、配送方式、商品數目、最短購物流程、購物體驗;
5、客戶價值指標:
客戶指標:訪客人數、訪客獲取成本、轉化率;
新顧客指標:新增客戶數量、注冊轉化率、新增顧客下單率、客單價;
老顧客指標:老顧客數量、消費頻率、最近的一次消費時間、消費金額、重復購買;
第二篇:電子商務網站核心數據分析
電子商務網站核心數據分析
電子商務相對于傳統零售業來說,最大的特點就是一切都可以通過數據化來監控和改進。通過數據可以看到用戶從哪里來、如何組織產品可以實現很好的轉化率、你投放廣告的效率如何等等問題。基于數據分析的每一點點改變,就是一點點提升你賺錢的能力,所以,電子商務網站的數據分析是很重要的一門功課。一般來說,數據分析包括:流量來源分析、流量效率分析、站內數據流分析和用戶特征分析四個部分。我們先來說說流量來源分析。
電子商務就是販賣流量的生意,低成本的流量來源是保證企業盈利的重要條件。流量來源分析主要是要明白你的用戶都是從那些網站來的,那些網站的給你帶來更多的訂單、那些網站的流量是真實的,那些是虛假等。
流量分析一般一奧分析以下內容:
網站流量來源排名:那些網站貢獻的流量多,那些貢獻的少
搜索引擎關鍵詞分析:根據關鍵詞的來源分析來查看網站產品分布和產品組合。如果關鍵詞查詢多的產品卻不是網站的主推品,可以進行適當調整。
網站流量趨勢分析:網站的流量是否均衡穩定,是不是有大幅度波動。一般來說流量突然增加的網站,如非發生突發事件,購買的廣告位作弊的嫌疑比較大。
網站流量核對:查看是否有莫名流量來源,流量來源大不大。如果莫名來源流量很大的話,有可能是您購買的CPC或者其他資源被注水了,將您的廣告鏈接分包給了點擊聯盟。
推介網站與直接訪問的比例:推介網站可以理解為外部廣告,直接訪問就是用戶直接輸入網址。一般來說,直接訪問量越大說明網站的品買知名度越高。
其次是流量效率分析
流量效率是指流量到達了網站是不是真實流量,主要分析指標如下:
到達率:到達率是指廣告從點擊到網站landingpage的比例。一般來說,達到率能達到80%以上是比較理想的流量。這個也跟網站的速度有關,綜合來分析一下。
二跳率:這個也是為了分析流量的有效性。如果是有效流量的話,一般會有合理的二跳。如果是虛假點擊的話,一般是沒有二跳的。但是也不排除有部分作假很厲害的網站能做出二跳,比如PPLIVE,當年洪成浩做投放的時候,我們的廣告直接連接到廣告專題頁,二跳是15%左右,但是PPLIVE居然有60%的二跳!最主要的是一個轉化都沒有。差點把我們的圖片圖服務器點癱瘓,這個就太過分了。
PV/IP比:一般來說,有效的流量,網站內容比較好的話,一個獨立IP大概能有3個以上的PV。如果PV/IP比能達到3以上的話,一般說明流量比較真實,網站內容也不錯。但是如果低于3的話,并不代表流量不真實,也可能是網站本身的問題。如果PV/IP過高的話,也可能有問題,比如人力重復刷新等,要謹慎對待。
訂單轉化率:這個是最最核心的數據了,沒有訂單轉化率,其他一切都是免談!某些牛B的B3C能做到4%的提袋率!某些卻僅僅是0.1%,努力吧,眾B2Cer們。站內數據流分析,主要用來分析購物流程是否順暢和產品分布是否合理,一般如下:
頁面流量排名:主要查看產品詳情頁的流量,特別是首頁陳列的產品詳情頁。參照最終的銷售比例,優勝劣汰,用以調整銷售結構。
場景轉化分析:從首頁-列表頁-詳情頁-購物車-訂單提交頁-訂單成功頁,的數據流分析。比如說,首頁到達了10000用戶,伺此后的數據分別是8000-5000-1000-50-5,購物車到訂單提交頁的相差比較大,大概就能看出來是購物車出了問題,需要改進。
頻道流量排名:各個頻道流量的排名,主要用來考慮產品組織的問題。
站內搜索分析:這個反應的是用戶關心的產品有哪些,產品調整的最直接數據。
用戶離開頁面分析:用戶在那些也頁面離開最多?是首頁還是頻道頁?是購物車還是訂單提交頁。突然的大比例的離開網站,往往預示這問題的存在。
最后是用戶特征分析:
用戶停留時間:這個放在用戶特征分析里有些牽強。而且目前監控用戶停留時間的方式是:用戶到達時間-用戶離開時間,但是用戶什么時候離開很難準確判斷,這種數據僅作參考,一般停留時間越長網站粘性越好。如果用戶停留時間超過1個小時,基本就是假流量,或者用大打開網頁忘記關了,呵呵。
新老用戶比例:老用戶比例越高,證明用戶忠誠度不錯。但是還要考慮絕對量,不能靠新用戶越來越少來襯托老用戶比例越來越高。
用戶地域分析:用戶地域與訂單地域分布基本一致,基本上就是用過互聯網用戶的分布比例以及經濟發達程度等。這個對于提升區域配送及服務比較有幫助。
電子商務網站的基本數據分析就是以上這些,作為實際操作人員要根據數據分析的情況來發現問題和總結問題,進而優化網站的結構和用戶體驗、來提升網站的專轉化率和用戶忠誠度。這些都是電子商務很重要的基礎工作,希望能為大家的利潤做出貢獻
第三篇:電子商務網站評價指標體系
電子商務網站評價指標體系
當越來越多的傳統企業觸網,其所帶來的不僅僅是平臺、機制、人才與其與傳統渠道的沖突問題,更重要的是企業應該以哪些可以量化、考核的指標來對企業的電子商務效果進行評估的問題,這是最后一公里的問題,但往往是最關鍵、最重要的問題。對于有志于開展電子商務的傳統企業而言,建設一個優秀的網上旗艦店往往是第一步,接下來才是人才、經費和機制的問題。一個優秀的網上旗艦店的評價指標體系一方面包括網站本身的一些指標,也包括一些網絡營銷的指標,建立一個有效地企業電子商務評價指標模型具有實際意義。
可以講企業電子商務評價模型分為四大塊:第一是網站本身,第二是網站流量,第三是網站的電子商務指標,第四是客戶價值指標。因為網站本身的評價指標就已經自成體系,本身就是一個很大的體系,所以本文擬從后三者的角度進行總結。
第一,在企業電子商務的過程中,網站建設好了,第一步就是要讓更多的人知道、使用,也就要一定要有流量。
通常說的網站流量(traffic)是指網站的訪問量,是用來描述訪問一個網站的用戶數量以及用戶所瀏覽的網頁數量等指標,常用的統計指標包括網站的獨立用戶數量、總用戶數量(含重復訪問者)、網頁瀏覽數量、每個用戶的頁面瀏覽數量、用戶在網站的平均停留時間等。
網站訪問統計分析的基礎是獲取網站流量的基本數據,網站流量統計指標大致可以分為三類,每類包含若干數量的統計指標,它包括網站流量指標和用戶行為指標。
1、網站流量指標
網站流量統計指標常用來對網站效果進行評價,主要指標包括:
1)、獨立訪問者數量(unique visitors);
2)、重復訪問者數量(repeat visitors)
3)、頁面瀏覽數(page views);
4)、每個訪問者的頁面瀏覽數(Page Views per user);
5)、某些文件/頁面的統計指標,如頁面顯示次數、文件下載次數。
2、用戶行為指標
用戶行為指標主要反映用戶是如何來到網站的、在網站上停留了多長時間、訪問了那些頁面等,主要的統計指標包括:
1)、用戶在網站的停留時間;
2)、用戶來源網站(也叫“引導網站”);
3)、用戶所使用的搜索引擎及其關鍵詞;
4)、在不同時段的用戶訪問量情況等。
3、用戶瀏覽網站的方式 時間 設備、瀏覽器名稱和版本、操作系統
用戶瀏覽網站的方式相關統計指標主要包括:
1)、用戶上網設備類型;
2)、用戶瀏覽器的名稱和版本;
3)、訪問者電腦分辨率顯示模式;
4)、用戶所使用的操作系統名稱和版本;
5)、用戶所在地理區域分布狀況等。
第二,對于一般的企業電子商務網站而言,僅僅有流量還是遠遠不夠的。企業電子商務最根本的目的是增加銷售額,提升品牌知名度,所有在有了一定的流量之外,更重要的就是提升
其流量轉化率,也就是將流量變現。
流量的商業價值在于其轉換率,僅僅有虛高的流量除了浪費企業的廣告和推廣費用,并不能為企業帶來真正的銷售額。盡管提升流量有助于為互聯網零售企業帶來更多的人氣,但是如何將人氣轉化為實實在在的金錢,則需要提升以下幾個和流量休戚相關的指標。
1、流量注冊比,即一定時期內,網站注冊人數占訪問量的比例。
2、提袋率。
在互聯網零售業,提袋率是指一定時期內,將商品放入購物車或加入收藏夾的顧客人數占該時間段網站訪問量的比例。網絡銷售的提袋率并不能直接反映出企業經營業績的好壞,因為將商品加入購物車里的消費者并不一定要為它們買單。
不過對于互聯網零售企業來說,提袋率的作用在于幫助企業分析哪些產品是消費者曾經感興趣卻最終放棄的,哪些產品是令消費者反復觀看卻又猶豫不決的。企業可以著重分析這些產品的特點——也許只需改進一點點,比如商品外觀設計,或者僅僅是改變一下文字描述,放到網站顯眼的地方推薦,它們就有可能竄上熱銷榜。
3、訂單轉換率,即一定時期內的訂單數占訪問量的比例。
這是反映流量商業價值最核心的指標,只有當流量轉換為訂單,企業才能收獲真金白銀。一些互聯網零售企業有可能絕口不提流量注冊比、提袋率等指標,訂單轉換率卻是所有企業都關注的數據。
4、跳出率,這是指一定時期內,僅僅在首頁匆匆“飄”過,便立即離開網站的人數占所有訪問量的比例。跳出率越高的網站,意味著流量的無效性也更高。
5、IPV。
除了和所有企業一樣關注PV(PageView)之外,淘寶還非常關注IPV(ItemPageView)。也是很多企業關注的流量指標。后者是反映商品類目關注度的一個指標,比如消費者登錄淘寶首頁后,是否再進入某些商品類目中,究竟瀏覽了哪些單個的商品——這為考核每個商品類目的銷售業績提供了數據支持。
上述指標有助于對流量的有效性做出量化的評估。但如何提高流量轉換率?你需要找到適合你的顧客,即含金量高的顧客。
第三、客戶價值評價指標
1、客戶的含金量。
而在互聯網零售領域,消費人群的含金量則是按照普通網民、注冊用戶、實名注冊用戶、經過身份認證的實名注冊用戶、具有信用體系的認證實名用戶這5個層級組成的金字塔結構依次上升的。多數互聯網零售企業的顧客位于實名注冊用戶及以上的層級,抓住這些位于金字塔上部的人群,可以令企業集中精力去維護含金量最高的那部分客戶,做到有的放矢。
2、每筆訂單平均瀏覽時間。
當網絡聯盟、門戶廣告、社區等途徑為零售網站引來人群時,用戶在網站上的瀏覽時間與網站交易量的比率顯得尤為重要,這個指標即每筆訂單平均瀏覽時間,這是尼爾森公司推薦的一個衡量互聯網零售企業發展潛力的評估指標。
3、客單價,即每個客戶平均消費金額。
這是互聯網零售企業對客戶價值的另一個考核指標。對于零售網站來說,客單價自然是越高越好。因為每筆訂單都會耗費管理成本,如果是銷售實物,每筆訂單還將耗費物流成本——如果客單價太低,企業將投入更多精力提升訂單量,同時也意味著利潤空間的降低。客
單價與企業銷售的商品相關,比如銷售襯衫的企業和銷售義烏小商品的企業的客單價顯然不一樣,因此企業在開始選品時,就得考慮客單價的問題。
客單價的另外一個參考意義是,如果企業要進入某個互聯網零售平臺,比如淘寶、易趣、拍拍等交易類網站,參考它們的客單價,可以客觀衡量自己的商品是否適合在上面銷售。目前淘寶的客單價是280元,淘寶的消費者多會接受這個價格甚至更低的商品。今年4月華倫天奴曾經進駐過淘寶的B2C平臺,但是因為客單價在500元以上,價格昂貴導致生意蕭條,3個月內僅僅成交28單,最終華倫天奴撤出了淘寶。
4、回頭客的比例,即重復購買率。
這也是一個從客戶創造價值的角度來考核互聯網零售經營狀況的重要指標。
5、新客戶開發成本。
通常的計算公式是每個新客戶成本=(廣告費+推廣費)/新增的顧客數。
以上是關于傳統企業進軍電子商務的關于其旗艦店的效果評價指標體系,尚待完善。
第四篇:電子商務B2C數據分析全流程
電子商務B2C數據分析全流程
“請舉手!如果你的用戶轉化率每天達到了5%。”如果這樣問中國所有的B2C網站。
結果是,一個舉手的人都沒有。
目前,絕大多數B2C的轉化率都在1%以下,做的最好的也只能到3.5%左右(比如以賣圖書為主的當當)
我想,所有的B2C都會關心三個問題:究竟那97%去了哪里?自己的網站在什么環節變成了漏斗,讓進來的客戶像沙子一樣一點點地流失?以及怎么檢修隱藏的漏斗,減少漏水的速度?
數據,這個時候可以是一雙眼睛,可以讓我們看得一些蛛絲馬跡。
一、分解B2C漏水的過程
大家只知道B2C的轉化率不高,但是卻不知道客戶是怎么流失的。一群用戶進來網站,他們經過首頁、中間頁、產品頁、購物車以及結算等幾個步驟,通常他們在這幾個環節是怎么分批離開的呢?其實,這不是沒有數據可查。
先給大家看一張圖。
這個數據圖,是我根據十幾年的工作經驗總結得到的,一般與實際情況相差不多。
圖一意思就是說,假定400個客戶到了你的網站,會到中間頁(包括搜索頁、分類頁、促銷頁)的只有320(60%~80%)個用戶,點擊進產品頁的只有190個用戶,最后辛辛苦苦走到購物車只有9%~13%的用戶,這個時候還不能開心,因為并不代表用這些戶會掏錢,留到最后會付錢的用戶僅僅只有3%~5%。
更叫人難以接受的是,在這最終購買的3%~5%中(未包括支付成功),最后回頭再次購買的,又要打一個大折扣。
在吐舌頭驚訝B2C生意難做之后,大家可以檢查一下自己網站的漏水數據。只有清楚了哪個環節漏水,才能補洞。
二、排查每個環節的漏洞在哪里
以下,我們按照漏水的順序,一個環節一個環節摸下去。
1、三問首頁
大部分B2C首頁有20%以上的彈出率,可能許多人對這個數字都習以為常,認為非常正常。如果做得很細致的分析的話,可能就意外的收獲。
先問第一個問題:每天來的新客戶占多少?老客戶占多少?新老客戶的彈出率分別是多少?
我看了一下麥包包的數據,麥包包用了很多流量來支持網站首頁,如果他們的彈出率很高,那也是很正常的。但是注意要問一句,新老用戶的彈出率分別多少?這個是比較容易考驗網站的基礎能力,新客戶的彈出率可以檢驗一個網站搶客戶的能力。對于老客戶來說,流程上的用戶體驗相對不是最講究,這個就很考驗Onsite Merchandising的能力,比如產品的質量和價格是否吸引人。
一般的來說,如果是一個新網站,拓展新用戶比經營老客戶更為重要的話,新老客戶的比例最好是在6比4(甚至7比3),那么首頁就要有一些手段偏向抓住新客戶。
如果,新用戶的彈出率非常高,或者是老用戶的彈出率非常高,那么網站運營者就該反思,是不是網站首頁的設計沒有照顧到新客戶或者老客戶。
做了三年的B2C網站,建議分新老用戶兩個首頁,已經在網站購買過的用戶,沒有必要再向它介紹網站,而是直接刺激他消費。
再問第二個問題,流量分幾個大渠道進來,每個渠道的彈出率情況如何?
問完了之后,接下來可能發現從百度和谷歌進來的用戶,彈出率可能差異非常大。而且今天主流B2C網站,都在費盡心思引進流量,比如凡客今天做很多促銷,許多不是從“正門”(官網首頁)進來,是“旁門”(LP促銷頁)進來,所以今天注意首頁之外,還要看一下旁門。
針對自己的主要流量渠道排查下去,很容易發現,哪條渠道在漏水。找到了痛處之后,再找到相應的解決方法就不難了。
接著再問第三個問題,首頁被點擊最多、最少的地方是否有異常情況?
在首頁,點擊次數異常的高、或者異常的低的地方,應該引起注意。
這里,在特別給大家分享一個好用的“規律”,一般來說,首頁的“E”(以E字中間的“一”為界,上部是首頁第一屏)部份是最抓用戶眼球的地方,在這個“E”上如果出現點擊次數較低的情況,就屬于異常情況,應當注意,或者干脆移到“E”外面去;同理,如果在“E”的空白處出現了點擊次數較高的情況,也可分析原因,可考慮要不要移到“E”上面來。
國內的B2C網站首頁非常長,可能許多用戶不會瀏覽到首頁底部,所以“E”最下面的“一”就往往可去掉,變成了“F”規律。
2、中間頁留客的三個技巧
先說一下美國用調查出來的現成數據,在B2C網站上的準買家,有18%的用戶有找不到需要的產品的困難,有11%的用戶找到了產品但是不自己想要的,這29%的用戶基本會漏掉。
大部分用戶進入首頁之后開始找產品,第一是看促銷,第二個看目錄,第三是用搜索工具。其中,大概有60%~70%的用戶是通過搜索+目錄的方式走到產品頁面。
同上,這三個渠道都要按照新老客戶分開去看一下離開率,這里不做贅述。這里和大家分享一下三個技巧。
技巧一:怎么判斷促銷、目錄和搜索是否成功,就看一下走到產品頁的用戶百分比是多少,哪一個渠道走得不好,就要改善。到底是怎么改進?一般來說,促銷的原因與marketing的關系大一些,目錄與采購組關聯度大一些。
例如,拿產品目錄來說,手機應該是按照品牌來分、功能分、還是按照價格來分?目錄經理需要和采購經理密切溝通,了解市場情況。曾經,我去京東,京東有個做目錄的經理問我,怎樣做好一個產品目錄?當時我說我也沒答案,這個我研究了10多年,沒有特別好的標準答案,只能是與憑借多年的市場經驗。
如果一個網站前端的東西做不好,是營銷的責任多一些。到中間頁面,可以按照目錄的轉化率查一遍,轉化率差的目錄就要注意一下。
再說搜索,一般B2C網站是由目錄經理+技術來做的。通過搜索工具找產品的用戶,自己有精確的需求,那么除了搜索技術之外(此環節與產品經理的關系非常大),還要提供符合用戶需要的產品。假想一下,如果一個用戶搜索出來的頁面只有3個產品,他肯定會判斷這個網站的東西非常少,如果還不那么符合自己要求的話,離開率幾乎是100%。
而多年做數據的經驗告訴我,一般來說,在搜索頁的第三頁至第四頁,用戶還沒有找到想要的產品,離開率就會很大。針對搜索頁離開率比較大的頁面,也有兩個分享的技巧。
技巧二:在離開率高的頁末尾,推薦給用戶另外一個搜索路徑,讓用戶換一條路找產品。
技巧三:對于那些找不到自己想要的東西的用戶,乘他們腦子是空的時候,彈出一個菜單,告訴他們10個人就有9個人買了某某產品,可能就會把他整個思維重新激活,又可能留下。
技巧三比技巧二對用戶的刺激大,但是也更冒險,如果對推薦的產品沒有足夠大的把握,用戶可能轉頭就離開了。
3、產品頁要特別留意用戶停留時間
到了產品頁,用戶留不留,與產品描述、質量有非常大的關系。所以,要特別留心客戶停留在產品頁的時間,如果許多用戶打開產品頁不到1秒鐘就走了,就要留意分析原因了。是不是這個產品沒有吸引力?是不是產品描述不準確?要多問一些問題。
另外,和傳統零售業喜歡提到的“碰撞率”相似,網站運營者應該了解哪些產品是被看了最終頁,哪些沒有被用戶點看。
4、購物車里多少產品沒有付款?
但是并沒有下單付款。
許多用戶把產品放進購物車,但是并不付款。找產品部負責人,為什么這么多用戶放在購物車里卻不付款?這對于一個B2C網站來說,是一個很嚴重的事情。
這里有三個點值得一提。
一是,許多B2C網站,等用戶要下單,提醒“請先注冊”,30%的人可能會選擇離開。這真的非常狠的一刀,從站外把用戶引進來好不容易跋山涉水到了這一步,竟然還要給用戶一刀送他離開,多少B2C網站思考過是否必要設立這一“提醒”?
二是,如果找不到用戶不付款的原因,可以直接給幾個用戶電話訪問。
三是,分析同時被放在購物車的產品之間關聯性。
總之,到了購物車,是網站自己和自己比,定性的多,定量的少。
三、B2C的顧客也有生命周期
傳統零售企業,很難知道,客戶在一段時間內購買了多少次產品、買的是什么價位,但是電子商務公司可以很清楚知道用戶的購買行為。
對于用戶規模很大的B2C來說,很有必要把用戶分為三個階段:以3個月為限(有些垂直網站要6個月至一年),只購買夠一次的用戶、一個月購買過2到8次的用戶、購買過8次以上的用戶(每個網站可以根據自己的情況定次數,這里的數據是一般的規律)。B2C網站從0到1,可以說明拉客能力。當一個客戶進來,如何做1到x(X的具體數字,垂直網站和綜合有區別,企業在不同階段,X也會變)也十分重要,不同階段的用戶的維護方法是不一樣的。今天看很多網站,從1次到3次,會有50%以上用戶就不回頭流失了,而到了5-8次以上流失率便放慢了。
如何從1做到X,還有許多可討論,只是這篇文章集中介紹的是從0到1的轉化,所以在這里就不展開了。但是有一定是非常肯定的是,大部分用戶只有第一次購物體驗非常好才
會回來重復購買。所以說,做好了從0到1,從1到X就已經成功了一半了.
第五篇:電子商務網站營銷數據分析技術探討
電子商務網站營銷數據分析技術探討
電子商務(EC)在現代商務企業的發展中占有越來越重要的地位。如何利用信息技術掌握更多的商務信息已備受商家們的關注,站點分析技術正是為商家和網站提供了這樣一種有效的分析工具。
本文討論了一些站點分析的相關技術信息和幾種網站分析瀏覽者行為的理論與算法,及數據倉庫的相關理論知識。并對站點日志數據進行了實例分析,并指出了站點分析技術發展的方向。
一、緒論
互聯網技術不斷革新與發展,給全球經濟帶來新的革命,從而也影響著人們的生活。互聯網為企業提供了一種真正屬于自己并面對廣大網民的信息載體,企業通過這一載體,可以自由地將企業的產品、服務等其他相關信息在線發布。
電子商務就是網上實行各種商務活動的總包裝,種種所謂電子商務解決方案,實際上就是實現各種網上商務活動的硬件與軟件系統。它將影響到每一個人、每一個企業。電子商務的主體是我們每一個人、每一個企業,電子商務發展的過程就是對人們的生活、企業的運行的一種模式的一個巨大改變的過程。對于進入虛擬世界的商家而言,僅僅吸引注意力還不行,對它們而言,站點的訪問率絕對不僅僅是一個數字,它還是一種信息,如果網站能夠從網絡中獲得網民的信息并從中分析其行為誘因,那么就容易掌握網民的需求,從而利用互聯網去創造更多商機。
電子商務站點用戶行為的分析這一問題也因此成為現如今的熱門話題,被人們普遍關心起來,尤其是被眾商家所重視。Web站點的日志數據正以每天數十兆的速度增長。如何分析這些數據,如何從這些大量數據中發現有用的、重要的知識(包括模式、規則、可視化結構等)也成為現在人們最關注的信息。
在此情況下,站點用戶行為分析就可為網站或商家提供出大量有價值的信息,包括站點的受歡迎度的對比、商業廣告點擊情況總括、產品的反饋信息、站點各種信息的點擊情況等等。另外,還可根據不同的頁面內容來分類瀏覽者,以便做出更合理的頁面分類,促使網站逐步向個性化、最優化狀態發展。這一技術對互聯網的發展壯大有著不可忽視的巨大作用,它的發展對信息技術亦將產生深遠的影響。
在電子商務早期階段時,Web站點數據流分析通常是在主頁上安裝計數器以及在一個
外部日志文件上運行簡單的統計程序記錄點擊率。但是,簡單的點擊計數既不準確也遠未達到營銷目的所需的詳細程度。因此,各公司開始尋找更先進的分析工具,這類工具可以提供誰在訪問公司Web站點以及訪問者一旦進入站點后將做些什么的全面信息。站點開始分析的地方是Web服務器的訪問日志。每當用戶在站點上請求一個網頁時,這個請求就被記錄在訪問日志中。如:目前有多少用戶正在訪問站點、他們正在看哪些網頁以及他們在站點中呆了多長時間。顯然,日志分析和行為概況的正確組合可以對Web站點的成功產生直接影響。此外,從日志分析中得到的信息是很難從真實世界中捕獲到的,但這些信息卻可以較容易地在線收集到。Web數據流分析工具的這些最新進展可以使網站獲得有關上網客戶和他們習慣的詳細報告。
二、站點信息統計方法
Web頁面數據主要是半結構化數據,計算機網絡技術和信息技術的飛速發展,使得半結構化數據呈現日益繁榮的趨勢。半結構化數據,是一種介于模式固定的結構化數據,和完全沒有模式的無序數據之間,在查詢前無法預先確定其具體的類型和格式;同時它們相應的數據結構是不固定、不完全或不規則的,即這些數據有的本身就沒有結構,有的只有十分松散的結構,有的數據的結構是隱含的,需要從數據中進行抽取。而有時,盡管數據本身是有精確結構的,但為了一定的目的,而故意忽視它的結構。半結構化數據具有以下五方面的主要特點:
1.結構是不規則的。包含異構數據、相同的數據信息用不同類型或不同的結構表示。
2.結構是隱含的。如電子文檔SGML格式。
3.結構是部分的,有時部分數據根本無結構,而部分數據只有粗略的結構。
4.指示性結構與約束性結構。傳統的數據庫使用嚴格的分類策略來保護數據。而指示性數據結構是對結構的一種非精確的描述。它可接受所有新數據,代價是要頻繁修改結構。
5.半結構化數據通常在數據存在之后才能通過當前數據歸納出其結構,稱之為事后模式引導。模式有時可被忽略,同時數據與數據模式間的區別逐漸消除。
三、數據分析的方法
Web頁面的數據通常是利用統計模型和數學模型來分析的。使用的模型有線性分析和非線性分析;連續回歸分析和邏輯回歸分析;單變量和多變量分析以及時間序列分析等。這
些統計分析工具能提供可視化功能和分析功能來尋找數據間關系、構造模型來分析、解釋數據。并通過交互式過程和迭代過程用來求精模型,最終開發出最具適應性的模型來將數據轉化為有價值的信息。
知識發現是從數據倉庫的大量數據中篩取信息,尋找經常出現的模式,檢查趨勢并發掘實施。它是分析Web頁面數據的重要方法。知識發現與模式識別的算法有以下幾種:1.依賴性分析依賴性分析算法搜索數據倉庫的條目和對象,從中尋找重復出現概率很高的模式。它展示了數據間未知的依賴關系。利用依賴性分析算法可以從某一數據對象的信息來推斷另一數據對象的信息。例如:在雜貨店中,一堆椒鹽餅干放在陳列飲料的走道上,這是因為經過依賴性分析,商店認為:很大一部分買飲料的顧客如果在取飲料的路上看到椒鹽餅干的話就會購買,因而此種分析影響了商店布局。
2.聚類和分類在某些情況下,無法界定要分析的數據類,用聚類算法發現一些不知道的數據類或懷疑的數據類。聚類的過程是以某一特定時間為依據,找出一個共享一些公共類別的群體,它稱為無監督學習。分類過程,這是發現一些規定某些商品或時間是否屬于某一特定數據子集的規則。這些數據類很少在關系數據庫中進行定義,因而規范的數據模型中沒有它們的位置。最典型的例子是信用卡核準過程,可確定能否按商品價格和其它標準把某一購買者歸入可接受的那一類中。分類又稱為有監督學習。
3.神經網絡神經網絡通過學習待分析數據中的模式來構造模型。它對隱式類型進行分類。圖像分析是神經網絡最成功的應用之一。神經網絡用于模型化非線性的、復雜的或噪聲高的數據。一般神經模型由三個層次組成:數據倉庫數據輸入、中間層(各種神經元)和輸出。它通常用恰當的數據庫示例來訓練和學習、校正預測的模型,提高預測結果的準確性。
4.數據挖掘中的關聯規則關聯規則是數據挖掘的一個重要內容,通常關聯規則反映的是數據間的定性關聯關系。如一個商品交易數據庫,一條記錄表示用戶一次購買的商品種類,每個屬性(A、B??)代表一種商品,每個屬性都是布爾類型的。一條關聯規則的例子是:{A、B}→{D}[2%][60%],規則的含義是“如果用戶購買商品A和B,那么也可能購買商品D,因為同時購買商品A、B和D的交易記錄占總交易數的2%而購買A和B的交易中,有60%的交易也包含D”。規則中60%是規則的信任度,2%是規則的支持度。數據挖掘就是要發現所有滿足用戶定義的最小信任度和支持度閥值限制的關聯規則。數據只是定性地描述一個交易是否包含某商品,而對交易量沒有定量描述,這種布爾類型數據間的關聯規則被稱為定性關聯規則。但數據記錄的屬性往往是數值型或字符型的,這些數據間也存在對決策有幫助的關聯規則,相對于定性關聯規則,這些規則被稱為定量關聯規則。
另外,數據挖掘目前仍面臨著數據質量的問題。由于數據倉庫中的數據來自多個數據源,而在合并中存在很多障礙,如:沒有建立合并視圖所需的公共關鍵字;數據值相互抵觸;元
數據的說明不完備或丟失;數據值的不潔凈等等。數據挖掘是在標準化的數據基礎上進行的,因而這些都會嚴重破壞數據的準確性,導致最終決策的失誤。所有這些問題都在等待著人們去發掘更好的解決方法。