亚洲综合日韩精品欧美综合区,日韩国产在线一区,久久久精品一二三区,午夜精品久久久久久中宇69,国产做爰一区二区三区视频,aa天堂,三级在线视频

用戶行為數(shù)據(jù)采集方法及系統(tǒng)與流程

文檔序號(hào):43636749發(fā)布日期:2025-11-03 03:46閱讀:21來(lái)源:國(guó)知局
用戶行為數(shù)據(jù)采集方法及系統(tǒng)

技術(shù)領(lǐng)域

本發(fā)明涉及數(shù)據(jù)采集技術(shù),尤其涉及一種用戶行為數(shù)據(jù)采集方法及系統(tǒng)。



背景技術(shù):

隨著電子商務(wù)的快速發(fā)展,分析出一個(gè)平臺(tái)(例如網(wǎng)站)中用戶感興趣的內(nèi)容(如功能或產(chǎn)品頻道等),并據(jù)此持續(xù)優(yōu)化網(wǎng)站或調(diào)整商業(yè)策略才能在激烈的競(jìng)爭(zhēng)中生存發(fā)展;而分析網(wǎng)站用戶行為(點(diǎn)擊)數(shù)據(jù)(即,當(dāng)用戶點(diǎn)擊網(wǎng)頁(yè)上的某些點(diǎn)時(shí)向服務(wù)器發(fā)送的用于網(wǎng)站統(tǒng)計(jì)分析的字符串)是獲得這類信息的重要手段。分析網(wǎng)站用戶行為數(shù)據(jù)的前提是獲取網(wǎng)站用戶行為數(shù)據(jù),即采集用戶行為數(shù)據(jù)。

目前有很多實(shí)現(xiàn)方式能夠?qū)崿F(xiàn)對(duì)用戶行為數(shù)據(jù)的采集,例如包括:(1)一些中小網(wǎng)站往往通過(guò)在網(wǎng)站中嵌入第三方免費(fèi)軟件,并利用該軟件所提供的采集腳本來(lái)搜集用戶在網(wǎng)站上的鼠標(biāo)移動(dòng)坐標(biāo)或點(diǎn)擊行為發(fā)生時(shí)的坐標(biāo),且這些數(shù)據(jù)通過(guò)異步模式發(fā)送到數(shù)據(jù)采集服務(wù)端,經(jīng)過(guò)日志分析保存到數(shù)據(jù)庫(kù)中,然后利用統(tǒng)計(jì)分析可分析出網(wǎng)站的熱點(diǎn)區(qū)域;(2)一些較大規(guī)模的電子商務(wù)平臺(tái)通常通過(guò)網(wǎng)站開(kāi)發(fā)人員在頁(yè)面中的某些點(diǎn)部署點(diǎn)擊數(shù)據(jù)來(lái)獲取用戶行為數(shù)據(jù),具體地說(shuō),當(dāng)用戶點(diǎn)擊這些部署的點(diǎn)時(shí),頁(yè)面通過(guò)onclick事件,調(diào)用相應(yīng)的javascript函數(shù),并以Ajax的方式將部署的點(diǎn)擊數(shù)據(jù)發(fā)送到日志服務(wù)器,由日志服務(wù)器分析數(shù)據(jù)并將其保存到數(shù)據(jù)庫(kù)中;以及(3)通過(guò)后臺(tái)配置系統(tǒng)可以定制要采集的用戶行為數(shù)據(jù),即,當(dāng)用戶訪問(wèn)一頁(yè)面時(shí),先通過(guò)代理服務(wù)器獲取要采集的用戶行為數(shù)據(jù),然后當(dāng)用戶點(diǎn)擊頁(yè)面時(shí),將用戶行為數(shù)據(jù)發(fā)送給代理服務(wù)器的數(shù)據(jù)采集模塊。

但是,上述現(xiàn)有的采集用戶行為數(shù)據(jù)的實(shí)現(xiàn)方式存在以下缺點(diǎn)。

首先,對(duì)于上述實(shí)現(xiàn)方式(1),其所采集的網(wǎng)站用戶行為數(shù)據(jù)為鼠標(biāo)移動(dòng)經(jīng)過(guò)的坐標(biāo)或鼠標(biāo)點(diǎn)擊時(shí)的坐標(biāo)數(shù)據(jù),因而數(shù)據(jù)比較單一,僅通過(guò)這些數(shù)據(jù)很難挖掘用戶行為蘊(yùn)含的深層次意圖。而且,也不能通過(guò)第三方免費(fèi)軟件來(lái)采集一些開(kāi)發(fā)時(shí)部署的點(diǎn)擊數(shù)據(jù)。因此,這類實(shí)現(xiàn)方式的拓展性較差,且對(duì)大型商務(wù)網(wǎng)站的數(shù)據(jù)挖掘意義不大。

其次,對(duì)于上述實(shí)現(xiàn)方式(2),在開(kāi)發(fā)過(guò)程中部署點(diǎn)擊數(shù)據(jù)的實(shí)現(xiàn)方式盡管可以豐富用戶行為數(shù)據(jù),為細(xì)分網(wǎng)站特征奠定了基礎(chǔ),但是這類方式僅能針對(duì)已經(jīng)部署的點(diǎn)擊數(shù)據(jù)收集用戶行為數(shù)據(jù),若需要增加新的點(diǎn)來(lái)部署點(diǎn)擊數(shù)據(jù),或者修改或刪除已經(jīng)部署的點(diǎn)擊數(shù)據(jù),則需要開(kāi)發(fā)人員進(jìn)行修改,然后發(fā)布上線,這種修改會(huì)導(dǎo)致開(kāi)發(fā)成本加大,且不夠靈活。

再次,對(duì)于上述實(shí)現(xiàn)方式(3),其雖然可以定制需要搜集的數(shù)據(jù),但若要搜集類似的多條(例如40條)數(shù)據(jù),則需要在后臺(tái)配置系統(tǒng)配置相應(yīng)的多條(例如40條)數(shù)據(jù),這樣導(dǎo)致有些工作重復(fù)、效率低下;而且,不能夠根據(jù)不同的情況來(lái)生成要采集的不同的用戶行為數(shù)據(jù)。

綜上所述,現(xiàn)有的用戶行為數(shù)據(jù)采集存在以下缺點(diǎn)中的一個(gè)或多個(gè)缺點(diǎn):

1.不能夠定義、修改、刪除要采集的用戶行為數(shù)據(jù);

2.通用性差,與具體應(yīng)用或網(wǎng)站有較強(qiáng)的綁定性;

3.由于要采集的用戶行為數(shù)據(jù)分散于網(wǎng)頁(yè)中,因而無(wú)法集中管理要采集的數(shù)據(jù);

4.無(wú)法針對(duì)不同的應(yīng)用配置生成具有特定業(yè)務(wù)含義的用戶行為數(shù)據(jù)。



技術(shù)實(shí)現(xiàn)要素:

鑒于上述問(wèn)題,本技術(shù)的一個(gè)目的是提供一種能夠根據(jù)需要來(lái)定義、修改、刪除用戶行為數(shù)據(jù)規(guī)則的用戶行為數(shù)據(jù)采集方法及系統(tǒng)。

本技術(shù)的另一個(gè)目的是提供一種通用性強(qiáng)的用戶行為數(shù)據(jù)采集方法及系統(tǒng)。

本技術(shù)的又一個(gè)目的是提供一種可以集中管理要采集的用戶行為數(shù)據(jù)的用戶行為數(shù)據(jù)采集方法及系統(tǒng)。

本技術(shù)的再一個(gè)目的是提供一種可以針對(duì)不同的應(yīng)用配置生成具有特定業(yè)務(wù)含義的用戶行為數(shù)據(jù)的用戶行為數(shù)據(jù)采集方法及系統(tǒng)。

為了實(shí)現(xiàn)上述目的,本技術(shù)提供一種用戶行為數(shù)據(jù)采集方法,該方法包括如下步驟:(a)接收客戶端所發(fā)送的訪問(wèn)一應(yīng)用的請(qǐng)求;(b)調(diào)用預(yù)先定制的用戶行為數(shù)據(jù)規(guī)則;(c)根據(jù)所調(diào)用的用戶行為數(shù)據(jù)規(guī)則來(lái)生成用戶行為嵌入數(shù)據(jù);(d)將該用戶行為嵌入數(shù)據(jù)嵌入該應(yīng)用中以生成應(yīng)用頁(yè)面;(e)根據(jù)用戶對(duì)該應(yīng)用頁(yè)面的點(diǎn)擊事件獲得用戶行為數(shù)據(jù)。

本技術(shù)還提供一種用戶行為數(shù)據(jù)采集系統(tǒng),該系統(tǒng)包括:接收模塊,接收客戶端所發(fā)送的訪問(wèn)一網(wǎng)頁(yè)的請(qǐng)求;調(diào)用模塊,調(diào)用預(yù)先定制的用戶行為數(shù)據(jù)規(guī)則;生成模塊,根據(jù)所調(diào)用的用戶行為數(shù)據(jù)規(guī)則來(lái)生成用戶行為嵌入數(shù)據(jù);嵌入模塊,將該用戶行為嵌入數(shù)據(jù)嵌入該應(yīng)用中以生成應(yīng)用頁(yè)面;獲取模塊,根據(jù)用戶對(duì)該應(yīng)用頁(yè)面的點(diǎn)擊事件獲得用戶行為數(shù)據(jù)。

在本技術(shù)中,由于引入了用戶行為數(shù)據(jù)規(guī)則管理系統(tǒng),從而可以從業(yè)務(wù)需要出發(fā)靈活定制、修改和/或刪除用戶行為數(shù)據(jù)規(guī)則,在這一過(guò)程中不需要前端工程師、應(yīng)用工程師、發(fā)布工程師作任何應(yīng)用的改動(dòng),因而降低了開(kāi)發(fā)成本,提高了可管理性。

而且,在本技術(shù)中,可以通過(guò)不同規(guī)則的描述來(lái)定義動(dòng)態(tài)行為數(shù)據(jù)、靜態(tài)行為數(shù)據(jù)和交互行為數(shù)據(jù),這幾乎涵蓋了目前所有的用戶數(shù)據(jù)類型,也就是說(shuō)通過(guò)用戶行為規(guī)則管理系統(tǒng)可以實(shí)現(xiàn)對(duì)需要采集的用戶行為數(shù)據(jù)的集中管理;且通過(guò)規(guī)則的定義,可以對(duì)要采集的相似用戶行為數(shù)據(jù)只配置一條規(guī)則,然后根據(jù)用戶行為數(shù)據(jù)采集系統(tǒng)的應(yīng)用集成API及具體環(huán)境來(lái)生成多條用戶行為數(shù)據(jù),減少繁瑣的重復(fù)的配置工作。

此外,在本技術(shù)中,先從用戶行為數(shù)據(jù)規(guī)則緩沖中查找用戶行為數(shù)據(jù)規(guī)則,只有在該規(guī)則緩沖中未找到用戶行為數(shù)據(jù)規(guī)則的情況下,才使用用戶行為數(shù)據(jù)規(guī)則管理系統(tǒng)進(jìn)行查找,因而可以有效地提高查找速度,使得用戶行為數(shù)據(jù)采集效率大大提高。

綜上所述,本技術(shù)包括如下所述的多個(gè)優(yōu)點(diǎn)。當(dāng)然,實(shí)施本技術(shù)的任一產(chǎn)品并不一定需要同時(shí)達(dá)到以上所述的所有優(yōu)點(diǎn)。

1.前端開(kāi)發(fā)工程師可以僅考慮頁(yè)面的實(shí)現(xiàn),而不考慮要采集的用戶數(shù)據(jù)。

2.由于本技術(shù)的用戶行為數(shù)據(jù)規(guī)則通過(guò)后臺(tái)的用戶行為數(shù)據(jù)管理系統(tǒng)定制,在應(yīng)用中將集成本系統(tǒng)的應(yīng)用代碼抽取成應(yīng)用集成API,且解析規(guī)則器插件化,因而使得本技術(shù)具有較強(qiáng)的通用性。

3.通過(guò)用戶行為數(shù)據(jù)采集系統(tǒng)配置規(guī)則以及應(yīng)用集成API對(duì)規(guī)則進(jìn)行解析,可以減少用戶行為數(shù)據(jù)配置的重復(fù)工作。

4.基于規(guī)則配置的用戶行為采集系統(tǒng)可以靈活地定制、修改或刪除要采集的用戶行為數(shù)據(jù)。

5.由于在用戶行為規(guī)則管理系統(tǒng)中管理規(guī)則,而非將規(guī)則分散在應(yīng)用頁(yè)面上,因而可以集中管理不同類型的用戶行為采集數(shù)據(jù)。

附圖說(shuō)明

圖1示例性示出了實(shí)現(xiàn)本技術(shù)提供的方法的一種操作環(huán)境的結(jié)構(gòu)示意圖;

圖2示例性示出了根據(jù)本技術(shù)的用戶行為數(shù)據(jù)采集系統(tǒng)的框圖;

圖3示例性示出了根據(jù)本技術(shù)的用戶行為數(shù)據(jù)采集方法的流程圖;

圖4示出了根據(jù)本技術(shù)的用戶行為數(shù)據(jù)規(guī)則管理系統(tǒng)的配置頁(yè)面的一個(gè)實(shí)例;

圖5示例性示出了根據(jù)本技術(shù)的用戶行為數(shù)據(jù)采集系統(tǒng)的數(shù)據(jù)流圖;以及

圖6示例性示出了根據(jù)本技術(shù)的用戶行為數(shù)據(jù)采集系統(tǒng)的功能框圖。

具體實(shí)施方式

下面將詳細(xì)描述本技術(shù)的實(shí)施例。應(yīng)當(dāng)注意,這里描述的實(shí)施例僅用于舉例說(shuō)明,并不用于限制本技術(shù)。

圖1示例性示出實(shí)現(xiàn)本技術(shù)提供的方法的一種操作環(huán)境的結(jié)構(gòu)示意圖,網(wǎng)站端的設(shè)備可以包括網(wǎng)站服務(wù)器1、日志服務(wù)器2、用戶行為數(shù)據(jù)規(guī)則管理服務(wù)器3;客戶端的設(shè)備可以包括計(jì)算機(jī)4、手機(jī)5等用戶終端設(shè)備。網(wǎng)站端和客戶端的設(shè)備之間經(jīng)由網(wǎng)絡(luò)6通信。

網(wǎng)站服務(wù)器1形成網(wǎng)站頁(yè)面(即,網(wǎng)頁(yè)),并通過(guò)用戶界面顯示網(wǎng)站頁(yè)面,在網(wǎng)站服務(wù)器1中可以配置有網(wǎng)站數(shù)據(jù)庫(kù)11,網(wǎng)站數(shù)據(jù)庫(kù)11中存儲(chǔ)有各種網(wǎng)站數(shù)據(jù)。網(wǎng)站服務(wù)器1中還可以配置有緩存12,用于存儲(chǔ)將在下面描述的解析后的用戶行為數(shù)據(jù)規(guī)則。

日志服務(wù)器2可以包括數(shù)據(jù)庫(kù)21。日志服務(wù)器2可以接收用戶在點(diǎn)擊頁(yè)面時(shí)所觸發(fā)的用戶行為數(shù)據(jù)(即,用戶行為點(diǎn)擊數(shù)據(jù)),利用其分析模塊解析該數(shù)據(jù),并將解析后的數(shù)據(jù)保存到數(shù)據(jù)庫(kù)21中。

用戶行為數(shù)據(jù)規(guī)則管理服務(wù)器3包括數(shù)據(jù)庫(kù)31。用戶行為數(shù)據(jù)規(guī)則管理服務(wù)器3用于根據(jù)需要配置待采集的用戶行為數(shù)據(jù)的用戶行為數(shù)據(jù)規(guī)則,例如創(chuàng)建、修改或刪除用戶行為數(shù)據(jù)規(guī)則。

在圖1中,網(wǎng)站服務(wù)器1、日志服務(wù)器2和用戶行為數(shù)據(jù)規(guī)則管理服務(wù)器3分別配備有數(shù)據(jù)庫(kù)11、數(shù)據(jù)庫(kù)21和數(shù)據(jù)庫(kù)31。但是,本技術(shù)實(shí)施例中的整個(gè)系統(tǒng)的結(jié)構(gòu)不限于此,也可以將這些數(shù)據(jù)庫(kù)獨(dú)立于服務(wù)器配置。另外,在圖1中,網(wǎng)站服務(wù)器1、日志服務(wù)器2和用戶行為數(shù)據(jù)規(guī)則管理服務(wù)器3獨(dú)立配置。但是,本技術(shù)實(shí)施例中的整個(gè)系統(tǒng)的結(jié)構(gòu)不限于此,也可以將這些服務(wù)器任意組合使用。

下面將參考圖2具體描述根據(jù)本技術(shù)的用戶行為采集系統(tǒng)的框圖。如圖2所示,用戶行為采集系統(tǒng)主要由客戶端采集模塊、用戶行為數(shù)據(jù)規(guī)則管理系統(tǒng)和應(yīng)用集成API構(gòu)成。其中,用戶行為數(shù)據(jù)規(guī)則管理系統(tǒng)能對(duì)用戶行為數(shù)據(jù)規(guī)則集中配置管理,靈活性和通用性強(qiáng);應(yīng)用集成API可以位于應(yīng)用中,且應(yīng)用集成API可使集成變得容易;客戶端采集模塊可以采用通用javascript,便于使用;通過(guò)以上三個(gè)子系統(tǒng)可以形成一套有效的、靈活的、通用的用戶行為采集系統(tǒng)。

上述用戶行為數(shù)據(jù)規(guī)則管理系統(tǒng)為一后臺(tái)系統(tǒng),其配置頁(yè)面的一個(gè)實(shí)例在圖4中示出。在圖4所示的配置頁(yè)面中,應(yīng)用名稱為SearchWeb,模塊名稱為forum,組件名稱為ForumSearchResult,其中示意性示出了三個(gè)錨點(diǎn)title、reply和read,分別代表主題、用戶的回復(fù)和閱讀行為的規(guī)則,即,在用戶行為數(shù)據(jù)規(guī)則管理系統(tǒng)中,為SearchWeb應(yīng)用中的forum模塊中的ForumSearchResult組件的三個(gè)錨點(diǎn)(即,頁(yè)面元素)title、reply和read分別定義了要采集的用戶行為數(shù)據(jù)規(guī)則。配置頁(yè)面的右側(cè)具有創(chuàng)建、修改和刪除錨點(diǎn)的功能塊,從而可以根據(jù)需要定義、修改或刪除用戶行為數(shù)據(jù)規(guī)則。例如,當(dāng)需要增加網(wǎng)頁(yè)中要采集的數(shù)據(jù)時(shí),可以點(diǎn)擊用戶行為數(shù)據(jù)規(guī)則管理系統(tǒng)的配置頁(yè)面中的“創(chuàng)建錨點(diǎn)”功能塊以配置要采集的數(shù)據(jù)串形式的規(guī)則?;蛘?,例如,當(dāng)原采集數(shù)據(jù)為起始頁(yè)和成員ID(其對(duì)應(yīng)規(guī)則為searchtrace=club_normalclick_${beginPage}_${memberid}_forum),且期望將該原采集數(shù)據(jù)修改為起始頁(yè)、成員ID以及論壇ID時(shí),只需點(diǎn)擊用戶規(guī)則管理系統(tǒng)的配置頁(yè)面中的對(duì)應(yīng)錨點(diǎn)的“修改”功能以將上述原規(guī)則修改為searchtrace=club_normalclicK_${beginPage}_${memberid}_${forumId}_forum即可?;蛘?,例如,當(dāng)需要?jiǎng)h除網(wǎng)頁(yè)中要采集的某一數(shù)據(jù)時(shí),可以點(diǎn)擊用戶行為數(shù)據(jù)規(guī)則管理系統(tǒng)的配置頁(yè)面中對(duì)應(yīng)于該數(shù)據(jù)的錨點(diǎn)的“刪除”功能,以將對(duì)應(yīng)錨點(diǎn)的規(guī)則配置刪除。圖4僅示出了用戶行為數(shù)據(jù)規(guī)則管理系統(tǒng)的配置頁(yè)面的一個(gè)實(shí)例,實(shí)際上,根據(jù)具體需要,每個(gè)應(yīng)用的每個(gè)模塊的每個(gè)組件的每個(gè)頁(yè)面元素(即,錨點(diǎn))均可以在用戶行為數(shù)據(jù)規(guī)則管理系統(tǒng)中分別定義其規(guī)則。因而,可以實(shí)現(xiàn)用戶行為數(shù)據(jù)規(guī)則的靈活定制、修改或刪除,而無(wú)需增加開(kāi)發(fā)成本。

上述這些在用戶行為數(shù)據(jù)規(guī)則管理系統(tǒng)中定制的用戶行為數(shù)據(jù)規(guī)則通過(guò)自然語(yǔ)言來(lái)表達(dá),根據(jù)不同的表達(dá)形式可以定義不同類型的用戶行為數(shù)據(jù),例如動(dòng)態(tài)行為數(shù)據(jù)、靜態(tài)行為數(shù)據(jù)和交互行為數(shù)據(jù),其中動(dòng)態(tài)用戶行為數(shù)據(jù)是通過(guò)應(yīng)用上下文數(shù)據(jù)替換用戶行為數(shù)據(jù)規(guī)則中的變量字段而生成的用戶行為數(shù)據(jù),這類數(shù)據(jù)可表達(dá)豐富的含義,比如用戶信息、排名信息、第幾頁(yè);靜態(tài)用戶行為數(shù)據(jù)是指固定的一串字符串?dāng)?shù)據(jù);交互行為數(shù)據(jù)是指用戶在頁(yè)面操作時(shí),由不同操作而選擇的數(shù)據(jù)值來(lái)替換用戶行為數(shù)據(jù)規(guī)則中變量字段產(chǎn)生的數(shù)據(jù)。在圖4所示的實(shí)例中,動(dòng)態(tài)用戶行為數(shù)據(jù)用${...}來(lái)表示,如:${beginPage}。在一實(shí)施例中,靜態(tài)用戶行為數(shù)據(jù)的表示方式例如為searchtrace=mp3_pic_2。在一實(shí)施例中,交互行為數(shù)據(jù)的表示方式可以使用$[...],例如$[form:form1.username],其中前面的form表示DOM(documentobjectmodel,文檔對(duì)象模型)元素獲取,form1表示表單的名稱為form1,username表示輸入框的name屬性為username。

上述“上下文數(shù)據(jù)”是指用戶在訪問(wèn)應(yīng)用時(shí)應(yīng)用的服務(wù)器端所獲取的相應(yīng)信息。例如,當(dāng)阿里巴巴會(huì)員登錄阿里巴巴網(wǎng)并輸入其會(huì)員ID和密碼時(shí),阿里巴巴網(wǎng)服務(wù)器可獲取例如會(huì)員ID、注冊(cè)地區(qū)等的相關(guān)信息,這些信息即為“上下文數(shù)據(jù)”。

上述用戶行為采集系統(tǒng)的應(yīng)用集成API通過(guò)抽取規(guī)則采集處理邏輯而形成,即,集成本系統(tǒng)的應(yīng)用代碼被抽取以形成應(yīng)用集成API,且應(yīng)用集成API由規(guī)則解析模塊和用戶行為嵌入數(shù)據(jù)生成模塊組成。因而,在使用時(shí),只需調(diào)用該API模塊的一函數(shù)即可生成用戶行為打點(diǎn)數(shù)據(jù)(即,用戶行為嵌入數(shù)據(jù))。

客戶端采集模塊可以通過(guò)javascript來(lái)實(shí)現(xiàn),以事件驅(qū)動(dòng)模型來(lái)實(shí)現(xiàn)用戶行為數(shù)據(jù)的采集,其可以預(yù)先放入應(yīng)用網(wǎng)頁(yè)中。在一實(shí)例中,當(dāng)用戶點(diǎn)擊頁(yè)面某些點(diǎn)時(shí)實(shí)現(xiàn)點(diǎn)擊點(diǎn)與用戶行為點(diǎn)擊數(shù)據(jù)的關(guān)聯(lián),并例如通過(guò)Ajax方式將采集的數(shù)據(jù)發(fā)送到日志服務(wù)器。

此外,如圖2所示,用戶行為采集系統(tǒng)除了包括客戶端采集模塊、用戶行為數(shù)據(jù)規(guī)則管理系統(tǒng)和應(yīng)用集成API之外,還包括數(shù)據(jù)倉(cāng)庫(kù)(DW),即,圖1中的數(shù)據(jù)庫(kù)21,其中該應(yīng)用包括:應(yīng)用集成API調(diào)用模塊,用于調(diào)用應(yīng)用集成API以生成用戶行為嵌入數(shù)據(jù);以及用戶行為規(guī)則調(diào)用模塊,用于從用戶行為數(shù)據(jù)規(guī)則管理系統(tǒng)調(diào)用用戶行為數(shù)據(jù)規(guī)則。該應(yīng)用將通過(guò)調(diào)用應(yīng)用集成API所生成的用戶行為嵌入數(shù)據(jù)發(fā)送給應(yīng)用前端頁(yè)面。通過(guò)客戶端采集模塊,利用用戶對(duì)應(yīng)用前端頁(yè)面的點(diǎn)擊事件所生成的用戶行為點(diǎn)擊數(shù)據(jù)被發(fā)送到數(shù)據(jù)倉(cāng)庫(kù)(DW)中。

下面,將參照?qǐng)D3描述根據(jù)本技術(shù)的用戶行為數(shù)據(jù)采集方法的一個(gè)實(shí)例。

如圖3所示,首先,在步驟S1中,接收客戶端所發(fā)送的訪問(wèn)一應(yīng)用的請(qǐng)求。

然后,在步驟S2中,根據(jù)該請(qǐng)求,調(diào)用預(yù)先定制的用戶行為數(shù)據(jù)規(guī)則。

接著,在步驟S3中,根據(jù)所調(diào)用的用戶行為數(shù)據(jù)規(guī)則來(lái)生成用戶行為嵌入數(shù)據(jù);

之后,在步驟S4中,將該用戶行為嵌入數(shù)據(jù)嵌入該應(yīng)用中以生成應(yīng)用頁(yè)面。

最后,在步驟S5中,根據(jù)用戶對(duì)所生成的應(yīng)用頁(yè)面的點(diǎn)擊事件獲得用戶行為數(shù)據(jù)。

該步驟S2包括:在用戶行為數(shù)據(jù)規(guī)則緩存中查找對(duì)應(yīng)于該應(yīng)用的用戶行為數(shù)據(jù)規(guī)則,若未找到,則利用用戶行為數(shù)據(jù)規(guī)則管理系統(tǒng)查找對(duì)應(yīng)于該應(yīng)用的用戶行為數(shù)據(jù)規(guī)則。例如,可以根據(jù)應(yīng)用的模塊名稱和組件名稱來(lái)查找相應(yīng)的用戶行為數(shù)據(jù)規(guī)則。

該步驟S3包括:解析所調(diào)用的用戶行為數(shù)據(jù)規(guī)則,從而生成該用戶行為嵌入數(shù)據(jù)。

在該步驟S4中,該用戶行為嵌入數(shù)據(jù)被嵌入該應(yīng)用頁(yè)面的頁(yè)面尾端。

該步驟S5包括:利用預(yù)先嵌入在應(yīng)用中的客戶端采集模塊根據(jù)用戶對(duì)該應(yīng)用頁(yè)面的點(diǎn)擊事件獲得用戶行為數(shù)據(jù)。

下面將參考圖1和圖2,以動(dòng)態(tài)用戶行為數(shù)據(jù)為例具體描述根據(jù)本技術(shù)的用戶行為數(shù)據(jù)采集方法的一個(gè)實(shí)施例。

首先,由產(chǎn)品經(jīng)理、運(yùn)營(yíng)人員或開(kāi)發(fā)人員利用用戶行為數(shù)據(jù)規(guī)則管理系統(tǒng)來(lái)設(shè)置某網(wǎng)站或電子商務(wù)平臺(tái)需要搜集的用戶行為數(shù)據(jù)規(guī)則。其中,所述用戶行為數(shù)據(jù)規(guī)則管理系統(tǒng)包括定義視圖模塊、定義區(qū)塊模塊和定義規(guī)則模塊,用于為應(yīng)用創(chuàng)建、修改或刪除用戶行為數(shù)據(jù)規(guī)則。定義視圖模塊用于確定應(yīng)用的網(wǎng)頁(yè)視圖,定義區(qū)塊模塊用于將網(wǎng)頁(yè)視圖劃分成多個(gè)區(qū)塊,定義規(guī)則模塊用于針對(duì)不同區(qū)塊的具體內(nèi)容來(lái)定義規(guī)則。在圖4所示的用戶行為數(shù)據(jù)規(guī)則管理系統(tǒng)的配置頁(yè)面的一個(gè)實(shí)例中,默認(rèn)已通過(guò)定義區(qū)塊模塊定義了區(qū)塊,定義視圖模塊將視圖確定為模塊名稱forum,定義規(guī)則模塊在應(yīng)用searchWeb的模塊forum下的組件ForumSearchResult中定義了“title”、“reply”和“read”這三種規(guī)則。

然后,在需要進(jìn)行用戶行為搜集的應(yīng)用中集成應(yīng)用集成API。這樣,在用戶通過(guò)客戶端4或5發(fā)送請(qǐng)求(例如HTTP請(qǐng)求)到該應(yīng)用的服務(wù)端(例如網(wǎng)站服務(wù)器1)時(shí),服務(wù)端接受請(qǐng)求,并調(diào)用應(yīng)用集成API來(lái)生成用戶行為嵌入數(shù)據(jù)。

之后,所生成的用戶行為嵌入數(shù)據(jù)例如以jsonp格式被集中嵌入到應(yīng)用頁(yè)面尾端,且服務(wù)端返回響應(yīng)(例如HTTP響應(yīng))以將嵌入有用戶行為嵌入數(shù)據(jù)的應(yīng)用頁(yè)面推送到客戶端。

當(dāng)用戶通過(guò)點(diǎn)擊事件觸發(fā)客戶端采集模塊(例如,嵌入在頁(yè)面的javascript)時(shí),采集腳本根據(jù)點(diǎn)擊樣式classid或在開(kāi)發(fā)時(shí)添加的點(diǎn)擊點(diǎn)的自定義屬性trace屬性來(lái)關(guān)聯(lián)在頁(yè)面尾部已經(jīng)生成的用戶行為數(shù)據(jù),并通過(guò)例如Ajax方式將該用戶行為數(shù)據(jù)發(fā)送到日志服務(wù)器2。

最后,日志服務(wù)器2接收該用戶行為數(shù)據(jù),利用其分析模塊解析數(shù)據(jù),并將解析的數(shù)據(jù)保存到其數(shù)據(jù)庫(kù)21中。

上述調(diào)用應(yīng)用集成API來(lái)生成用戶行為嵌入數(shù)據(jù)的步驟包括:

首先,根據(jù)應(yīng)用的模塊名稱和模塊中的組件名稱在用戶行為數(shù)據(jù)規(guī)則緩存12中查找相應(yīng)規(guī)則。

若找到,則根據(jù)所找到的規(guī)則以及該應(yīng)用的上下文數(shù)據(jù),利用該上下文數(shù)據(jù)替換該規(guī)則中的變量,從而生成用戶行為嵌入數(shù)據(jù)。

若未找到,則應(yīng)用的用戶行為規(guī)則調(diào)用模塊向用戶行為數(shù)據(jù)規(guī)則管理系統(tǒng)發(fā)送一個(gè)獲取用戶行為數(shù)據(jù)規(guī)則的請(qǐng)求(例如HTTP請(qǐng)求),用戶行為數(shù)據(jù)規(guī)則管理系統(tǒng)根據(jù)應(yīng)用的模塊名稱和組件名稱從數(shù)據(jù)庫(kù)31查找相應(yīng)的用戶行為數(shù)據(jù)規(guī)則,利用該用戶行為數(shù)據(jù)規(guī)則生成XML格式的用戶行為定制數(shù)據(jù)規(guī)則,并將所生成的XML格式的用戶行為定制數(shù)據(jù)規(guī)則返回給應(yīng)用。然后,應(yīng)用的應(yīng)用集成API調(diào)用模塊調(diào)用應(yīng)用集成API,該應(yīng)用集成API的規(guī)則解析模塊(即,規(guī)則解析引擎或規(guī)則解析器)解析所返回的XML格式的用戶行為定制數(shù)據(jù)規(guī)則,并將解析后的規(guī)則緩存到用戶行為數(shù)據(jù)規(guī)則緩存(例如,圖1所示的緩存12)中,其中該規(guī)則解析器可以由本采集系統(tǒng)實(shí)現(xiàn)或以第三方插件的方式集成到本系統(tǒng)中。接著,該應(yīng)用集成API的用戶行為嵌入數(shù)據(jù)生成模塊生成用戶行為嵌入數(shù)據(jù),并將其返回給應(yīng)用。在一實(shí)例中,用戶行為數(shù)據(jù)規(guī)則緩存可以通過(guò)Java對(duì)象CorruntHashMap來(lái)實(shí)現(xiàn),其使用應(yīng)用模塊名組件名作為關(guān)鍵字來(lái)實(shí)現(xiàn)對(duì)用戶行為數(shù)據(jù)規(guī)則的存儲(chǔ)。

此外,上述用戶行為數(shù)據(jù)規(guī)則管理系統(tǒng)根據(jù)用戶行為數(shù)據(jù)規(guī)則所生成的XML格式的用戶行為定制數(shù)據(jù)規(guī)則文件的一實(shí)例如下:

在該實(shí)例中,存在兩個(gè)節(jié)點(diǎn)(即,trace),即應(yīng)用網(wǎng)頁(yè)被分割為兩個(gè)區(qū)塊,在應(yīng)用網(wǎng)頁(yè)的第一個(gè)區(qū)塊中,包括題目和圖片(即,“title”和“pci”)這兩條規(guī)則,且在應(yīng)用網(wǎng)頁(yè)的第二個(gè)區(qū)塊中,包括公司(即,“company”)這一條規(guī)則。這樣,被嵌入上述規(guī)則的應(yīng)用網(wǎng)頁(yè)將包括三條數(shù)據(jù)規(guī)則。

盡管上面以動(dòng)態(tài)數(shù)據(jù)為例描述了用戶行為數(shù)據(jù)采集方法,但應(yīng)理解的是,該方法同樣適用于靜態(tài)數(shù)據(jù)以及交互數(shù)據(jù)。

在另一實(shí)施例中,應(yīng)用集成API還可以包括一規(guī)則同步模塊(如圖5所示),該規(guī)則同步模塊具有主動(dòng)同步和被動(dòng)同步兩種工作模式,其中,主動(dòng)同步為:應(yīng)用定時(shí)向用戶行為數(shù)據(jù)規(guī)則管理系統(tǒng)發(fā)送一個(gè)請(qǐng)求,以獲取XML格式的用戶行為定制數(shù)據(jù)規(guī)則;被動(dòng)同步為:用戶行為數(shù)據(jù)規(guī)則管理系統(tǒng)主動(dòng)發(fā)出請(qǐng)求,同步模塊接收到請(qǐng)求后向用戶行為規(guī)則管理系統(tǒng)獲取用戶行為定制數(shù)據(jù)規(guī)則。即,在本技術(shù)中,可以通過(guò)定時(shí)向用戶行為數(shù)據(jù)管理系統(tǒng)發(fā)送獲取用戶行為數(shù)據(jù)規(guī)則的請(qǐng)求,來(lái)查找對(duì)應(yīng)于該應(yīng)用的用戶行為數(shù)據(jù)規(guī)則,或者可以通過(guò)用戶行為數(shù)據(jù)管理系統(tǒng)主動(dòng)發(fā)送用戶行為數(shù)據(jù)規(guī)則同步請(qǐng)求,同步模塊接收到請(qǐng)求后向用戶行為規(guī)則管理系統(tǒng)獲取該應(yīng)用的用戶行為數(shù)據(jù)規(guī)則。

下面將參考圖5描述規(guī)則同步模塊以主動(dòng)同步方式工作的情況下根據(jù)本技術(shù)的用戶行為數(shù)據(jù)采集方法的一個(gè)實(shí)施例。

如圖5所示,首先,應(yīng)用調(diào)用應(yīng)用集成API的規(guī)則同步模塊,以定時(shí)向用戶行為數(shù)據(jù)規(guī)則管理系統(tǒng)發(fā)送獲取規(guī)則的請(qǐng)求,用戶行為規(guī)則管理系統(tǒng)響應(yīng)該請(qǐng)求,將用戶行為定制數(shù)據(jù)規(guī)則返回給應(yīng)用。

若有用戶訪問(wèn)該應(yīng)用,則應(yīng)用首先在其自身的用戶行為數(shù)據(jù)規(guī)則緩存中查找相應(yīng)規(guī)則,若找到,則直接利用所查找到的規(guī)則生成用戶行為嵌入數(shù)據(jù)并將其嵌入應(yīng)用頁(yè)面中;若沒(méi)找到,則調(diào)用應(yīng)用集成API,以利用規(guī)則解析模塊將之前從用戶行為數(shù)據(jù)規(guī)則管理系統(tǒng)返回給應(yīng)用的用戶行為定制數(shù)據(jù)規(guī)則進(jìn)行解析和存儲(chǔ),并經(jīng)由用戶行為嵌入數(shù)據(jù)生成模塊將解析后的規(guī)則生成用戶行為嵌入數(shù)據(jù),之后,將所生成的用戶行為嵌入數(shù)據(jù)嵌入應(yīng)用中以形成應(yīng)用頁(yè)面。

這樣,在用戶點(diǎn)擊應(yīng)用頁(yè)面時(shí),預(yù)先嵌入應(yīng)用中的客戶端采集模塊被觸發(fā),從而采集到用戶行為點(diǎn)擊數(shù)據(jù),之后所采集的用戶行為點(diǎn)擊數(shù)據(jù)被發(fā)送到日志服務(wù)器進(jìn)行分析和/或存儲(chǔ)等處理。

根據(jù)本技術(shù)實(shí)施例的方法可以通過(guò)利用公知的計(jì)算機(jī)、服務(wù)器或任意類型的處理設(shè)備來(lái)實(shí)現(xiàn)。例如,計(jì)算機(jī)通過(guò)執(zhí)行存儲(chǔ)在公知的存儲(chǔ)器、硬盤、可移動(dòng)硬盤、CD-ROM或其它任意類型的存儲(chǔ)介質(zhì)內(nèi)的指令、程序、軟件和數(shù)據(jù)中的一個(gè)或任意組合來(lái)執(zhí)行上述方法的步驟。

圖6示例性示出本技術(shù)的用戶行為數(shù)據(jù)規(guī)則采集系統(tǒng)的功能框圖,本技術(shù)的用戶行為數(shù)據(jù)規(guī)則采集系統(tǒng)對(duì)應(yīng)于上述實(shí)施例中的用戶行為數(shù)據(jù)規(guī)則采集方法。參見(jiàn)圖6,系統(tǒng)包括:接收模塊,接收客戶端所發(fā)送的訪問(wèn)一網(wǎng)頁(yè)的請(qǐng)求;調(diào)用模塊,調(diào)用預(yù)先定制的用戶行為數(shù)據(jù)規(guī)則;生成模塊,根據(jù)所調(diào)用的用戶行為數(shù)據(jù)規(guī)則來(lái)生成用戶行為嵌入數(shù)據(jù);嵌入模塊,將該用戶行為嵌入數(shù)據(jù)嵌入該應(yīng)用中以生成應(yīng)用頁(yè)面;獲取模塊,根據(jù)用戶對(duì)該應(yīng)用頁(yè)面的點(diǎn)擊事件獲得用戶行為數(shù)據(jù)。

根據(jù)本技術(shù)實(shí)施例的系統(tǒng)可以為計(jì)算機(jī)系統(tǒng)、服務(wù)器或可以執(zhí)行上述方法的步驟的任意設(shè)備。系統(tǒng)中的模塊(例如接收模塊)等可以為計(jì)算機(jī)系統(tǒng)、服務(wù)器的具有相應(yīng)功能的組件、邏輯電路或其它部分。

本技術(shù)包括如下所述的多個(gè)優(yōu)點(diǎn)之一或任意組合,但不限于這些優(yōu)點(diǎn):

1.前端開(kāi)發(fā)工程師可以僅考慮頁(yè)面的實(shí)現(xiàn),而不考慮用戶要采集的數(shù)據(jù)。

2.由于本技術(shù)的用戶行為數(shù)據(jù)采集通過(guò)后臺(tái)定制,而且利用抽取形成用戶行為數(shù)據(jù)規(guī)則采集庫(kù),且規(guī)則解析器插件化,因而使得本技術(shù)具有較強(qiáng)的通用性。

3.通過(guò)規(guī)則的配置及用戶行為數(shù)據(jù)規(guī)則采集庫(kù)可以減少用戶行為數(shù)據(jù)配置的重復(fù)工作。

4.基于規(guī)則配置的用戶行為采集系統(tǒng)可以靈活地定制、修改或刪除要采集的用戶行為數(shù)據(jù)。

5.可以集中管理不同類型的用戶行為采集數(shù)據(jù)。

當(dāng)然,實(shí)施本技術(shù)的任一產(chǎn)品并不一定需要同時(shí)達(dá)到以上所述的所有優(yōu)點(diǎn)。

盡管上面以示例性實(shí)施例的方式對(duì)本技術(shù)進(jìn)行了詳細(xì)描述,但本技術(shù)的范圍不限于上述實(shí)施例,本領(lǐng)域的技術(shù)人員可以對(duì)本技術(shù)進(jìn)行各種改進(jìn)和變型,這些均不脫離本技術(shù)的范圍和構(gòu)思。

當(dāng)前第1頁(yè)1 2 
當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 留言:0條
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1