日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

電商數(shù)據(jù)分析平臺(tái)有哪些 電商數(shù)據(jù)分析軟件排名

大數(shù)據(jù)技術(shù)已經(jīng)迅速應(yīng)用于商業(yè)并產(chǎn)生價(jià)值,通過(guò)數(shù)據(jù)分析來(lái)識(shí)別用戶行為,建立以用戶為中心的低成本快速增長(zhǎng),是一個(gè)企業(yè)必須具備的核心競(jìng)爭(zhēng)力 。隨著成本的大幅度增加,企業(yè)必須改變過(guò)去粗放型的營(yíng)銷和運(yùn)營(yíng)方式,特別是在市場(chǎng)營(yíng)銷、產(chǎn)品制造、銷售以及未來(lái)的客戶服務(wù)等各個(gè)方面向更加科學(xué)、高效的方向轉(zhuǎn)變 。
電商系統(tǒng)上線后,需要收集用戶行為數(shù)據(jù),通過(guò)大數(shù)據(jù)實(shí)時(shí)分析實(shí)現(xiàn)電商業(yè)務(wù)數(shù)字化運(yùn)營(yíng) ?;诖藦?qiáng)需求開發(fā)小象用戶行為分析,兼容神策開源的埋點(diǎn)SDK完成終端行為上報(bào),采用Nginx+Flume+kafka實(shí)現(xiàn)日志收集,采用Flink寫入HDFS 。
本開源項(xiàng)目?jī)?nèi)容包括nginx環(huán)境配置、Flume解密和日志格式處理、將明文數(shù)據(jù)存放到kafka的Topic下、Flink消費(fèi)后將埋點(diǎn)數(shù)據(jù)存入HDFS的關(guān)鍵4步操作 。為方便前期埋點(diǎn)的校驗(yàn)調(diào)優(yōu),在kafka環(huán)節(jié),增加了埋點(diǎn)解析數(shù)據(jù)JSON格式存入MySQL 。后續(xù)計(jì)劃增加友盟和其他SDK廠商的埋點(diǎn)處理,以及業(yè)務(wù)系統(tǒng)日志的采集入庫(kù) 。
工程流程
完成數(shù)據(jù)采集技術(shù)構(gòu)建和業(yè)務(wù)設(shè)計(jì),在App、小程序的系統(tǒng)供應(yīng)商配合下完成用戶行為數(shù)據(jù)采集埋點(diǎn),并基于埋點(diǎn)的數(shù)據(jù)構(gòu)建線上用戶行為標(biāo)簽和畫像 。
項(xiàng)目主要內(nèi)容

  • 日志采集(Flume+kafka)
  • 日志入庫(kù)(Flink+HDFS)
  • 設(shè)計(jì)思路
架構(gòu)設(shè)計(jì)思路
所謂“埋點(diǎn)”,是數(shù)據(jù)采集領(lǐng)域(尤其是用戶行為數(shù)據(jù)采集領(lǐng)域)的術(shù)語(yǔ),指的是針對(duì)特定用戶行為或事件進(jìn)行捕獲、處理和發(fā)送的相關(guān)技術(shù)及其實(shí)施過(guò)程 。比如用戶某個(gè)icon點(diǎn)擊次數(shù)、觀看某個(gè)視頻的時(shí)長(zhǎng)等等 。
電商數(shù)據(jù)分析平臺(tái)有哪些 電商數(shù)據(jù)分析軟件排名


業(yè)務(wù)設(shè)計(jì)思路
埋點(diǎn)業(yè)務(wù)設(shè)計(jì),首先需要根據(jù)業(yè)務(wù)分析明確采集的目標(biāo)行為,進(jìn)一步搞清楚應(yīng)該在哪些地方埋什么樣的點(diǎn) 。過(guò)程中建議使用“事件模型( Event 模型)”來(lái)描述用戶的各種行為,事件模型包括事件( Event )和用戶( User )兩個(gè)核心實(shí)體 ?;?W1H模型描述用戶行為可將整個(gè)行為描述清楚,要點(diǎn)包括:是誰(shuí)、什么時(shí)間、什么地點(diǎn)、以什么方式、干了什么 。通過(guò)這兩個(gè)實(shí)體結(jié)合在一起就可以清晰地描述清楚用戶行為 。
電商數(shù)據(jù)分析平臺(tái)有哪些 電商數(shù)據(jù)分析軟件排名


技術(shù)架構(gòu)
SDK埋點(diǎn)采集行為數(shù)據(jù)來(lái)源終端包括iOS、安卓、Web、H5、微信小程序等 。不同終端SDK采用對(duì)應(yīng)平臺(tái)和主流語(yǔ)言的SDK,埋點(diǎn)采集到的數(shù)據(jù)通過(guò)JSON數(shù)據(jù)以HTTP POST方式提交到服務(wù)端API 。服務(wù)端API由數(shù)據(jù)接入系統(tǒng)組成,采用Nginx來(lái)接收通過(guò) API 發(fā)送的數(shù)據(jù),并且將之寫到日志文件上 。使用Nginx實(shí)現(xiàn)高可靠性與高可擴(kuò)展性 。對(duì)于Nginx打印到文件的日志,會(huì)由Flume的 Source 模塊來(lái)實(shí)時(shí)讀取Nginx日志,并由Channel模塊進(jìn)行數(shù)據(jù)處理,最終通過(guò)Sink模塊將處理結(jié)果發(fā)布到 Kafka中 。
電商數(shù)據(jù)分析平臺(tái)有哪些 電商數(shù)據(jù)分析軟件排名


軟件完整架構(gòu)
電商數(shù)據(jù)分析平臺(tái)有哪些 電商數(shù)據(jù)分析軟件排名


第三方埋點(diǎn)SDK集成步驟
  • 引入SDK:在終端應(yīng)用配置文件添加 SDK 依賴,不同終端引入方式會(huì)有差異,具體操作步驟將在后續(xù)SDK技術(shù)文檔中體現(xiàn) 。
  • 配置上報(bào)服務(wù)端API地址:用于設(shè)置SDK上報(bào)API的服務(wù)端地址 。
  • 開啟全埋點(diǎn):SDK 可以自動(dòng)采集一些用戶行為,如 App 啟動(dòng)、退出、瀏覽頁(yè)面、控件點(diǎn)擊 。初始化 SDK 時(shí),通過(guò)SDK提供的初始化方法可以配置開啟全埋點(diǎn) 。
API接入服務(wù)設(shè)計(jì)
不同渠道的埋點(diǎn)數(shù)據(jù)通過(guò) HTTP API 發(fā)送給服務(wù)端API實(shí)現(xiàn)數(shù)據(jù)接入 。采用Nginx作為WEB容器接收客戶端SDK發(fā)送的數(shù)據(jù),并且將之寫到日志文件上 。使用 Nginx 主要是考慮到其高并發(fā)、高可靠性與高可擴(kuò)展性 。

推薦閱讀