日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

大型網(wǎng)站如何制作大型網(wǎng)站的技術(shù)架構(gòu)是這樣建成的?( 二 )


4.存儲(chǔ)層架構(gòu)提供數(shù)據(jù)、文件的持久化存儲(chǔ)訪問與管理服務(wù) 。
分布式文件網(wǎng)站在線業(yè)務(wù)需要存儲(chǔ)的文件大部分都是圖片、網(wǎng)頁、視頻等比較小的文件,但是這些文件的數(shù)量非常龐大,而且通常都在持續(xù)增加,需要伸縮性設(shè)計(jì)比較好的分布式文件系統(tǒng) 。
關(guān)系數(shù)據(jù)庫大部分網(wǎng)站的主要業(yè)務(wù)是基于關(guān)系數(shù)據(jù)庫開發(fā)的,但是關(guān)系數(shù)據(jù)庫對(duì)集群伸縮性的支持表較差 。通過在應(yīng)用程序的數(shù)據(jù)訪問層增加數(shù)據(jù)庫訪問的路由功能,根據(jù)業(yè)務(wù)配置將數(shù)據(jù)庫訪問路由到不同的物理數(shù)據(jù)庫上,可實(shí)現(xiàn)關(guān)系數(shù)據(jù)庫的分布式訪問 。
NoSQL數(shù)據(jù)庫目前各種NoSQL數(shù)據(jù)庫層出不窮,在內(nèi)存管理、數(shù)據(jù)模型、集群分布式管理等方面各有優(yōu)勢(shì),不過從社區(qū)活動(dòng)性角度看,HBase無疑是目前最好的 。
數(shù)據(jù)同步在支持全球范圍內(nèi)數(shù)據(jù)共享的分布式數(shù)據(jù)庫技術(shù)成熟之前,擁有多個(gè)數(shù)據(jù)中心的網(wǎng)站必須在多個(gè)數(shù)據(jù)中心之間進(jìn)行數(shù)據(jù)同步,以保證每個(gè)數(shù)據(jù)中心都擁有完整的數(shù)據(jù) 。在實(shí)踐中,為了減輕數(shù)據(jù)庫壓力,將數(shù)據(jù)庫的事物日志(或者NoSQL的寫操作Log)同步到其他數(shù)據(jù)中心,根據(jù)Log進(jìn)行數(shù)據(jù)重演,實(shí)現(xiàn)數(shù)據(jù)同步 。
5.后臺(tái)架構(gòu)網(wǎng)站應(yīng)用中,除了要處理用戶的實(shí)時(shí)訪問請(qǐng)求外,還有一些后臺(tái)非實(shí)時(shí)數(shù)據(jù)分析要處理 。
搜索引擎即使是網(wǎng)站內(nèi)部的搜索引擎,也需要進(jìn)行數(shù)據(jù)增量更新及全量更新、構(gòu)建索引等 。這些操作通過后臺(tái)系統(tǒng)定時(shí)執(zhí)行 。
數(shù)據(jù)倉庫根據(jù)離線數(shù)據(jù),提供數(shù)據(jù)分析與數(shù)據(jù)挖掘服務(wù) 。
推薦系統(tǒng)社交網(wǎng)站及購物網(wǎng)站通過挖掘人與人之間的關(guān)系,人和商品之間的關(guān)系,發(fā)展?jié)撛诘娜穗H關(guān)系和購物興趣,為用戶提供個(gè)性化推薦服務(wù) 。
6.數(shù)據(jù)采集與監(jiān)控監(jiān)控網(wǎng)站訪問情況與系統(tǒng)運(yùn)行情況,為網(wǎng)站運(yùn)營決策和運(yùn)維管理提供支持保障 。
瀏覽器數(shù)據(jù)采集通過在網(wǎng)站頁面中嵌入JS腳本采集用戶瀏覽器環(huán)境與操作記錄,分析用戶行為 。
服務(wù)器業(yè)務(wù)數(shù)據(jù)采集服務(wù)器業(yè)務(wù)數(shù)據(jù)包括兩種,一種是采集在服務(wù)器端記錄的用戶請(qǐng)求操作日志;一種是采集應(yīng)用程序運(yùn)行期業(yè)務(wù)數(shù)據(jù),比如待處理消息數(shù)目等 。
服務(wù)器性能數(shù)據(jù)采集采集服務(wù)器性能數(shù)據(jù),如系統(tǒng)負(fù)載、內(nèi)存使用率、網(wǎng)卡流量等 。
系統(tǒng)監(jiān)控將前述采集的數(shù)據(jù)以圖表的方式展示,以便運(yùn)營和運(yùn)維人員監(jiān)控網(wǎng)站運(yùn)行狀況,做到這一步僅僅是系統(tǒng)監(jiān)視 。更先進(jìn)的做法是根據(jù)采集的數(shù)據(jù)進(jìn)行自動(dòng)化運(yùn)維,自動(dòng)處理系統(tǒng)異常狀況,是吸納自動(dòng)化控制 。
系統(tǒng)報(bào)警如果采集來的數(shù)據(jù)超過預(yù)設(shè)的正常情況的閥值,比如系統(tǒng)負(fù)載過高,就通過郵件、短信、語音電話等方式發(fā)出警報(bào)信號(hào),等待工程師干預(yù) 。
7. 安全架構(gòu)保護(hù)網(wǎng)站免遭攻擊及敏感信息泄露 。
Web攻擊以HTTP請(qǐng)求的方式發(fā)起的攻擊,危害最大的就是XSS和SQL注入攻擊 。但是只要措施得當(dāng),這兩種攻擊都是比較容易防范的 。
數(shù)據(jù)保護(hù)敏感信息加密傳輸與存儲(chǔ),保護(hù)網(wǎng)站和用戶資產(chǎn) 。
8. 數(shù)據(jù)中心機(jī)房架構(gòu)大型網(wǎng)站需要的服務(wù)器規(guī)模數(shù)以十萬計(jì),機(jī)房物理架構(gòu)也需要關(guān)注 。
機(jī)房架構(gòu)對(duì)于一個(gè)擁有十萬臺(tái)服務(wù)器的大型網(wǎng)站,每臺(tái)服務(wù)器耗電(包括服務(wù)器本身耗電及空調(diào)耗電)每年大約需要人民幣2000元,那么網(wǎng)站每年機(jī)房電費(fèi)就需要兩億人民幣 。數(shù)據(jù)中心能耗問題日趨嚴(yán)重,Google、Facebook選擇數(shù)據(jù)中心地理位置的時(shí)候趨向選擇散熱良好,供電充裕的地方 。
機(jī)柜架構(gòu)包括機(jī)柜大小,網(wǎng)線布局、指示燈規(guī)格、不間斷電源、電壓規(guī)格(是48V直流電還是220V民用交流電)等一系列問題 。
服務(wù)器架構(gòu)大型網(wǎng)站由于服務(wù)器采購規(guī)模龐大,大都采用定制服務(wù)器的方式代替購買服務(wù)器整機(jī) 。根據(jù)網(wǎng)站應(yīng)用需求,定制硬盤、內(nèi)存、甚至CPU,同時(shí)去除不必要的外設(shè)接口(顯示器輸出接口,鼠標(biāo)、鍵盤輸入接口),并使空間結(jié)構(gòu)利于散熱 。

推薦閱讀