新聞中心
???

創(chuàng)新互聯(lián)專注于克拉瑪依網(wǎng)站建設(shè)服務(wù)及定制,我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗。 熱誠為您提供克拉瑪依營銷型網(wǎng)站建設(shè),克拉瑪依網(wǎng)站制作、克拉瑪依網(wǎng)頁設(shè)計、克拉瑪依網(wǎng)站官網(wǎng)定制、成都微信小程序服務(wù),打造克拉瑪依網(wǎng)絡(luò)公司原創(chuàng)品牌,更為您提供克拉瑪依網(wǎng)站排名全網(wǎng)營銷落地服務(wù)。
【稿件】西安一碼通不到一個月就崩潰兩次,雖然說在實際項目和線上運行時系統(tǒng)崩潰是很有可能遇到的問題,但是如此大規(guī)模的,而且還是短時間內(nèi)兩次大規(guī)模崩潰,著實少見。那么如果回到未來,該怎么設(shè)計一碼通來降低崩潰的情況呢?下面從技術(shù)和業(yè)務(wù)兩方面來談?wù)勔淮a通的設(shè)計。
一、崩潰的原因分析
因為這兩次崩潰的模塊只是掃碼和亮碼,因此我們來分析一下這兩個模塊的業(yè)務(wù)。掃碼和亮碼功能類似,都是典型的查詢大于更新的業(yè)務(wù),大部分流量都來自于查詢。下面我們來看看一碼通在不同版本的發(fā)展。
第一版的一碼通只展示個人身份證號、姓名和碼的顏色。這三個字段有可能是存儲于一個表中,使用一條 SQL 就能查出來。但是作為一個上萬人使用的系統(tǒng),不可能所有數(shù)據(jù)存在于一張表中,因此身份證號和姓名極有可能存儲在一張表里,碼的顏色在另一張表中,因此這里很有可能最少存在一條 join 連接。
到了第二版和第三版一碼通做了很大的改變,首先是新增了疫苗接種信息,其次又新增了核酸檢測信息,展示核酸檢測的時間和結(jié)果。這就增加了兩個查詢,如果一碼通在不考慮使用緩存,只是用關(guān)系數(shù)據(jù)庫的情況下,那么就有可能增加最少兩個 SQL 查詢。
以上就是一碼通掃碼和亮碼兩個模塊大致的業(yè)務(wù)情況。這個業(yè)務(wù)所需要面對的是最高百萬級別的并發(fā)量(西安人口一千多萬),這種級別的并發(fā)量在互聯(lián)網(wǎng)公司就是日常的并發(fā)量。那么它怎么就崩了呢?在官方的消息中有這么兩段話(只截取里面關(guān)鍵部分):
1. 西安一碼通用戶訪問量激增,每秒訪問量達(dá)到以往峰值的10倍以上,造成網(wǎng)絡(luò)擁塞;
2. 判斷問題出現(xiàn)在網(wǎng)絡(luò)接口側(cè)。
由此可以判斷是網(wǎng)絡(luò)出現(xiàn)了問題。一般來說用戶的請求,先訪問域名,然后通過 DNS 服務(wù)器解析拿到 IP ,通過 IP 訪問到服務(wù)器,最后服務(wù)器將響應(yīng)結(jié)果返回給客戶端。本次的故障就出現(xiàn)在通過 IP 訪問服務(wù)器階段。因為網(wǎng)絡(luò)擁塞,因此可以直接增加帶寬,但當(dāng)系統(tǒng)恢復(fù)時,西安的小伙伴都發(fā)現(xiàn)一碼通回滾到了第一版,而且在一碼通的首頁新增加了核酸查詢頁面的鏈接,因此出現(xiàn)崩潰很有可能不只是帶寬的問題。這應(yīng)該是外部請求的數(shù)量超過了系統(tǒng)最大處理能力造成的問題。
一般來說,產(chǎn)生這種問題的原因無非就是系統(tǒng)架構(gòu)的問題,解決這個問題有兩種方法,擴容和限流:
1. 在請求達(dá)到承載的頂峰時,讓后續(xù)所有請求等待,進行限流。限流方案很多,最簡單的方式是使用 Nginx,如果效果不理想的話可以自定義算法在接入層限流。限流不能完全解決問題,只會阻擋部分請求。
2. 通過增加服務(wù)器數(shù)量、增加數(shù)據(jù)庫數(shù)量來提升系統(tǒng)的承載能力,這個是擴容。因為一碼通在出現(xiàn)問題后進行了回滾,并沒有進行擴容。因此大概率他們在系統(tǒng)架構(gòu)設(shè)計上并沒有考慮擴容問題,因此擴容這個方案對于系統(tǒng)架構(gòu)來說可能很難。
二、崩潰的解決方案
如果要解決上一小節(jié)的問題,可以從三個方面來解決。
1. 采用讀寫分離
將一碼通業(yè)務(wù)按照訪問頻率進行拆分:常用模塊和非常用模塊。常用模塊流量較大,將“讀”單獨處理出來,在數(shù)據(jù)庫前端加入緩存中間件,優(yōu)先讀取緩存中的信息,這樣即使數(shù)據(jù)庫掛了,業(yè)務(wù)系統(tǒng)也能從緩存中讀取數(shù)據(jù)。非常用模塊流量較小,比如核酸信息和疫苗接種信息的更新,直接對數(shù)據(jù)庫進行操作。
2. 分庫分表和服務(wù)拆分
利用用戶 ID 取模后的值確定需要拆分成多少個庫或表,每個庫或表對應(yīng)一個或多個服務(wù)子系統(tǒng),接口將流量分配到不同的服務(wù)子系統(tǒng)上,這樣就減輕了單庫或單表以及服務(wù)系統(tǒng)的壓力,并且也能在流量暴增的時候快速地進行擴容。
3. 容災(zāi)備份
使用異地多機房部署服務(wù),提前做好的容災(zāi)備份方案,避免出現(xiàn)前述的問題。
總結(jié)
西安一碼通明顯是在系統(tǒng)沒有嚴(yán)格測試的情況下,就發(fā)布到了生產(chǎn)環(huán)境,并發(fā)一高就崩潰。本文所述的這些問題只是根據(jù)目前可見的情況進行的分析,所提出的解決方案也是比較常見的解決方案。但是根據(jù)這些解決方案幾乎可以處理掉西安一碼通崩潰的問題。
作者介紹
朱鋼,社區(qū)編輯,2019年CSDN博客專家20強,2020年騰訊云+社區(qū)優(yōu)秀作者,10年一線開發(fā)經(jīng)驗,曾參與獵頭服務(wù)網(wǎng)站架構(gòu)設(shè)計,企業(yè)智能客服以及大型電子政務(wù)系統(tǒng)開發(fā),主導(dǎo)某大型央企內(nèi)部防泄密和電子文檔安全監(jiān)控系統(tǒng)的建設(shè),目前在BIM頭部企業(yè)從事招投標(biāo)軟件開發(fā)。
【原創(chuàng)稿件,合作站點轉(zhuǎn)載請注明原文作者和出處為】
網(wǎng)站標(biāo)題:回到未來,如何避免西安一碼通崩潰
分享網(wǎng)址:http://www.fisionsoft.com.cn/article/djgdjhp.html


咨詢
建站咨詢
