后端小程序的未來——Serverless
自從2014年AWS推出Lambda服務后,Serverless一詞越來越熱,已經成為一種新型的軟件設計架構,即Serverless Architecture。作為一種原生于公共云的架構,Serverless有什么優(yōu)缺點?是否能應用于傳統(tǒng)企業(yè)程序?是否適合私有云場景?是否像很多文章宣稱的一樣,會成為未來改變云計算的中堅力量?作為一名云計算行業(yè)的老兵,作者想在此文中分享一些自己的觀點。
一、什么是Serverless
Serverless并不神秘,用一個簡單的例子就可講明。我們設計了一個AI應用,可以識別出圖片中人物的人種,我們把它作為一種SaaS服務架設在公共云上提供給客戶使用,其典型的后端架構設計如下:

在該架構中,我們購買的云主機上運行了Tomcat Web Server,用于承載Java編寫的AI應用。用戶通過API上傳圖片。受限于云主機的本地存儲空間,為了滿足大量客戶同時上傳圖片,AI應用實現(xiàn)了一個存儲網關將圖片導入公共云的對象存儲。圖片導入完成后,AI應用從對象存儲讀入圖片進行識別,并將結果存入公共云的數據庫中(例如RDS) ,用戶使用API查詢結果。
AI應用上線一段時間后受到了用戶的歡迎,越來越多的公司開始使用該服務。根據統(tǒng)計數據,大多數公司在上午9點~11點、下午2點~5點集中上傳圖片,為了滿足該時間段的突發(fā)訪問量,我們設置了公共云的Auto-Scaling策略,在訪問增加時動態(tài)創(chuàng)建更多的云主機來響應客戶。AI應用的架構演化成:

(一) 在這個架構中,我們需要做如下事情:
1. 管理云主機。我們要關心CPU數量、內存大小、IP地址等等系統(tǒng)級的配置。同時還要關心云主機的操作系統(tǒng),為部署AI應用擬定策略。操作系統(tǒng)和Tomcat的安全補丁也不能忽視,否則競爭對手可能雇傭黑客來攻擊我們的系統(tǒng)。
2. 配置公共云的Auto-Scaling的策略,應對高峰期突發(fā)訪問量。
3. 使用公共云的對象存儲和數據庫。
4. 編寫AI應用。
要完成這些工作,我們既要開發(fā)AI應用,又要營運支撐業(yè)務(例如管理云主機生命周期、管理操作系統(tǒng)) 。這是當前架構的現(xiàn)實:為20%的核心業(yè)務營運80%的支撐業(yè)務。
(二) 下面用Serverless架構改寫AI應用:

使用公共云提供的Serverless框架(例如AWS的Lambda) 改寫應用后,我們不再需要云主機和Tomcat了。用戶也可以直接將圖片上傳到對象存儲,AI應用注冊了對象存儲的一組事件,當圖片上傳完成后,代碼會被觸發(fā)運行在一個全新的進程內,對圖像識別并將結果存入數據庫。圖片識別完后,AI應用退出,運行代碼的進程也隨之銷毀。當有多個用戶上傳圖片時,其架構變?yōu)椋?/p>

多個運行AI應用代碼的進程被啟動,并發(fā)處理用戶上傳的圖片。
在Serverless架構的AI應用中,我們只需要做兩件事情:
1. 使用公共云的對象存儲和數據庫。
2. 用公共云的Serverless框架編寫AI應用。
與之前的架構相比,我們不再營運云主機、操作系統(tǒng)、Tomcat,同時也不需要配置Auto-Scaling Group,公共云的Serverless框架會在每個圖片上傳完成后啟動一個進程運行AI應用,自動實現(xiàn)水平擴展。我們終于只需要關心核心業(yè)務了,用Serverless框架支持的語言(例如AWS Lambda就支持Javascript, Python和JVM系語言) 編寫AI應用,一切非核心業(yè)務都外包給了公共云營運商。
我們的Serverless AI應用用到了兩種技術。首先使用了公共云提供的對象存儲和數據庫服務,統(tǒng)稱為BaaS(Backend as a Service,后端即服務) 。其次用了Lambda框架,稱為FaaS(Functions as a Service,函數即服務) 。
使用BaaS和FaaS是Serverless應用的基本特征,符合這兩個基本特征的應用可稱為Serverless應用。
三、是BaaS,不是PaaS
AI應用用到了對象存儲和數據庫,將來或許還會用到消息隊列。直觀感覺是在使用PaaS,為什么還要造一個新詞BaaS?技術圈有太多令人混淆的術語了。
BaaS并非PaaS,它們的區(qū)別在于:PaaS需要參與應用的生命周期管理,BaaS則僅僅提供應用依賴的第三方服務。典型的PaaS平臺需要提供手段讓開發(fā)者部署和配置應用,例如自動將應用部署到Tomcat容器中,并管理應用的生命周期。BaaS不包含這些內容,BaaS只以API的方式提供應用依賴的后端服務,例如數據庫和對象存儲。BaaS可以是公共云服務商提供的,也可以是第三方廠商提供的,例如Facebook收購的Parse就是著名的MBaaS提供商(Mobile Backend as a Service) 。從功能上講,BaaS可以看作PaaS的一個子集,即提供第三方依賴組件的部分。
四、FaaS是Serverless的核心
AI應用最初是一個典型Java程序,它可能使用Spring這樣的技術,因為我們需要一個框架確保程序的各個組件能夠被正確加載,需要MVC來保證REST API被正確的Controller處理。AI應用部署在Tomcat容器中,運行在云主機上,7 x 24小時運行,我們提供不間斷的服務。在夜里12點到早晨8點,幾乎沒有用戶使用,但我們還得讓它待在那里,防止深夜偶爾使用的用戶得到一個503錯誤而誤會AI服務不穩(wěn)定。我們?yōu)橘徺I的云主機付錢,盡管一半的時間它的CPU使用率幾乎為0,但沒有公共云是按CPU使用率計費的,不工作的時間也得付錢。我們必須關心Auto-Scaling Group的配置,如何準確的配置Auto-Scaling策略是一個技術活,需要長期的經驗積累,在早期我們不得不多部署一些空閑的云主機以保證服務不會因Auto-Scaling的配置不當而擁塞。
用Serverless架構改寫了AI應用后,這些痛苦就通通消失了。Spring框架和Tomcat去掉了,用Lambda的Java SDK,只需要實現(xiàn)一個Function Handler處理圖片上傳完成這個事件,這跟寫一個Callback一樣簡單。在Function Handler中調用圖片識別的相關邏輯,然后調用數據庫的REST API存儲結果。也不用構建MVC,不用配置Tomcat的XML文件,我們將存儲網關這個功能完全去除掉了,因為用戶可以直接上傳圖片到對象存儲。
AI應用不用7 x 24小時運行了,沒有用戶上傳圖片時它只是一份編譯好的代碼。當用戶圖片上傳完成時,F(xiàn)aaS會為AI應用啟動一個新的進程執(zhí)行代碼。該進程在代碼執(zhí)行完成后自動銷毀。我們只需為代碼執(zhí)行的這幾十秒鐘付錢,節(jié)省了很多開支。
最后我們無需操心Auto-Scaling的問題,F(xiàn)aaS會在需要的時候自動擴展。
這些就是FaaS的核心,從上面的例子里面可以歸納出它的特點:
1. FaaS運行的是后端代碼而不是整個后端程序。例如AI應用僅僅包含處理圖片上傳完成這個事件的邏輯,并不是一個完整的后端程序,而是一段后端代碼。
2. 代碼通過事件觸發(fā)。由于不再有一個長期運行的進程等待或輪詢用戶請求,代碼只能通過特殊的事件觸發(fā)。這些事件由FaaS框架定義,例如上傳文件到對象存儲、消息隊列收到一條新的消息、API Gateway收到一個新的API請求等。
3. 代碼的生命周期很短。例如我們的AI應用,從收到事件后Function Handler被調用開始,到調用返回結束,不會有常駐內存的進程運行。此外公共云提供商還會限制代碼執(zhí)行的時間,超出時間后執(zhí)行代碼的進程會被強行銷毀。例如AWS的Lambda可執(zhí)行的最長時間為5分鐘。
4. 代碼必須做到徹底無狀態(tài),兩次調用間不能共享內存狀態(tài)。我們的AI應用最早使用了一個全局變量統(tǒng)計處理的圖片數,每處理完一張圖片該計數器就加一。使用FaaS后我們不能再用任何全局變量或內存數據結構(例如Hashmap) 在調用間共享數據,因為代碼運行在獨立的進程中,無法訪問對方的內存地址空間。于是我們對代碼進行了改造,將全局計數器放到了公共云的Redis服務中,這為代碼增加了額外的復雜性。
5. 水平擴展不再是需要擔心的問題,F(xiàn)aaS會為每個事件和請求運行一份新的代碼。
6. 應用的部署方式從上傳、配置整個程序變成上傳一份打包代碼的文件(例如Jar文件或一個Zip文件) 。
五、Serverless為我們帶來了什么
對比傳統(tǒng)架構,用Serverless架構改寫的AI應用具有顯著的優(yōu)勢。我們不再運維任何云主機和操作系統(tǒng),甚至不再運維Tomcat這樣的Web容器,只需要專注于代碼本身,所有配置、應用生命周期管理的工作都由FaaS框架負責。公共云的出現(xiàn)讓我們從物理硬件管理中解放出來,Serverless架構讓我們進一步從操作系統(tǒng)管理中解放出來,第一次真正專注于核心業(yè)務。
業(yè)務也變得更加敏捷了。我們只需要編寫核心業(yè)務相關的代碼,例如AI應用中圖像識別的部分。無需編寫任何加載、部署、配置應用的代碼,例如不再需要配置systemd在系統(tǒng)啟動時加載應用。
水平擴展也不是問題。正如前面反復提及的,F(xiàn)aaS框架會為每一個事件、每一個API請求都啟動一份新的進程執(zhí)行代碼。這跟傳統(tǒng)應用的線程池方式類似,每個請求都在一個單獨的線程中執(zhí)行,區(qū)別在于線程之間共享同一內存地址空間,F(xiàn)aaS的進程間不共享任何內存。與線程池有最大線程數限制類似,F(xiàn)aaS框架通常也限制了最大進程數,例如AWS Lambda在一個Region默認能執(zhí)行的最大并發(fā)調用是600,也就是說我們的AI應用最多能在600個進程中同時執(zhí)行。
最后,也是最重要的,Serverless架構為我們節(jié)省了大量開支。我們只需為AI應用運行的時間付錢,無需為應用等待請求的時間付錢。水平擴展的粒度從原來的云主機細化到進程,節(jié)省了額外的開支,不用再購買閑置的云主機來抵消Auto-Scaling的配置不精確帶來的影響。業(yè)務的敏捷性提高也降低了營運成本,我們不再需要精通操作系統(tǒng)配置和管理的營運人員,不僅節(jié)省了人力成本,也節(jié)省了應用從開發(fā)到上線的時間。
六、Serverless不是銀子彈,是后端小程序的未來
Serverless架構在某些應用場景的優(yōu)勢如此明顯,有些支持者已經開始炒作它會成為顛覆性的云計算新架構了。技術圈向來如此,一些人總在孜孜不倦的尋找包治百病的靈藥,和解決一切問題的銀子彈。“All design is about tradeoff”,Serverless也不是銀子彈,它有獨特的優(yōu)勢,而這些優(yōu)勢也帶來了不可避免的局限。
為每個事件/請求啟動一個全新的進程運行代碼是FaaS的核心,進程的啟動延時是Serverless面臨的第一個問題。取決于編寫應用的語言,啟動延時可以是10毫秒(如簡單的Python應用) ,也可以是1分鐘(復雜的Java應用) 。這樣的延時對于realtime的程序是難以接受的。目前Serverless應用通常運行在公共云的多租戶環(huán)境中,啟動延時還受系統(tǒng)負載影響,很難保證應用在規(guī)定時間內被運行。公共云提供商目前沒有對Serverless提供相應的SLA保證,筆者寫這篇文章的時候,AWS Lambda還沒有相關的SLA條款。
Serverless無法用于高并發(fā)應用,為每個請求啟動一個進程開銷太高。例如雙十一支付寶高峰期每秒處理的交易數為8.59萬筆,如果使用Serverless架構,意味著我們的系統(tǒng)內每秒有8.59萬個進程被創(chuàng)建又被銷毀,這是難以負擔的開銷。
Serverless應用無法常駐內存,運行的時間是受限的。如果你的應用無法在數分鐘內完成的工作,那Serverless不是你的選擇,例如AWS Lambda給予進程的最長運行時間是5分鐘,超時后進程將被強制終止。這對程序設計提出了挑戰(zhàn),例如我們的AI應用必須優(yōu)化到在5分鐘內完成復雜圖像的識別。我們也不能編寫執(zhí)行長時間IO操作的應用,例如對對象存儲中1T的數據進行復雜編碼。
Serverless調用之間不能共享狀態(tài)讓編寫復雜程序變得極度困難。無狀態(tài)是互連網應用追求的目標,例如滿足“12要素”的應用。但Serverless將無狀態(tài)進行的更加徹底,在不同的調用之間無法共享內存狀態(tài),例如使用hashmap。我們的AI應用中統(tǒng)計已處理圖片總數的全局計數器在傳統(tǒng)架構中只是一個全局變量,但在Serverless架構中它變成存儲在內存數據庫(Redis) 中的一條記錄,更新成本、保證原子性等因素讓我們的編碼變得數倍復雜。對于大多云原生的互聯(lián)網應用來說,這種徹底的無狀態(tài)架構是一個巨大的挑戰(zhàn),而對于動輒有幾十萬、上百萬行代碼的、充滿了狀態(tài)的企業(yè)應用來說,Serverless的無狀態(tài)改造幾乎是一個無法完成的任務。
熟練的微服務的架構師,對將業(yè)務拆分成一個個單獨的服務非常熟悉,也有不少的經典書籍(例如《Building Microservices: Designing Fine-Grained Systems》) 指導我們如何做。但即使是他們,在面對Serverless架構時也會感到頭痛,如何將業(yè)務拆分成成百上千個運行在獨立進程、運行時間受限的函數是巨大的挑戰(zhàn)。而是否需要如此細粒度的拆分是需要回答的第一個問題。有些問題或許變成無解難題又或成本極高,例如分布式數據庫事務。
上面都是Serverless架構的一些固有局限,它們源于Serverless架構的特點,很難隨著時間的推移、技術的完善而解決。除此之外,作為一個新的技術,Serverless還面臨著集成測試困難、Vendor Lock-in、調試監(jiān)控困難、版本控制等諸多不足,每一項都會成為采用Serverless架構的阻礙。
由于這些局限性,Serverless架構不會成為復雜應用的架構首選,相反,它應該是后端小程序的未來。
云端的應用有大量的小程序場景,例如識別一張圖片、對一段音頻/視頻進行編解碼、對IOT設備的請求返回一小段數據、將客戶提交的工單通過郵件通知客服人員等等。這些基于事件觸發(fā)的小程序在傳統(tǒng)架構中實現(xiàn)起來是相對復雜的,你往往需要為20%的核心業(yè)務運營80%的支撐業(yè)務。Serverless完美的解決了這些問題,它可以成為復雜應用的一種補充架構。我們可以將無狀態(tài)的、事件觸發(fā)的業(yè)務拆分成Serverless應用,讓整個架構變得更加的簡潔和高效。
Serverless也在不斷演變,例如AWS最近引入的Step Functions就嘗試解決調用間共享狀態(tài)的問題,其效果有待觀察。
七、Serverless不是傳統(tǒng)的PaaS
Serverless跟PaaS之間的界線比較模糊,很多人認為Serverless是PaaS的一種,筆者也傾向于認為Serverless是特殊的PaaS形態(tài)。
Serverless由BaaS和FaaS兩部分構成,BaaS負責提供業(yè)務的依賴服務,F(xiàn)aaS負責業(yè)務的部署和生命周期管理,從這個意義上來看,Serverless的角色跟PaaS一樣。與傳統(tǒng)PaaS的區(qū)別在于,傳統(tǒng)PaaS是以程序為粒度管理應用的生命周期,而Serverless是以函數粒度管理應用生命周期。傳統(tǒng)PaaS中的應用為常駐內存的進程,而Serverless應用運行完即銷毀。此外,使用傳統(tǒng)PaaS,用戶仍需要關心水平擴展,例如如何配置Auto-Scaling Group,但Serverless沒有這個問題,水平擴展是架構天然自帶的功能。
八、Serverless和微服務
Serverless和微服務沒有直接關系,但兩者有相似之處,例如都需要做業(yè)務拆分、強調無狀態(tài)、具有敏捷特性等。Serverless在很多方面比微服務粒度更細,要求也更嚴格。例如微服務以服務為邊界拆分業(yè)務,Serverless以函數為邊界拆分業(yè)務;微服務可以有跨調用的內存狀態(tài)共享,Serverless要求調用徹底無狀態(tài)。此外,Serverless依賴BaaS提供第三方依賴,而微服務可以自由選擇第三方依賴來源,例如使用本地搭建的傳統(tǒng)中間件棧(如本地MySql和消息總線) 。
九、Serverless和容器
Serverless和容器是蘋果和桔子的比較,不在一個平面上。Serverless是一種軟件設計架構,容器是軟件架構的承載者。雖然沒有公開資料,但我們可以推測類似于AWS Lambda這樣的Serverless框架使用了某種程度的容器技術,否者難以實現(xiàn)語言無關和毫秒級的啟動。盡管已經有一些開源項目使用Docker實現(xiàn)Serverless中的FaaS部分,筆者不認為AWS Lambda這樣的公共Serverless框架直接使用了Docker,一定是一種更為輕量級、體積更小的容器技術,我們或許可以將它稱為Nano-Container。
十、Serverless對私有云有意義嗎?
對于私有云來說,現(xiàn)在將業(yè)務遷往Serverless架構還為時過早。首先Serverless是從公共云中演化出來的新型架構,適用于運行在公共云上的小程序。而私有云更多承載的是老而笨重的傳統(tǒng)業(yè)務,難以用Serverless架構改造。其次Serverless依賴BaaS,在私有云中搭建和運維BaaS成本都不低,使用公共BaaS服務又受限于網絡帶寬和延時,容易導致系統(tǒng)不穩(wěn)定。
隨著企業(yè)應用的進一步云化、開源Serverless框架的成熟,私有云的Devops場景也可以采用Serverless作CI/CD,例如目前Jenkins承擔的大部分工作都可以用Serverless替代,如用FaaS框架對應Jenkins本身,上傳的代碼對應Jenkins Job中的Bash腳本,將原來的Jenkins API觸發(fā)Job改為觸發(fā)FaaS中的代碼。
十一、Serverless總結
Serverless作為一種全新的架構,是云計算發(fā)展演化的必然結果。追求更細粒度的計費單元,更加專注于核心業(yè)務、將支撐業(yè)務外包給基礎設施提供商是云計算的趨勢。Serverless架構的特點,讓編寫事件觸發(fā)的后端小程序變得更加容易。同時它也有自身內在的局限性,并不適合復雜的應用架構。從目前的情況看,部分采用Serverless的混合架構對公共云應用是個不錯的選擇,私有應用采用Serverless還為時過早。云計算技術正在飛速發(fā)展,未來還有無限可能。
第二部分:如何開通一個小商店