本篇文章是個經驗談,作者想要聊聊是如何將一個 4vCPU 的VM給調整到可以達到每秒處理 1.2M(120萬)個 JSON Reuqest,本篇文章非常的長,所以會分多天來介紹。
整篇文章探討的是各種 turning 的步驟,來聊聊如何從最初每秒 224k(22萬四千) 給調整到每秒 1.2M 的處理能力。
整個過程分成九大步驟,後面同時標示每個過程後的每秒請求能力
1. Application Optimizations (347k)
2. Speculative Execution Migtigations (446k)
3. Syscall Auditing/Blocking (495k)
4. Disabling iptables/netfilter (603k)
5. Perfect Locality (834k)
6. Interrypt Optimizations (1.06M)
7. The Case of the Nosy Neighbor (1.12M)
8. The Battle Against the Spin Lock (1.15M)
9. This Gost to Twelv (1.20M)
作者強調,上述的過程不一定適合你的應用程式,但是透過這些步驟能夠讓你更佳瞭解應用程式的運作行為,同時也有機會發現一些潛在的瓶頸問題。
環境介紹
1. 團隊使用 Techempower 來進行 JSON Serialization 的測試
2. 使用 libreactor(event-driven框架) 來搭建一個簡單的 API Server
3. HTTP 的解析使用 picohttpparser,同時使用 libclo 來處理 JSON 的編碼
4. 硬體環境
- Server: 4 vCPU, c5n.xlarge AWS VM
- Client: 16 vCPU, c5n.4xlarge AWS VM (clinet太弱會變成瓶頸)
- Network: Server/Client 屬於同一個可用區域(AZ)
5. 軟體環境
- 作業系統: Amazon Linux2 (Kernel 4.14)
- Server: 使用 libreactor (使用不同版本,分別是 Round18 以及 Round20)
- Client: 修改 wrk 這個知名的工具並重新命名為 twrk,詳細差異自己看文章內部,主要都跟顯示有關
6. 實驗方式
- 每個測試跑三次,取中間值
- 256 連線,16 threads,同時每個 thread 都會 pin 到一個固定的 CPU
- 每個實驗都有兩秒的暖機時間來建立連線
Ground Zero
第一個要探討的就是什麼最佳化都還沒有使用前,到底當前應用程式可能的瓶頸在哪裏
首先團隊將該應用程式與其他常見的應用程式或是開發框架比較,譬如 Netty, Nginx, Actix, aspcore 等, libreactor 的效能不錯,有中上水準。
接者作者使用火焰圖(Flame Graphs)來 Profile 該伺服器,作者很好心地將文章中所有的火焰圖都調整了一下,讓所有的 user-space 相關的 function call 都轉成藍色,而剩下跟 kernel 相關都維持紅色。
1. 大部分的時間都在 Kernel 處理
2. 主要是花費在收封包與送封包
3. 應用程式本身主要是分兩大部分,解析 HTTP 的封包以及處理請求與回應。
從上述兩點來看,作者認為目前的應用程式寫得算不錯,因為瓶頸很明顯是卡在 Kernel 端
接下來就正式進入到各種 Turning 的章節探討
Application Optimizations
長話短說:
- 作者基於 libreactor Round18 的框架進行修改,並且所有的修改都已經被合併到 Round20 的版本中,而這些修改主要是實作方面的強化以及整個框架的最佳化。
1. 作者首先透過 htop 觀察運行過程,發現 Server 只有使用 2vCPU 而已(系統有 4vCPU),因此這是作者進行的第一個修改,讓 Server 使用了 4vCPU,這個簡單調整就讓效能提升 25%
註: 作者特別強調,不要覺得從 2vCPU 變成 4vCPU 效能就可以變成兩倍,主要是1) 沒有使用的 vCPU 還有很多其他的工作要處理,因此不是完全都送給你應用程式處理。2)基於 hypter-thread vCPU 的架構,環境只有兩個真正的 CPU 而是透過邏輯的方式產生四個抽象的 CPU,所以全用一定會變快,但是基於很多資源還是要競爭與共用,數字不是單純翻倍
2. 作者自己的應用程式本身使用 gcc 建置時有使用 "-o3" 的方式來最佳化處理,然而框架本身卻沒有使用 "-o3" 的方式來弄,因此作者也針對這個部分來處理,讓建制框架時能夠使用 -o3
3. 從實作方面來看,作者觀察到 libreactor 1.0 版本使用的是 read/write 這兩個常見的方式來處理封包的送收,作者將其修改成 recv/send 整個效能就提升了將近 10%。
註: write(針對 FD,更全面廣泛的用法) 與 send(針對 Socket,更針對的用法) 使用上差異不大,但是 write 於底層 Kernel 最終還是會呼叫到 send 來處理,所以基本上可以理解就是在沒有特別參數需求時,可以直接跳過幾個 kernel function 來達到加速的效果。
write kernel 內的走向: sys_write -> vfs_write -> __vfs_write -> sock_write_iter -> sock_sendmsg
send kernel 內的走向: sendto -> sock_sendmsg
4. 作者觀察到火焰圖中有一些 pthread 相關的資料,進而發現 libreactor 會創造一個 thread pool 來處理非同步的 DNS 名稱解析問題。對於一個 HTTP Client 來說,如果今天要發送請求到多個不同的 domain,而每個 domain 都會需要進行一個 blocking 的解析過程,透過這種方式可以減少 DNS 解析造成的 blocking 問題。然而對於 HTTP Server 來說,這個使用情境帶來的效益似乎就稍微低了些,畢竟 Server 只有 Bind Socket 之前可能會需要去解析一次 DNS 而已。
大部分的情境下, thread pool 都是應用程式初期會去創造而接者就不太會管她,但是對於錙銖必較的效能除錯人來說,任何能夠調整的部分都可能是個值得探討的地方。
作者透過修改 Server 端(準確來說是 libreactor 框架內的程式碼)關於 Thread Pool 的一些用法,成長的讓整個效能提升了 2~3%
結論來說,透過上述四個概念來提升的程式碼效能。
1. vCPU 盡量使用: 25%-27%
2. 使用 gcc -O3 來建置框架的程式碼: 5%-10%
3. 使用 march=native 等參數來建置最後的 server 應用程式: 5%-10%
4. 使用 send/recv 而非 write/read: 5%-10%
5. 修改 pthread 的用法: 2%-3%
註: 作者強調每個最佳化的結果並非是單純累積的概念,反而還會有互補的效果。
可能前述的操作實際上也會讓後續的操作達到更好的效果,
譬如如果先跑 vCPU 的調整,效能大概提升 25%,但是如果先執行別的最佳化過程,最後再來調整 vCPU,就可以達到 40% 的效果,主要是 CPU 可以共有效率的去執行程式。
最後,這個部分讓整個處理封包能力從 224k 提升了 55% 到 347k (req/s)。
從火焰圖來看,整個 user-space 的範圍縮小許多,同時 send/recv 的處理也有使得整體的高度下降一點點(大概四格..)
為了避免文章過長,本篇文章就探討第一個最佳化的過程,剩下的就敬請期待後續!
https://talawah.io/blog/extreme-http-performance-tuning-one-point-two-million/
同時也有7部Youtube影片,追蹤數超過21萬的網紅堯Live,也在其Youtube影片中提到,各位一定要來找我喔! 【Freedom! Party實況園遊會】報名連結:http://www.accupass.com/go/freedomparty 報名方式,請點上面報名連結,就可以立即報名拿票!限量是殘酷的!!場地關係只有開放2700位名額!快來實況園遊會,和40名知名頻道主相見歡吧!! ...
「threads是什麼」的推薦目錄:
- 關於threads是什麼 在 矽谷牛的耕田筆記 Facebook 的最讚貼文
- 關於threads是什麼 在 艸文子 Facebook 的最佳解答
- 關於threads是什麼 在 大詩人的寂寞投資筆記 Facebook 的最佳貼文
- 關於threads是什麼 在 堯Live Youtube 的最佳解答
- 關於threads是什麼 在 Franck Youtube 的最佳貼文
- 關於threads是什麼 在 七年級大叔 Youtube 的最佳解答
- 關於threads是什麼 在 電腦的核心(Core) 和執行緒(Thread) 的評價
- 關於threads是什麼 在 【CPU】什么是CPU的核心(Core)和线程(Thread)? 的評價
threads是什麼 在 艸文子 Facebook 的最佳解答
Participate in @kathrin49 's new project「stitch for home」
To me, home is a place that open it's arms and hug you any where and any time. It embrace all states of you.
Home may be a space that belongs to you, or someone loves you unconditionally, or your own full and firm will.
I choose a cloth with a pocket on it. The square cloth and square pocket look like the Chinese character ”回” which means “go back”and relates to “go home”. I collected all the threads others left on desk in pocket. they look like blood vessels in backlight, make me think of uterus, a home that all of us came from.
-
參與立晴阿嬤的集體創作
主題是 #家的意涵
我覺得家是一個無論何時何地都會張開雙擁抱你的所在,就算闖了禍或整個人一團糟,它都會包容你所有的樣子
那個家或許是完完全全屬於你的地方、是無條件愛著你的人,也或許是自己飽滿堅定的意志
創作方式是在白布上用紅線縫出「家對你來說是什麼意思」,各國的成品會共同展示在Kathrin阿嬤的家鄉瑞士,在一棟小房子的裝置作品裡
那天剛好有一件有口袋的衣服,方形的布和口袋就是一個「回」字,我把桌上大家剩餘的縫線放到口袋裡,收納了每個人一部分的家。
在背光的時候,紅線好像血管,讓我想到了子宮,我們每個人最一開始的家。
#art #stitch #home #家 #gohome #回家 @ 臺灣大學藝文中心
threads是什麼 在 大詩人的寂寞投資筆記 Facebook 的最佳貼文
「再比如做衣服用的纖維,也可以用這種方式去生產,做一些人造地毯。甚至蜘蛛絲也能拿來做衣服。
蜘蛛絲是一種非常好的材料,幾乎是最堅韌的材料,尤其蜘蛛網主絲,強度可以達到鋼筋的六倍。這是什麼概念呢?
你別看我們平時輕易地就可以拉斷蜘蛛網,蜘蛛網上每條線的直徑只有千分之三毫米。我們只要把這個直徑擴展到超過一毫米,一張蜘蛛網可以像捕捉蒼蠅一樣,捕捉住一架直升機。
現在有一家公司(Bolt Threads),他們用酵母來合成蛛絲。這種蛛絲不光能做普通的衣服,還能做防彈衣。
不過,你聽說過養蠶得到蠶絲,製作絲綢。但肯定沒聽說過,養蜘蛛,拿蜘蛛絲做衣服吧?為什麼沒人這麼乾呢?
因為蛛絲是不可能靠養蜘蛛獲得的,自然界里的蜘蛛,不能群居,也不能家養。你把一窩小蜘蛛放在一起孵化,結局是互相搏鬥,你死我活。就算是能獲得一些蛛絲,產量也非常低,不可能做成商品。
但我們換一種生產方式,這些自然的規則就不會成為限制了。
這家公司現在也和戶外品牌合作,做衝鋒衣,你在他們的官網上可以買到蜘蛛絲做成的領帶。Adidas和德國一家類似的公司(AMSilk)合作,製造了蜘蛛絲運動鞋,也快上市了。」
https://www.ljsw.io/knowl/article/y0.html
threads是什麼 在 堯Live Youtube 的最佳解答
各位一定要來找我喔!
【Freedom! Party實況園遊會】報名連結:http://www.accupass.com/go/freedomparty
報名方式,請點上面報名連結,就可以立即報名拿票!限量是殘酷的!!場地關係只有開放2700位名額!快來實況園遊會,和40名知名頻道主相見歡吧!!
實況園遊會購票方式教學:https://www.youtube.com/edit?o=U&video_id=1QSYQA0NGJk
Freedom!聯播網今年在台灣舉辦實況園遊會! 實況園遊會是什麼呢?
http://community.gamers.tm/zh/index.php?threads/freedom-party.27074/
Freedom!這次園遊會的目的,讓粉絲除了能親臨現場觀看自己支持的實況主現場實況外,也能達到「實況主見面會」、「粉絲見面會」,實況主與粉絲面對面互動交流的目的。
當然,由於是你們的力量,我們也力邀各大廠商一同參與。(這樣才有一些福利好康嘛XD)
當然,有任何問題,也歡迎到實況咖上討論吧:)
這是為您們專屬建立的!
活動時間:2015/7/24~2015/7/26
活動地點:青少年發展處10F - 花漾展演空間
活動地址:台北市仁愛路一段17號
threads是什麼 在 Franck Youtube 的最佳貼文
【Freedom! Party實況園遊會】報名連結:http://www.accupass.com/go/freedomparty
報名方式,請點上面報名連結,就可以立即報名拿票!限量是殘酷的!!場地關係只有開放2700位名額!快來實況園遊會,和40名知名頻道主相見歡吧!!
實況園遊會購票方式教學:https://www.youtube.com/watch?v=1QSYQA0NGJk&feature=youtu.be
Freedom!聯播網今年在台灣舉辦實況園遊會! 實況園遊會是什麼呢?
http://community.gamers.tm/zh/index.php?threads/freedom-party.27074/
Freedom!這次園遊會的目的,讓粉絲除了能親臨現場觀看自己支持的實況主現場實況外,也能達到「實況主見面會」、「粉絲見面會」,實況主與粉絲面對面互動交流的目的。
當然,由於是你們的力量,我們也力邀各大廠商一同參與。(這樣才有一些福利好康嘛XD)
當然,有任何問題,也歡迎到實況咖上討論吧:)
這是為您們專屬建立的!
活動時間:2015/7/24~2015/7/26
活動地點:青少年發展處10F - 花漾展演空間
活動地址:台北市仁愛路一段17號
threads是什麼 在 七年級大叔 Youtube 的最佳解答
【Freedom! Party實況園遊會】報名連結:http://www.accupass.com/go/freedomparty
報名方式,請點上面報名連結,就可以立即報名拿票!限量是殘酷的!!場地關係只有開放2700位名額!快來實況園遊會,和40名知名頻道主相見歡吧!!
實況園遊會購票方式教學:https://www.youtube.com/edit?o=U&video_id=1QSYQA0NGJk
Freedom!聯播網今年在台灣舉辦實況園遊會! 實況園遊會是什麼呢?
http://community.gamers.tm/zh/index.php?threads/freedom-party.27074/
Freedom!這次園遊會的目的,讓粉絲除了能親臨現場觀看自己支持的實況主現場實況外,也能達到「實況主見面會」、「粉絲見面會」,實況主與粉絲面對面互動交流的目的。
當然,由於是你們的力量,我們也力邀各大廠商一同參與。(這樣才有一些福利好康嘛XD)
當然,有任何問題,也歡迎到實況咖上討論吧:)
這是為您們專屬建立的!
活動時間:2015/7/24~2015/7/26
活動地點:青少年發展處10F - 花漾展演空間
活動地址:台北市仁愛路一段17號
threads是什麼 在 【CPU】什么是CPU的核心(Core)和线程(Thread)? 的推薦與評價
经常会听到新推出的处理器有多少核心又有多少线程,但是却不知道这到底 是什么 玩意。看完这个影片你就会了解到底核心和线程 是什么 。 ... <看更多>
threads是什麼 在 電腦的核心(Core) 和執行緒(Thread) 的推薦與評價
核心就是封裝在積體電路(IC) 中的處理器。而多核心就是多核處理器(Multi-core processor),是物理上實體存在的。例如:2 核心就是有2 個獨立實體處理 ... ... <看更多>