在傳統(tǒng)的文件傳輸里面(read/write方式),在實現(xiàn)上事實上是比較復雜的,須要經(jīng)過多次上下文的切換,我們看一下例如以下兩行代碼:
- read(file,?tmp_buf,?len);??????
- ???????write(socket,?tmp_buf,?len);??????
??????? 以上兩行代碼是傳統(tǒng)的read/write方式進行文件到socket的傳輸。
當須要對一個文件進行傳輸?shù)臅r候,其詳細流程細節(jié)例如以下:
1、調(diào)用read函數(shù),文件數(shù)據(jù)被copy到內(nèi)核緩沖區(qū)
2、read函數(shù)返回,文件數(shù)據(jù)從內(nèi)核緩沖區(qū)copy到用戶緩沖區(qū)
3、write函數(shù)調(diào)用,將文件數(shù)據(jù)從用戶緩沖區(qū)copy到內(nèi)核與socket相關(guān)的緩沖區(qū)。
4、數(shù)據(jù)從socket緩沖區(qū)copy到相關(guān)協(xié)議引擎。
一般來說一個網(wǎng)絡(luò)應用是通過讀硬盤數(shù)據(jù),然后寫數(shù)據(jù)到 socket 來完畢網(wǎng)絡(luò)傳輸?shù)?。上?行用代碼解釋了這一點,只是上面2行簡單的代碼掩蓋了底層的非常多操作。來看看底層是怎么運行上面2行代碼的:
1、系統(tǒng)調(diào)用 read() 產(chǎn)生一個上下文切換:從 user mode 切換到 kernel mode,然后 DMA 運行拷貝,把文件數(shù)據(jù)從硬盤讀到一個 kernel buffer 里。
2、數(shù)據(jù)從 kernel buffer 復制到 user buffer,然后系統(tǒng)調(diào)用 read() 返回,這時又產(chǎn)生一個上下文切換:從kernel mode 切換到 user mode。
3、系統(tǒng)調(diào)用 write() 產(chǎn)生一個上下文切換:從 user mode 切換到 kernel mode,然后把步驟2讀到 user buffer 的數(shù)據(jù)復制到 kernel buffer(數(shù)據(jù)第2次復制到 kernel buffer),只是這次是個不同的 kernel buffer,這個 buffer 和 socket 相關(guān)聯(lián)。
4、系統(tǒng)調(diào)用 write() 返回,產(chǎn)生一個上下文切換:從 kernel mode 切換到 user mode(第4次切換了),然后 DMA 從 kernel buffer 拷貝數(shù)據(jù)到協(xié)議棧(第4次拷貝了)。
上面4個步驟有4次上下文切換,有4次拷貝,我們發(fā)現(xiàn)假設(shè)能降低切換次數(shù)和拷貝次數(shù)將會有效提升性能。在kernel 2.0+ 版本號中,系統(tǒng)調(diào)用 sendfile() 就是用來簡化上面步驟提升性能的。sendfile() 不但能降低切換次數(shù)并且還能降低拷貝次數(shù)。
以上細節(jié)是傳統(tǒng)read/write方式進行網(wǎng)絡(luò)文件傳輸?shù)姆绞剑覀兡軌蚩吹?,在這個過程其中,文件數(shù)據(jù)實際上是經(jīng)過了四次copy操作:
硬盤—>內(nèi)核buf—>用戶buf—>socket相關(guān)緩沖區(qū)—>協(xié)議引擎
而sendfile系統(tǒng)調(diào)用則提供了一種降低以上多次copy,提升文件傳輸性能的方法。Sendfile系統(tǒng)調(diào)用是在2.1版本號內(nèi)核時引進的:
- sendfile(socket,?file,?len);??
執(zhí)行流程例如以下:
1、sendfile系統(tǒng)調(diào)用,文件數(shù)據(jù)被copy至內(nèi)核緩沖區(qū)
2、再從內(nèi)核緩沖區(qū)copy至內(nèi)核中socket相關(guān)的緩沖區(qū)
3、最后再socket相關(guān)的緩沖區(qū)copy到協(xié)議引擎
相較傳統(tǒng)read/write方式,2.1版本號內(nèi)核引進的sendfile已經(jīng)降低了內(nèi)核緩沖區(qū)到user緩沖區(qū),再由user緩沖區(qū)到socket相關(guān)緩沖區(qū)的文件copy,而在內(nèi)核版本號2.4之后,文件描寫敘述符結(jié)果被改變,sendfile實現(xiàn)了更簡單的方式,系統(tǒng)調(diào)用方式仍然一樣,細節(jié)與2.1版本號的不同之處在于,當文件數(shù)據(jù)被拷貝到內(nèi)核緩沖區(qū)時,不再將全部數(shù)據(jù)copy到socket相關(guān)的緩沖區(qū),而是只將記錄數(shù)據(jù)位置和長度相關(guān)的數(shù)據(jù)保存到socket相關(guān)的緩存,而實際數(shù)據(jù)將由DMA模塊直接發(fā)送到協(xié)議引擎,再次降低了一次copy操作。
更多文章、技術(shù)交流、商務合作、聯(lián)系博主
微信掃碼或搜索:z360901061

微信掃一掃加我為好友
QQ號聯(lián)系: 360901061
您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。
【本文對您有幫助就好】元
