在DeepSeek開源周的精彩時(shí)刻,一款名為Fire-Flyer文件系統(tǒng)(簡稱3FS)的高性能存儲解決方案正式亮相。這款文件系統(tǒng)是專為現(xiàn)代人工智能(AI)和高性能計(jì)算(HPC)領(lǐng)域量身打造,旨在應(yīng)對大規(guī)模數(shù)據(jù)存儲和高速訪問的挑戰(zhàn)。3FS充分利用了現(xiàn)代固態(tài)硬盤(SSD)和遠(yuǎn)程直接內(nèi)存訪問(RDMA)網(wǎng)絡(luò)的強(qiáng)大性能,為AI應(yīng)用提供了一個(gè)高效、分布式的存儲方案。
3FS的性能表現(xiàn)堪稱驚艷。在一個(gè)包含180個(gè)節(jié)點(diǎn)的集群測試中,其總讀取吞吐量達(dá)到了驚人的6.6 TiB/s。而在25節(jié)點(diǎn)的GraySort基準(zhǔn)測試中,3FS更是實(shí)現(xiàn)了每分鐘3.66 TiB的吞吐量。這一數(shù)據(jù)遠(yuǎn)超傳統(tǒng)存儲解決方案,充分展示了3FS在處理大規(guī)模數(shù)據(jù)時(shí)的卓越能力,為AI訓(xùn)練和數(shù)據(jù)處理提供了強(qiáng)有力的支持。特別是在處理龐大數(shù)據(jù)集時(shí),3FS的高效吞吐量能夠顯著縮短處理時(shí)間,提升整體工作效率。
3FS的KVCache功能也為其增色不少。在每個(gè)客戶端節(jié)點(diǎn)上,KVCache的峰值吞吐量超過了40 GiB/s,這一性能提升對于數(shù)據(jù)查詢和推理操作來說尤為關(guān)鍵。該功能特別適用于需要快速響應(yīng)和實(shí)時(shí)訪問的應(yīng)用場景,能夠有效減輕硬件資源的負(fù)擔(dān),同時(shí)提升系統(tǒng)的整體性能。
3FS的架構(gòu)設(shè)計(jì)同樣值得稱道。它采用了強(qiáng)一致性的分布式架構(gòu),確保數(shù)據(jù)在分布式環(huán)境中始終保持一致,讓開發(fā)者能夠更專注于業(yè)務(wù)邏輯的實(shí)現(xiàn),而無需擔(dān)心數(shù)據(jù)一致性問題。同時(shí),3FS的解耦架構(gòu)進(jìn)一步提高了系統(tǒng)的靈活性和可擴(kuò)展性,使其能夠輕松應(yīng)對不斷增長的數(shù)據(jù)存儲和處理需求。這一設(shè)計(jì)使得3FS成為了一個(gè)既可靠又高效的存儲解決方案。
對于AI和高性能計(jì)算領(lǐng)域的開發(fā)者來說,3FS無疑是一個(gè)全面的解決方案。它不僅在數(shù)據(jù)預(yù)處理、數(shù)據(jù)集加載、檢查點(diǎn)存儲與恢復(fù)以及向量嵌入搜索等多個(gè)環(huán)節(jié)提供了支持,還能夠?yàn)榇笠?guī)模訓(xùn)練提供穩(wěn)定的數(shù)據(jù)支持,并在推理過程中提供加速,從而有效提高AI應(yīng)用的整體運(yùn)行效率。
DeepSeek在發(fā)布3FS的同時(shí),還推出了Smallpond數(shù)據(jù)處理框架,進(jìn)一步增強(qiáng)了3FS在數(shù)據(jù)管理和處理方面的能力。這一舉措使得3FS不僅僅是一個(gè)存儲解決方案,更成為了一個(gè)全面的數(shù)據(jù)處理平臺。作為中國科技力量的代表,DeepSeek通過3FS的開源,不僅為全球AI和計(jì)算領(lǐng)域提供了前沿的技術(shù)支持,也向世界展示了中國企業(yè)在技術(shù)研發(fā)上的深厚積累和創(chuàng)新能力。