近期,一款名為DeepSeek的國產(chǎn)人工智能大模型在全球范圍內(nèi)迅速走紅,不僅在蘋果中國的應(yīng)用商店免費App下載排行榜上登頂,還成功超越了ChatGPT,在美國應(yīng)用商店也占據(jù)了榜首位置。
DeepSeek的背后,是一家名為杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司的新興企業(yè),簡稱“深度求索公司”。這家成立于2023年7月的公司,在短時間內(nèi)便憑借DeepSeek取得了顯著的成就。深度求索公司的股權(quán)結(jié)構(gòu)中,還出現(xiàn)了量化投資機構(gòu)幻方量化的身影,為其發(fā)展注入了強大的資金和技術(shù)支持。
據(jù)相關(guān)媒體報道,深度求索公司的北京子公司目前正積極招募人才,共開放了52個崗位,涵蓋了深度學(xué)習(xí)研究員、核心系統(tǒng)研發(fā)工程師及資深UI設(shè)計師等多個領(lǐng)域。這些崗位均提供14薪的薪資待遇,其中核心系統(tǒng)研發(fā)工程師(校招)的薪資范圍在6萬元至9萬元之間,而大部分崗位的起薪都在2萬元以上。公司還為實習(xí)生提供了高薪機會,AGI大模型實習(xí)生的日薪高達500元至1000元,數(shù)據(jù)百曉生實習(xí)生的日薪也達到了500元至510元。
在技術(shù)研發(fā)方面,深度求索公司同樣取得了令人矚目的成果。今年1月20日,公司正式發(fā)布了DeepSeek-R1推理大模型。這款模型在國際大模型排名榜Chatbot Arena上的基準(zhǔn)測試中,成功升至全類別大模型的第三位,與OpenAI的ChatGPT-4o最新版并列。更令人驚嘆的是,DeepSeek-R1的預(yù)訓(xùn)練費用僅為557.6萬美元,不到OpenAI GPT-4o模型訓(xùn)練成本的十分之一。這一顯著的成本控制優(yōu)勢,無疑為DeepSeek在未來的市場競爭中奠定了堅實的基礎(chǔ)。