職位類別:
工作內容: ? 參與收集、處理、清洗各種渠道的原始文本數(shù)據(jù),包括但不限于網(wǎng)頁數(shù)據(jù)、電子書數(shù)據(jù)等 ? 與大模型算法團隊、數(shù)據(jù)采集團隊、分布式訓練工程團隊密切合作,建立數(shù)據(jù)系統(tǒng)迭代流程 ? 建立針對大模型的數(shù)據(jù)質量評估方法,持續(xù)提高數(shù)據(jù)質量和多樣性,安全性,有用性 我們希望你是: ? 有搜索、推薦、廣告等業(yè)務數(shù)據(jù)的處理經(jīng)驗 ? 有?規(guī)模中文網(wǎng)頁數(shù)據(jù)收集和清洗經(jīng)驗者優(yōu)先 ? 有文本數(shù)據(jù)集搭建和數(shù)據(jù)質量管理經(jīng)驗者優(yōu)先 ? 工作地:北京,全職 我們的優(yōu)勢: ?? 頂尖 GPU 集群算力支持,快速迭代實驗建立數(shù)據(jù) scaling-law ? 深度參與到千億至萬億大型語言模型訓練的數(shù)據(jù)系統(tǒng)迭代流程 公司簡介: 我們相信,AGI 是 數(shù)據(jù)x算法x算力的完美實踐, 科研+工程+組織的優(yōu)雅藝術。 我們正在尋找并長期培養(yǎng)優(yōu)秀的數(shù)據(jù)研發(fā)人才,與我們一起進行高水平的科學研究和工程實踐。如果你對人工智能有濃厚的興趣,如果你想在一個充滿挑戰(zhàn)和機遇的初創(chuàng)環(huán)境中展現(xiàn)你的才華,如果你想?yún)⑴c構建下一代通用人工智能(AGI),那么請不要猶豫,加入 DeepSeek,與我們共同在 AGI 征程上“深度求索”吧!
浙江省杭州市拱墅區(qū)浙江省杭州市拱墅區(qū)環(huán)城北路169號匯金國際大廈查看大圖
杭州深度求索人工智能基礎技術研究有限公司
行業(yè): 互聯(lián)網(wǎng)/電子商務 規(guī)模: 100-200 性質: 私營·民營企業(yè) 當前職位: 數(shù)據(jù)研發(fā)工程師(AGI 北京)
DeepSeek,全稱杭州深度求索人工智能基礎技術研究有限公司。DeepSeek是一家創(chuàng)新型科技公司,成立于2023年7月17日,使用數(shù)據(jù)蒸餾技術,得到更為精煉、有用的數(shù)據(jù) 。 由知名私募巨頭幻方量化孕育而生,專注于開發(fā)先進的大語言模型(LLM)和相關技術。經(jīng)營范圍包括技術服務、技術開發(fā)、軟件開發(fā)等。 投遞網(wǎng)站:https://app.mokahr.com/social-recruitment/high-flyer/140576#/