職位類別:
一、崗位職責(zé) 1、負(fù)責(zé)設(shè)計、開發(fā)、維護(hù)采集相關(guān)的軟件產(chǎn)品和模塊,開發(fā)主要使用語言為Python; 2、負(fù)責(zé)新聞、論壇、社交平臺、短視頻平臺數(shù)據(jù)采集,包括特定目標(biāo)和定向網(wǎng)站采集,及海量大規(guī)模采集; 3、負(fù)責(zé)所開發(fā)采集模塊和程序維護(hù)及數(shù)據(jù)異常的跟蹤處理。 二、任職要求 1、大學(xué)本科及以上學(xué)歷,計算機相關(guān)專業(yè); 2、熟悉Linux開發(fā)環(huán)境;熟練掌握Python語言; 3、熟悉網(wǎng)頁抓取原理及技術(shù),熟悉基于Cookie的網(wǎng)站登錄原理,熟悉基于正則表達(dá)式、Xpath、CSS等網(wǎng)頁信息抽取技術(shù); 4、響應(yīng)抓取需求,能快速高效的完成開發(fā)任務(wù),具備良好的溝通能力和管理能力; 5、具備信息檢索、web挖掘等搜索引擎相關(guān)知識,有從事海量網(wǎng)絡(luò)爬蟲、網(wǎng)頁去重、網(wǎng)頁信息抽取經(jīng)驗; 6、工作態(tài)度踏實、認(rèn)真、積極主動,能承受一定工作壓力,有責(zé)任心、有團(tuán)隊協(xié)作能力; 7、熟悉Xposed框架、App逆向相關(guān)技術(shù)者優(yōu)先。
專業(yè)要求:計算機相關(guān)專業(yè)
北京市海淀區(qū)北京市市轄區(qū)海淀區(qū)西三旗中科智匯工廠N1樓301號
中科天璣數(shù)據(jù)科技股份有限公司
行業(yè): 計算機軟件 規(guī)模: 500-1000 性質(zhì): 股份制企業(yè) 當(dāng)前職位: 數(shù)據(jù)采集工程師
中科天璣成立于2010年,起源于有著“中國計算機事業(yè)搖籃”之稱的中國科學(xué)院計算技術(shù)研究所,是計算所數(shù)據(jù)智能方向唯一的產(chǎn)業(yè)化平臺,大數(shù)據(jù)分析系統(tǒng)國家工程實驗室的重要共建單位和示范應(yīng)用基地。中科天璣以“深挖價值、服務(wù)國家、惠及大眾”為己任,致力于成為數(shù)據(jù)智能領(lǐng)航者。經(jīng)歷十余年發(fā)展,在自然語言處理、社會計算、知識圖譜、信息檢索、機器學(xué)習(xí)等大數(shù)據(jù)與人工智能領(lǐng)域擁有深厚的技術(shù)積累,重點面向網(wǎng)信、政法、軍工、金安、科教、城市等應(yīng)用領(lǐng)域,打造自主創(chuàng)新、安全可信、智能高效的數(shù)據(jù)智能引擎,形成符合市場需求的產(chǎn)品生態(tài)體系,引領(lǐng)整個數(shù)據(jù)智能領(lǐng)域的高速增長,為數(shù)字經(jīng)濟(jì)發(fā)展提供堅實基礎(chǔ)。