职位:程序员
部门:
人数:若干
地区:北京
性质:全职
性别:不限
婚姻:不限
学历:本科
经验:1年以上
年龄:不限年龄
待遇:面议
职责/Job Description
1、负责网页文本的抓取,存储,滤噪,去重等后期清理工作。
资格/Qualification
1、有爬虫、网页正文提取、分词和特征提取等相关经验 ;
2、熟悉linux、python、java,对数据库有一定了解 ;
3、理解http,熟悉html、DOM、xpath,熟悉webmagic优先 ;
4、有1年以上工作经验优先;优秀应届生优先。
职位申请