招聘&找人寻找数据采集/清洗相关技术人员

头像
TODO
510阅读23评论

公司正在组建一个数据集团队,最近正好在做相关规划,也特意来电鸭,看看有没有志同道合的朋友愿意一起搞点事情~

简单介绍一下我们这边的情况:

  1. 公司背景:我们是一家中型的数据标注团队,全国有多家数据标注基地,业务稳定,项目不断,未来还会拓展更多的数据方向。

  2. 工作地点:核心办公地点在郑州,后续希望能在这里形成一个稳定的技术核心团队。

  3. 业务需求:我们不仅做标注,后续还会接触大量的数据采集项目,涉及图片、PDF、JSON、文本等多种格式的采集需求。
    👉 但单靠采集往往是达不到甲方要求的,我们很清楚这一点。很多时候还需要对数据做清洗、结构化转换,有的还需要写代码处理或者开发清洗辅助工具,才能把数据变成可用、可交付的标准格式。

  4. 人才需求
    🙋‍♀️ 我们现在最缺的是有数据采集、数据清洗经验的技术同学。
    💡 更倾向于以下两种合作方式:

    • 2~10人驻场合作,郑州优先,方便沟通、协同推进;

    • 10~100人远程兼职合作,可以按项目或模块协作,数量不限,越多越好,我们希望形成一个可以打硬仗的临时编队。

  5. 标注方向:我们自己有一支成熟的人工标注团队,长期项目不断。如果你身边有对数据标注感兴趣的朋友(不管是转行的、想做兼职的、带队的都可以),也欢迎随时来聊聊~

  6. 其他补充
    欢迎善于使用AI和大模型的朋友来共同合作,比如:

  • 能借助模型能力辅助采集、自动清洗、结构解析等

  • 熟悉大模型的数据标注规范、训练数据准备流程的

  • 有标注平台开发经验的团队或个人

  • 如果你们团队本身有大模型相关的识别、合成能力(图文、音视频方向都可),我们也非常希望能探索更深度的合作机会

招聘类型:
职业:
城市:
需消耗电量 5
顶 3
收藏
举报
精选评论
头像
等级0

做自动化训练都需要合格的数据及作业规则来支持,如果平台本身就有Ai标注提升的空间很有限,合作模式基本只有两种岗位付费或按研发付费,并且是预付费才行!这个项目周期长一些才行否则一两个月短期项目,研发完项目结束了,自身就会亏损

您说的对,短期的一般都是有现成数据的或者较容易的。

这个可以聊一聊,看看能做到什么程度,合适的话可以合作一下,自动化并非是万能的,虽然标注人工可以减少,但是质检比例也会能加,因为目前还没有可能做到100%正确率

头像
等级0

在郑州,请联系我

需要什么技术栈,php可以吗

我在郑州,怎么联系啊

采集一般会需要用到逆向

头像
等级0

七年python后端+AI+爬虫,数据挖掘\数据分析经验丰富,需要请联系

头像
等级0

有5年制造业数据分析经验,熟悉ETL数据清洗、数据分析、数据转换,python后端,寻求远程机会

头像
等级0

现在远程简直还有吗
本人现在就在做平台的采集、自动清洗、结构解析等

头像
等级2

可以加下我,有数据中台系统建设经验,包含采集. 清洗. 分析等

头像
等级0

你好 想具体聊聊

头像
等级0

给大家发两张采集清洗的需求任务,大家了解一下

头像
等级0

您好,寻求远程机会,兼职全职都可:

  • 数据基建技能,熟悉数据库、数仓、ETL、报表开发。
  • 数据分析师技能,熟悉Python数据清洗、数据分析、数据可视化。
  • 长期远程办公经验,有严格自我管理和交付意识。
  • AI大模型长期用户。

最后修改于

头像
等级1

你好 我是数据分析师 想远程兼职

头像
等级0

在深圳,做过各种爬虫

头像
等级0

在北京,怎么联系

头像
等级0

有团队,郑州有高校可合作,稳定可长期,欢迎合作

头像
等级0

我在上海,申请加入远程团队

头像
等级0

和我现在工作做的基本一样= = 远程还缺的可以联系一下我

  1. 各类工具把非结构化的数据转化为文本(部分带线没法转文字的不用转用视觉模型)
  2. 分类(量大的数据训练分类模型过滤脏数据)
  3. 定位(用正则或者知识库)
  4. 解析(基本就是写prompt调用大模型)
头像
等级0

你好,寻求远程机会,能熟练训练、部署模型