招聘&找人寻找数据采集/清洗相关技术人员

头像
TODO
542阅读26评论

公司正在组建一个数据集团队,最近正好在做相关规划,也特意来电鸭,看看有没有志同道合的朋友愿意一起搞点事情~

简单介绍一下我们这边的情况:

  1. 公司背景:我们是一家中型的数据标注团队,全国有多家数据标注基地,业务稳定,项目不断,未来还会拓展更多的数据方向。

  2. 工作地点:核心办公地点在郑州,后续希望能在这里形成一个稳定的技术核心团队。

  3. 业务需求:我们不仅做标注,后续还会接触大量的数据采集项目,涉及图片、PDF、JSON、文本等多种格式的采集需求。
    👉 但单靠采集往往是达不到甲方要求的,我们很清楚这一点。很多时候还需要对数据做清洗、结构化转换,有的还需要写代码处理或者开发清洗辅助工具,才能把数据变成可用、可交付的标准格式。

  4. 人才需求
    🙋‍♀️ 我们现在最缺的是有数据采集、数据清洗经验的技术同学。
    💡 更倾向于以下两种合作方式:

    • 2~10人驻场合作,郑州优先,方便沟通、协同推进;

    • 10~100人远程兼职合作,可以按项目或模块协作,数量不限,越多越好,我们希望形成一个可以打硬仗的临时编队。

  5. 标注方向:我们自己有一支成熟的人工标注团队,长期项目不断。如果你身边有对数据标注感兴趣的朋友(不管是转行的、想做兼职的、带队的都可以),也欢迎随时来聊聊~

  6. 其他补充
    欢迎善于使用AI和大模型的朋友来共同合作,比如:

  • 能借助模型能力辅助采集、自动清洗、结构解析等

  • 熟悉大模型的数据标注规范、训练数据准备流程的

  • 有标注平台开发经验的团队或个人

  • 如果你们团队本身有大模型相关的识别、合成能力(图文、音视频方向都可),我们也非常希望能探索更深度的合作机会

招聘类型:
职业:
城市:
需消耗电量 5
顶 3
收藏
举报
精选评论
头像
等级0

做自动化训练都需要合格的数据及作业规则来支持,如果平台本身就有Ai标注提升的空间很有限,合作模式基本只有两种岗位付费或按研发付费,并且是预付费才行!这个项目周期长一些才行否则一两个月短期项目,研发完项目结束了,自身就会亏损

您说的对,短期的一般都是有现成数据的或者较容易的。

这个可以聊一聊,看看能做到什么程度,合适的话可以合作一下,自动化并非是万能的,虽然标注人工可以减少,但是质检比例也会能加,因为目前还没有可能做到100%正确率

头像
等级0

在郑州,请联系我

需要什么技术栈,php可以吗

我在郑州,怎么联系啊

采集一般会需要用到逆向

头像
等级0

七年python后端+AI+爬虫,数据挖掘\数据分析经验丰富,需要请联系

头像
等级0

有团队,郑州有高校可合作,稳定可长期,欢迎合作

头像
等级0

和我现在工作做的基本一样= = 远程还缺的可以联系一下我

  1. 各类工具把非结构化的数据转化为文本(部分带线没法转文字的不用转用视觉模型)
  2. 分类(量大的数据训练分类模型过滤脏数据)
  3. 定位(用正则或者知识库)
  4. 解析(基本就是写prompt调用大模型)
头像
等级0

你好,寻求远程机会,能熟练训练、部署模型

头像
等级0

有5年制造业数据分析经验,熟悉ETL数据清洗、数据分析、数据转换,python后端,寻求远程机会

头像
等级0

现在远程简直还有吗
本人现在就在做平台的采集、自动清洗、结构解析等

头像
等级2

可以加下我,有数据中台系统建设经验,包含采集. 清洗. 分析等

头像
等级0
头像
等级1

给大家发两张采集清洗的需求任务,大家了解一下

头像
等级0

您好,寻求远程机会,兼职全职都可:

  • 数据基建技能,熟悉数据库、数仓、ETL、报表开发。
  • 数据分析师技能,熟悉Python数据清洗、数据分析、数据可视化。
  • 长期远程办公经验,有严格自我管理和交付意识。
  • AI大模型长期用户。

最后修改于

头像
等级1

你好 我是数据分析师 想远程兼职

头像
等级0

在深圳,做过各种爬虫

头像
等级0

在北京,怎么联系

头像
等级0

您好 寻求远程机会 可联系

头像
等级0

我在上海,申请加入远程团队

头像
等级0

较为擅长python开发,有实际目标实时识别,图像标注,label- studio设置模型自动标注的经验,有需要可以找我

版块详情

招聘&找人

23k 帖子
170k 评论
1k 关注
非主流的工作机会在这里更受欢迎~
版主
远程全职推荐

扫码下载应用

下载APP以便及时收到回复或进展