任务详情
我们在做什么
面向海外垂类场景的多模态AI,重点是基于Qwen的视频模型微调与上线。公司已建立垂类行业的大量视频数据集。
你将负责
基于Qwen系列模型做 SFT/LoRA/QLoRA等指令微调与对齐。
搭建视频数据管线:帧采样(均匀/关键帧/滑窗)、切片与增广、数据清洗与去重。
训练与加速:PyTorch、FSDP/DeepSpeed、混合精度、梯度累积、显存与吞吐优化。
评测与对齐:建立视频理解/描述评测集与指标,必要时DPO/对齐。
推理与上线:vLLM/TensorRT-LLM、KV Cache。
任职要求
深度学习经验,至少1个视频模型微调或落地经验(不限框架/模型;能展示结果)。
熟练PyTorch与常用训练技巧;了解LoRA/PEFT、数据标注与弱监督/指令构造。
具备分布式训练与实验可复现意识:能给出显存/吞吐/时延的量化对比与日志。
能独立完成从数据→训练→评测→推理→上线的闭环;文档与沟通清晰。
加分项
使用过Qwen系列或其他多模态 LLM 的实际微调经验。
了解VideoMAE/InternVideo/TimeSformer等时序建模思路与帧采样策略权衡。
联系我们
评论留下相关经历介绍,最好有GitHub链接。合适的话我们会主动加电联系。