任务详情
关于我们:
我们是一家源自美国硅谷的科技公司,致力于在全自主的有人飞行器和无人飞行器领域推动创新的边界。我们的团队由充满活力、富有技术热情并且拥有共同愿景的个人组成,共同创建突破性的解决方案。利用先进的人工智能和自动导航技术,我们立志将城市空中出行的概念变为现实,迎来一个全人类家家户户便捷高效飞行的新时代。加入我们,为该领域的突破性进展做出贡献。如果您对推动创新的边界充满热情,我们诚邀您成为我们充满活力的团队的一员!
职位概述:
作为 AI端侧视觉大语言模型研发科学家(远程合伙人),您将领导和推动视觉大预言模型在自主飞行、视觉导航、多模态感知与决策推理中的应用,并负责搭建大模型驱动的 Agent和前端UI ,打造智能飞行辅助系统。您的研究方向涵盖视觉语言模型(VLM)、大模型 Agent、智能 UI 交互等。您将与核心团队合作,负责从底层大模型算法到前端 UI 和智能 Agent 系统的完整研发,打造一个先进的端侧飞行器 AI 解决方案。通过您的努力,飞行器将实现更高的智能化、自主性与适应性。
岗位职责:
视觉语言大模型开发:研究并实现最新的 VLM(Vision-Language Model)技术,在飞行导航、语义理解、航迹推理等端侧或边缘侧任务中落地应用。
大模型 Agent 开发:基于 VLM / 生成式 AI,构建智能自主飞行 AI Agent,使其具备实时推理、智能交互、辅助决策等功能。
云端AI部署 & 推理优化:利用AWS/ GCP /Azure进行云端推理部署,并优化推理速度、数据流效率及 API 调用。
大模型前端网页开发:搭建基于大模型的智能交互网页 UI,设计多模态数据、飞行状态、智能辅助决策等可视化界面。
大模型API部署:设计 API 结构,使得大模型可通过 Web UI、API 及嵌入式系统进行调用。
模型优化与部署:针对 NVIDIA Jetson AGX Orin、FPGA、云端等不同计算平台优化模型的推理速度和资源利用率,实现高效部署。
多模态融合算法:融合视觉、语言、雷达、激光雷达等多传感器数据,
创新研究与专利申请:跟踪国际前沿技术,推动新算法研发,并申请相关专利或发表高水平论文。
资格要求:
计算机科学、人工智能、机器人或相关领域的硕士及以上学历。
精通C++和Python,具备在C++平台上使用深度学习模型的经验,熟悉机器学习框架(PyTorch、LibTorch、TensorFlow、Caffe等),具备视觉大模型相关项目经验。
具备从模型训练到部署优化的完整经验,包括蒸馏、量化、剪枝、压缩、推理加速等技术,至少2年以上相关工作经验。
在多模态视觉大语言模型中有应用开发经验。
熟悉AWS/ GCP /Azure等云服务,能够部署、优化大规模 AI 模型的云端推理。
熟悉 Web U/ 前端开发(Vue / React / Next.js 等),能够搭建基于大模型的智能 UI。
有强烈的创业精神和团队合作能力,愿意与团队一起打造全球领先的智能飞行产品。
自我驱动力强,对学习和探索SOTA技术抱有极高热情。
优先条件:
参与过大模型API/SDK平台、大模型垂直应用、大模型 Agent相关项目。
具备优化 Transformer / Diffusion Model** 在资源受限环境下推理性能和内存使用的经验。
具备智能UI交互、HMI 设计、视觉大语言模型落地应用** 相关经验。
熟悉图像语言嵌入、多模态Transformer架构及模型预训练技术。
有高质量论文发表记录(CVPR、ICCV、NeurIPS、ICLR 等)或授权专利者优先。
有参与自动驾驶汽车、自主飞行、或具身机器人系统的开发经验。
英文流利,可熟练阅读理解国内外前沿学术论文。
有实际飞行器视觉导航或多传感器融合算法开发经验者优先。
福利待遇:
股权激励+ 利润分成计划 + 有竞争力的薪资,综合月薪3-5万/月,真正成为合伙人,共享公司成长红利。
灵活远程办公,全球招聘,可全职或弹性合作。
自主飞行AI研发机会,与全球前沿的自动驾驶 / AI 研究团队对接。
直面行业顶级客户,对接国际 eVTOL / 低空经济企业,推动技术落地应用。
长期成长机会,合伙人身份可发展为 CTO/AI负责人。
工作地点:
可远程工作,地点不限。
申请方式:
如果您对未来的空中交通技术充满激情,并且具备我们所需的专业技能,请发送您的简历和相关项目作品至我们的邮箱。我们期待与您一起,探索空中出行的无限可能。