【远程】AI视觉大模型研发科学家/合伙人/源自硅谷初创/前沿技术/equity

您的位置：首页 > 任务详情

雇主：mike
发布时间：2025-07-10
分类：灵活用工

免责声明该外包需求信息来源于站外平台，本站仅提供公开信息部分字段展示与订阅服务，更多请查看免责声明。

立即联系发布类似任务

任务详情

关于我们：我们是一家源自美国硅谷的科技公司，致力于在全自主的有人飞行器和无人飞行器领域推动创新的边界。我们的团队由充满活力、富有技术热情并且拥有共同愿景的个人组成，共同创建突破性的解决方案。利用先进的人工智能和自动导航技术，我们立志将城市空中出行的概念变为现实，迎来一个全人类家家户户便捷高效飞行的新时代。加入我们，为该领域的突破性进展做出贡献。如果您对推动创新的边界充满热情，我们诚邀您成为我们充满活力的团队的一员！职位概述：作为 AI端侧视觉大语言模型研发科学家（远程合伙人），您将领导和推动视觉大预言模型在自主飞行、视觉导航、多模态感知与决策推理中的应用，并负责搭建大模型驱动的 Agent和前端UI ，打造智能飞行辅助系统。您的研究方向涵盖视觉语言模型（VLM）、大模型 Agent、智能 UI 交互等。您将与核心团队合作，负责从底层大模型算法到前端 UI 和智能 Agent 系统的完整研发，打造一个先进的端侧飞行器 AI 解决方案。通过您的努力，飞行器将实现更高的智能化、自主性与适应性。岗位职责：视觉语言大模型开发：研究并实现最新的 VLM（Vision-Language Model）技术，在飞行导航、语义理解、航迹推理等端侧或边缘侧任务中落地应用。大模型 Agent 开发：基于 VLM / 生成式 AI，构建智能自主飞行 AI Agent，使其具备实时推理、智能交互、辅助决策等功能。云端AI部署 & 推理优化：利用AWS/ GCP /Azure进行云端推理部署，并优化推理速度、数据流效率及 API 调用。大模型前端网页开发：搭建基于大模型的智能交互网页 UI，设计多模态数据、飞行状态、智能辅助决策等可视化界面。大模型API部署：设计 API 结构，使得大模型可通过 Web UI、API 及嵌入式系统进行调用。模型优化与部署：针对 NVIDIA Jetson AGX Orin、FPGA、云端等不同计算平台优化模型的推理速度和资源利用率，实现高效部署。多模态融合算法：融合视觉、语言、雷达、激光雷达等多传感器数据，创新研究与专利申请：跟踪国际前沿技术，推动新算法研发，并申请相关专利或发表高水平论文。资格要求：计算机科学、人工智能、机器人或相关领域的硕士及以上学历。精通C++和Python，具备在C++平台上使用深度学习模型的经验，熟悉机器学习框架(PyTorch、LibTorch、TensorFlow、Caffe等)，具备视觉大模型相关项目经验。具备从模型训练到部署优化的完整经验，包括蒸馏、量化、剪枝、压缩、推理加速等技术，至少2年以上相关工作经验。在多模态视觉大语言模型中有应用开发经验。熟悉AWS/ GCP /Azure等云服务，能够部署、优化大规模 AI 模型的云端推理。熟悉 Web U/ 前端开发（Vue / React / Next.js 等），能够搭建基于大模型的智能 UI。有强烈的创业精神和团队合作能力，愿意与团队一起打造全球领先的智能飞行产品。自我驱动力强，对学习和探索SOTA技术抱有极高热情。优先条件：参与过大模型API/SDK平台、大模型垂直应用、大模型 Agent相关项目。具备优化 Transformer / Diffusion Model** 在资源受限环境下推理性能和内存使用的经验。具备智能UI交互、HMI 设计、视觉大语言模型落地应用** 相关经验。熟悉图像语言嵌入、多模态Transformer架构及模型预训练技术。有高质量论文发表记录（CVPR、ICCV、NeurIPS、ICLR 等）或授权专利者优先。有参与自动驾驶汽车、自主飞行、或具身机器人系统的开发经验。英文流利，可熟练阅读理解国内外前沿学术论文。有实际飞行器视觉导航或多传感器融合算法开发经验者优先。福利待遇：股权激励+ 利润分成计划 + 有竞争力的薪资，综合月薪3-5万/月，真正成为合伙人，共享公司成长红利。灵活远程办公，全球招聘，可全职或弹性合作。自主飞行AI研发机会，与全球前沿的自动驾驶 / AI 研究团队对接。直面行业顶级客户，对接国际 eVTOL / 低空经济企业，推动技术落地应用。长期成长机会，合伙人身份可发展为 CTO/AI负责人。工作地点：可远程工作，地点不限。申请方式：如果您对未来的空中交通技术充满激情，并且具备我们所需的专业技能，请发送您的简历和相关项目作品至我们的邮箱。我们期待与您一起，探索空中出行的无限可能。

任务附件 (0)