任务详情
1、熟悉Transformer及其他深度学习核心概念,能够准确理解和分析现有的基线项目代码。2、根据项目结构编写清晰的模块说明文档,详细描述各部分的功能和交互。3、对项目的详细实现有深刻理解,能够熟练修改包括超参数配置、数据处理流程、模型训练策略、损失函数计算、模型架构及插件系统等关键代码部分。4、提供至少一个对应各个模块的详细的代码修改案例文档,展示如何根据具体需求改进项目。5、根据简明的项目需求,具体修改损失函数计算和模型结构的相关代码,以提升模型性能或适应新的数据特性。6、提供代码实现的详细讲解和技术咨询,帮助成员理解和掌握项目核心技术,解决开发过程中的技术难题。