您的位置:首页 > 任务详情
招标模式 Cuda Cpp代码优化
  • 雇主:mike
  • 发布时间:2025-05-09
  • 分类:程序开发

可议价

免责声明 该外包需求信息来源于站外平台,本站仅提供公开信息部分字段展示与订阅服务,更多请查看免责声明。

任务详情

平台配置: 1. 软件环境 ubuntu22.04系统,cuda12.4(适用rtx 4060ti的cuda版本都可以)   2. 硬件环境: rtx 4060Ti 16G 显卡,cpu型号 Intel i3-12100F,cpu内存32G   文件清单: 1. 文档 Dis mantling_Megamos_Crypto(1).pdf 2. 测试数据 表数据.rar 3. 程序代码 Gpu_Decrypt1124.cu     目标需求: 当前阶段已经根据文件清单中文档所提及的算法理论,实现了相对应的程序代码Gpu_Decrypt1124.cu,需要重构优化代码中的算法。   1. 表文件 根据文档中提及的数据表,一次计算需要三个文件,x_ComHead.bin,x_Th.bin,x_Tlmr.bin。 (1) x_ComHead.bin文件是索引文件,每一条数据的格式是 struct CommonHeadIndexStr { uint32_t ThCount; uint32_t ThOffSetIndex; uint32_t TlmrCount; uint32_t TlmrOffSetIndex; }; 每个文件都是0x10000条数据,ThCount是每条数据对应的Th表文件的数据长度,ThOffSetIndex则是对应的数据在这个Th表中的偏移位置,同理TlmrCount则是对应的Tlmr表的数据长度,TlmrOffSetIndex是对应的Tlmr表中的偏移位置。 (2) x_Th.bin文件是Th表文件,每一条数据的格式是 struct InitGH{ uint32_t g40; uint32_t g48; uint16_t h40; uint16_t h48; }; 每个文件大小不固定   (3) x_Tlmr.bin文件是Tlmr表文件,每一条数据的格式是 struct InitLMR { uint8_t l40; uint8_t m40; uint8_t r40; uint8_t l48; uint8_t m48; uint8_t r48; }; 每个文件大小不固定 2. 在平台中,计算一次测试数据的时间至少在500ms内,且占用的显存不能超过4G。 3. 由于最终平台运行模式是4个cuda流并行计算4个文件,优化后的算法接口要适用运行多线程多流 也有具体的需求文档,可以接点竞标沟通  

任务附件 (0)

暂无稿件哦!

预期中标

已中标

0

快去分享,提高任务的曝光率吧

  • 发布需求     2025.05.09
  • 服务商报价    
  • 选择服务商并托管资金    
  • 服务商工作    
  • 验收付款    
  • 评价