YesPMP
8人浏览/4人投稿
8天前
待托管赏金
平台配置:
1. 软件环境
ubuntu22.04系统,cuda12.4(适用rtx 4060ti的cuda版本都可以)
2. 硬件环境:
rtx 4060Ti 16G 显卡,cpu型号 Intel i3-12100F,cpu内存32G
文件清单:
1. 文档
Dis mantling_Megamos_Crypto(1).pdf
2. 测试数据
表数据.rar
3. 程序代码
Gpu_Decrypt1124.cu
目标需求:
当前阶段已经根据文件清单中文档所提及的算法理论,实现了相对应的程序代码Gpu_Decrypt1124.cu,需要重构优化代码中的算法。
1. 表文件
根据文档中提及的数据表,一次计算需要三个文件,x_ComHead.bin,x_Th.bin,x_Tlmr.bin。
(1) x_ComHead.bin文件是索引文件,每一条数据的格式是
struct CommonHeadIndexStr {
uint32_t ThCount; uint32_t ThOffSetIndex;
uint32_t TlmrCount; uint32_t TlmrOffSetIndex; };
每个文件都是0x10000条数据,ThCount是每条数据对应的Th表文件的数据长度,ThOffSetIndex则是对应的数据在这个Th表中的偏移位置,同理TlmrCount则是对应的Tlmr表的数据长度,TlmrOffSetIndex是对应的Tlmr表中的偏移位置。
(2) x_Th.bin文件是Th表文件,每一条数据的格式是
struct InitGH{ uint32_t g40; uint32_t g48; uint16_t h40; uint16_t h48; };
每个文件大小不固定
(3) x_Tlmr.bin文件是Tlmr表文件,每一条数据的格式是
struct InitLMR {
uint8_t l40; uint8_t m40; uint8_t r40;
uint8_t l48; uint8_t m48; uint8_t r48; };
每个文件大小不固定
2. 在平台中,计算一次测试数据的时间至少在500ms内,且占用的显存不能超过4G。
3. 由于最终平台运行模式是4个cuda流并行计算4个文件,优化后的算法接口要适用运行多线程多流
也有具体的需求文档,可以接点竞标沟通