GPU上SM4算法并行实现

被引:3
|
作者
李秀滢 [1 ,2 ]
吉晨昊 [1 ,2 ]
段晓毅 [1 ]
周长春 [1 ,2 ]
机构
[1] 北京电子科技学院电子与通信工程系
[2] 密码科学技术国家重点实验室
基金
国家重点研发计划;
关键词
图形处理器; 并行计算; CUDA; SM4;
D O I
暂无
中图分类号
TP332 [运算器和控制器(CPU)];
学科分类号
081201 ;
摘要
密码算法的运算速度与算力成正比,一些学者通过提高CPU速度、使用硬件加密卡等方案提高密码算法运算速度。随着图形处理器(GPU)在高性能并行计算领域的广泛应用,国内外学者已经展开了基于GPU加速密码运算的研究,但这些研究基本都是基于DES、AES等国际公开算法的,针对国产商用密码算法SM4的研究还较少。文章在深入研究GPU并行计算机制的基础上,通过研究最优明文数据块、GPU存储类型和线程块对SM4加密的加速比问题,结合CPU与GPU的特性,提出一种GPU上并行SM4算法的最优加解密方案。结果表明,当明文数据块小于8 KB时,加速比(Ep)小于1;明文数据块大小为64 KB时,加速比开始大幅增加;明文数据块大小为256 KB时,加速比达到最大。当选择常量存储作为中间数据存储时,加密速度有所提升,对于大数据量、高速运算的需求来说,这种提升是很有必要的。最优线程块的大小为128~512(必须为32的倍数)个线程数。实验环境下,文章中实现的最优GPU加密方案的速度为普通CPU加密方案速度的26倍。
引用
收藏
页码:36 / 43
页数:8
相关论文
共 7 条
  • [1] 多引擎并行CBC模式的SM4算法的芯片级实现
    樊凌雁
    周盟
    骆建军
    刘海銮
    [J]. 计算机研究与发展, 2018, 55 (06) : 1247 - 1253
  • [2] Curve25519椭圆曲线算法GPU高速实现
    成娟娟
    郑昉昱
    林璟锵
    董建阔
    [J]. 信息网络安全, 2017, (09) : 122 - 127
  • [3] 基于CUDA的SM4加密算法高速实现
    王德民
    陈达
    [J]. 石家庄铁路职业技术学院学报, 2017, 16 (01) : 59 - 63
  • [4] 基于CTR模式的GPU并行AES算法的研究与实现
    费雄伟
    李肯立
    阳王东
    [J]. 小型微型计算机系统, 2015, 36 (03) : 529 - 533
  • [5] AES算法的CUDA高效实现方法
    夏春林
    周德云
    张堃
    [J]. 计算机应用研究, 2013, 30 (06) : 1907 - 1909
  • [6] Analysis of RSA Algorithm using GPU Programming [J] . Sonam Mahajan,Maninder Singh.&nbsp&nbspInternational Journal of Network Security & Its A . 2014 (4)
  • [7] High-performance Symmetric Block Ciphers on Cuda .2 NISHIKAWA N,IWAI K,KUROKAWA T. 2011 Second International Conference on Networking and Computing . 2011