Skip to content

pass-lin/cache-t5

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 

Repository files navigation

基于bert4keras和mt5模型的cache实现

cacheT5.py是其底层实现
demo.py是一个简单的演示demo
https://zhuanlan.zhihu.com/p/75796168 关于cache技术的介绍
总体来说cache是一种无损的提速方法,这个仓库主要开源我通过bert4keras实现的mt5版cache

性能演示

测试环境是1660gpu和i5-9400Fcpu
cpu环境下512-512的输入输出
整体性能提升了四倍左右
R@Q_IV}H8MJA584_`KG1EPJ
cpu环境下768-768的输入输出

image
image
提速在九倍左右
gpu环境下512-512的输入输出
整体速度提升了两倍左右
@CA}91O7{3E))LY2496D3D2

gpu环境下768-768的输入输出
XJMA5A2~{2 IDR_JB9)Y(2M
不难发现更长的输入输出能让加速比有所提升。
另外gpu和cpu的提速比差异较大,个人怀疑是并行能力导致的。不过笔者硬件知识堪忧,希望大佬指教

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages