Richard ZHou's picture

Richard ZHou

zykRichard

·

zykRichard

AI & ML interests

None yet

Recent Activity

upvoted a paper about 18 hours ago

RT-Lynx: Putting the GEMM Sparsity In a Right Way for Diffusion Models

authored a paper 6 days ago

Rethinking Cross-Layer Information Routing in Diffusion Transformers

upvoted a paper 7 days ago

Rethinking Cross-Layer Information Routing in Diffusion Transformers

View all activity

Organizations

upvoted a paper about 18 hours ago

RT-Lynx: Putting the GEMM Sparsity In a Right Way for Diffusion Models

Paper • 2605.26632 • Published 6 days ago • 10

authored a paper 6 days ago

Rethinking Cross-Layer Information Routing in Diffusion Transformers

Paper • 2605.20708 • Published 12 days ago • 109

upvoted a paper 7 days ago

Rethinking Cross-Layer Information Routing in Diffusion Transformers

Paper • 2605.20708 • Published 12 days ago • 109

upvoted a paper 10 days ago

Full Attention Strikes Back: Transferring Full Attention into Sparse within Hundred Training Steps

Paper • 2605.16928 • Published 16 days ago • 93

submitted a paper to Daily Papers 10 days ago

Full Attention Strikes Back: Transferring Full Attention into Sparse within Hundred Training Steps

Paper • 2605.16928 • Published 16 days ago • 93

authored a paper 11 days ago

Full Attention Strikes Back: Transferring Full Attention into Sparse within Hundred Training Steps

Paper • 2605.16928 • Published 16 days ago • 93

updated a model 5 months ago

RTP-LLM/Qwen3-Coder-30B-A3B-Instruct-RTPurbo

31B • Updated Dec 29, 2025 • 2 • 3