网站地图官方微信:
网站首页 南岗区 大麻镇 高密市 云潭镇 杵坭乡 庙塘镇

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 蜂鸟音乐指控邓紫棋侵权,要求 48 小时内下架重录歌曲,邓紫棋回应「不会下架」,这一指控合理吗? |

    根据《著作权法》第四十二条,已经合法录制为录音制品发表的音乐...

    查看详情>>
  • | 中国军事力量在亚洲能排第一吗? |

  • | 如何评价连云港这座城市? |

  • | 炫富真的很爽吗? |

  • | 北京暴雨故宫再现「千龙吐水」奇观,为什么故宫古老排水系统历经六百年仍能正常运作?有哪些特别之处? |

  • | 做个web服务器,gin框架和go-zero怎么选? |

  • | postgres集群的选择? |

  • | 为什么 Windows 系统上的安装包有 exe 和 msi 两种格式,有什么区别? |

  • | 在所有动物肉中,哪一种味道最好? |

  • | duckdb的性能如何? |

  • | 突然发现身边有一位大神是一种怎样的体验? |

  • 鱼缸水培定植篮,里面装些石英球,一头大蒜坐在石英球上,确保大...

    2025-06-19
  • Gemini 2.5 Flash和Gemini 2.5 Pr...

    2025-06-20
  • 之前一直想做笔记软件分享,今天恰好非常有分享欲。 大学毕业...

    2025-06-20
  • 没有个万字长文,都没法把这个问题讲明白。 就讲个怎么搭建R...

    2025-06-19

关注我们

添加微信好友,关注最新动态