1nfinite
Tenstorrent partition部分的详细算法
Dataflow
tenstorrent
mingzhe
August 15, 2024, 2:26am
2
根据这个图,图优化相关算法预计在BUDA前端代码实现,目前项目还在搭建中,如需要参考图切分算法可以先去看iree的flow方言中有相关优化
image
799×642 99.9 KB
另外,数据层面,ttmlir有一定的张量布局转换,使得不同大小数据能切分到统一芯片能接受的数据格式大小,具体可以参考
深入TT-MLIR: Tenstorrent的mid-level编译器软件栈
的张量布局章节。
show post in topic