Tenstorrent partition部分的详细算法

根据这个图,图优化相关算法预计在BUDA前端代码实现,目前项目还在搭建中,如需要参考图切分算法可以先去看iree的flow方言中有相关优化


另外,数据层面,ttmlir有一定的张量布局转换,使得不同大小数据能切分到统一芯片能接受的数据格式大小,具体可以参考深入TT-MLIR: Tenstorrent的mid-level编译器软件栈 的张量布局章节。