有没有人有在 Jax 和 Pytorch 中进行大规模训练的经验?如果有的话,在什么规模下你真的感受到 Pytorch 的痛点,而在什么规模下你觉得 Jax 的一般痛点绝对是值得的?
23.01K