1.为什么大多数生成模型使用解码结构,而不使用编码、解码结构
2.如何将4k长度扩展到8k或者更多
3.beam search ,top k

标签: none

已有 2 条评论

  1. 建议补充性能优化方案,增强实用性。

  2. 文章紧扣主题,观点鲜明,展现出深刻的思考维度。

添加新评论