Loading... [Link](https://arxiv.org/abs/2303.14969) 本文主要介绍了一种用于密集预测任务的通用 Few-shot 学习框架。优点是结构极其简单,由多层 ViT 组成。其引入的匹配方式较为新颖,号称是不是用来匹配但是效果是匹配的方式(本人认为主要是 Transformer 的特性决定)。 [Universal Few-shot Learning of Dense Prediction Tasks with Visual Token Matching.pdf](https://tony102.com/usr/uploads/2024/05/3874951860.pdf) 最后修改:2024 年 05 月 28 日 © 允许规范转载 打赏 赞赏作者 支付宝微信 赞 如果觉得我的文章对你有用,请随意赞赏