深度学习实战：ViT 图像分类与 DQN 多智能体

Kaggle 竞赛 Top 10%（验证 Acc ≈ 98%）+ 多智能体强化学习实战

PyTorchTransformersViT/DeiTDQN强化学习

问题

应用层做久了容易被质疑「懂不懂底层」——这两个项目是模型侧的动手证明：一个监督学习竞赛、一个多智能体强化学习。

ViT/DeiT 微调：分层学习率 + Label Smoothing + RandAug/Mixup/CutMix 数据增强组合；DQN 多智能体：5×5 网格中训练 4 个 Agent 协同往返运输，共享网络 DQN + 避让优先级机制。

Top 10%

Kaggle 排名

≈ 98%

ViT 验证准确率

95%（平均步数 -20%）

多智能体运输成功率

模型侧基本功的证明：微调策略、数据增强、奖励设计与多智能体协同都是亲手调出来的。

ViT/DeiT 微调，关键手法：分层学习率（底层小步、顶层大步）、Label Smoothing、RandAug/Mixup/CutMix 增强组合，验证集准确率约 98%，竞赛排名 Top 10%。

5×5 网格中 4 个 Agent 往返运输：共享网络 DQN 降低训练成本，避让优先级机制解决路径冲突，成功率 95%，平均步数降低 20%。多智能体的「协同与让行」设计，和今天 Multi-Agent 系统里的冲突仲裁是同一类问题。