深度学习实战:ViT 图像分类 与 DQN 多智能体
Kaggle 竞赛 Top 10%(验证 Acc ≈ 98%)+ 多智能体强化学习实战
PyTorchTransformersViT/DeiTDQN强化学习
问题
应用层做久了容易被质疑「懂不懂底层」——这两个项目是模型侧的动手证明:一个监督学习竞赛、一个多智能体强化学习。
做法
ViT/DeiT 微调:分层学习率 + Label Smoothing + RandAug/Mixup/CutMix 数据增强组合;DQN 多智能体:5×5 网格中训练 4 个 Agent 协同往返运输,共享网络 DQN + 避让优先级机制。
结果
Top 10%
Kaggle 排名
≈ 98%
ViT 验证准确率
95%(平均步数 -20%)
多智能体运输成功率
AI 在这个项目里的角色
模型侧基本功的证明:微调策略、数据增强、奖励设计与多智能体协同都是亲手调出来的。
ViT 图像分类(Kaggle Top 10%)
ViT/DeiT 微调,关键手法:分层学习率(底层小步、顶层大步)、Label Smoothing、RandAug/Mixup/CutMix 增强组合,验证集准确率约 98%,竞赛排名 Top 10%。
DQN 多智能体运输
5×5 网格中 4 个 Agent 往返运输:共享网络 DQN 降低训练成本,避让优先级机制解决路径冲突,成功率 95%,平均步数降低 20%。多智能体的「协同与让行」设计,和今天 Multi-Agent 系统里的冲突仲裁是同一类问题。