如何利用CNN和pytorch改进猫狗分类

2024-06-16 09:47:15 发布

您现在位置:Python中文网/ 问答频道 /正文

在这篇论文中,我试图遵循CNN的体系结构,使用深卷积神经网络(https://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf)进行图像网络分类。在这篇论文中,我试图对1000个类进行分类。在

但是,我的测试准确率一直停留在50%,而且模型没有学习。在

我用23K张猫和狗的图片进行训练,并用2500张图片进行测试。在

这是指向我的笔记本https://github.com/jinglescode/workspace/blob/master/my-journey-computer-vision/codes/Cats_and_Dogs.ipynb的URL

有人能告诉我怎么了吗?我错过了什么?愿意学习。在


Tags: https体系结构with分类图片神经网络卷积cnn
1条回答
网友
1楼 · 发布于 2024-06-16 09:47:15

Normalize your data!!

对于图像数据,可以使用recommended ^{}到您的列车和测试数据集

normalize = transforms.Normalize(mean=[0.485, 0.456, 0.406],
                                     std=[0.229, 0.224, 0.225])
train_transforms = transforms.Compose([transforms.RandomRotation(30),
                                       transforms.RandomResizedCrop(224),
                                       transforms.RandomHorizontalFlip(),
                                       transforms.ToTensor(),
                                       normalize]) 

test_transforms = transforms.Compose([transforms.Resize(255),
                                      transforms.CenterCrop(224),
                                      transforms.ToTensor(),
                                      normalize])

其他评论:

  1. 如果您想“偷看”到数据加载器,那么实例化^{cd2>}是not a good idea。相反,您可以访问存储在dataloader中的数据集,并使用它的^{cd3>}:

    images, labels = dataloader.dataset[0]
    
  2. 如果你的训练“卡在”了,通常的第一反应就是改变学习率

相关问题 更多 >