使用TensorFlow在Sagemaker No模块上进行培训,名为“tfˉu container”

2024-04-26 08:07:37 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试在AWS Sagemaker上训练TensorFlow模型。 我用外部lib创建了容器(使用您自己的算法或模型与amazonsagemaker一起使用)。在

我们用TensorFlow API进行培训

from sagemaker.tensorflow import TensorFlow
estimator = TensorFlow(
  entry_point="entry.py",             # entry script
  role=role,
  framework_version="1.13.0",   
  py_version='py3',
  hyperparameters=hyperparameters,
  train_instance_count=1,                   # "The number of GPUs instances to use"
  train_instance_type=train_instance_type,
  image_name=my_image

)
estimator.fit({'train': train_s3, 'eval': eval_s3})

但有一个错误:

^{pr2}$

我能做些什么来解决这个问题?如何调试此案例?在


Tags: instancepy模型imageawss3versiontensorflow
1条回答
网友
1楼 · 发布于 2024-04-26 08:07:37

我猜您使用了自己的TF容器,而不是https://github.com/aws/sagemaker-tensorflow-container上的SageMaker容器

如果是这样,那么您的容器就缺少使用TensorFlow估计器('tf'u container'包)所需的支持代码。在

解决方案是从SageMaker容器开始,对其进行定制,将其推回ECR,并将图像名称传递给SageMaker估计器,参数为“image_name”。在

相关问题 更多 >