我正在尝试在AWS Sagemaker上训练TensorFlow模型。 我用外部lib创建了容器(使用您自己的算法或模型与amazonsagemaker一起使用)。在
我们用TensorFlow API进行培训
from sagemaker.tensorflow import TensorFlow
estimator = TensorFlow(
entry_point="entry.py", # entry script
role=role,
framework_version="1.13.0",
py_version='py3',
hyperparameters=hyperparameters,
train_instance_count=1, # "The number of GPUs instances to use"
train_instance_type=train_instance_type,
image_name=my_image
)
estimator.fit({'train': train_s3, 'eval': eval_s3})
但有一个错误:
^{pr2}$我能做些什么来解决这个问题?如何调试此案例?在
我猜您使用了自己的TF容器,而不是https://github.com/aws/sagemaker-tensorflow-container上的SageMaker容器
如果是这样,那么您的容器就缺少使用TensorFlow估计器('tf'u container'包)所需的支持代码。在
解决方案是从SageMaker容器开始,对其进行定制,将其推回ECR,并将图像名称传递给SageMaker估计器,参数为“image_name”。在
相关问题 更多 >
编程相关推荐