图像识别，如何开始

1条回答

网友

1楼 · 发布于 2024-05-13 22:35:23

如果您通读了this tutorial，特别是“使用pythonapi”一节，那么您的项目应该相当简单。在这段代码中，classify_image.py产生的前N个结果被转换成人类可读的文本here：

top_k = predictions.argsort()[-FLAGS.num_top_predictions:][::-1]
for node_id in top_k:
    human_string = node_lookup.id_to_string(node_id)
    score = predictions[node_id]
    print('%s (score = %.5f)' % (human_string, score))

对于您的示例，您希望将FLAGS.num_top_predictions设置为5，并且希望将前5个human_string值累加为如下所示：

top_k_strings = []
top_k = predictions.argsort()[-FLAGS.num_top_predictions:][::-1]
for node_id in top_k:
    human_string = node_lookup.id_to_string(node_id)
    top_k_strings.append(human_string)
    score = predictions[node_id]
    print('%s (score = %.5f)' % (human_string, score))

最后，您可以检查“keys”是否是imagenet生成的前5个字符串之一，并将布尔值作为

return "keys" in top_k_strings

此外，如果您对人类可读类别的完整列表感兴趣，您可以找到它们here

关于视频，你可能是对的，你必须对视频序列进行二次采样以跟上帧速率。一些实验和计时测试会让你感觉到所需的子采样率。你知道吗

祝你好运！你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章

图像识别，如何开始

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >