如何格式化我的数据,以便在Keras上进行培训和测试

2024-06-16 09:21:59 发布

您现在位置:Python中文网/ 问答频道 /正文

我现在有点被困在创建一个数据集在我的有线电视新闻网在科拉斯使用。你知道吗

该网络基本上是MNIST数字识别的问题,但在韩国字母字符。不是有0-9个可能的类,而是有2350个。有人已经在TensorFlow中做了完全相同的事情,但是我正在Keras中尝试做同样的事情。你知道吗

我有一个包含jpeg文件的文件夹,一个.csv文件将每个jpeg映射到相应的标签,最后是一个包含所有可能标签的文件。例如,.csv中的前几行是:

image-data/hangul-images/hangul_1.jpeg, 가
image-data/hangul-images/hangul_2.jpeg, 가
image-data/hangul-images/hangul_3.jpeg, 가
image-data/hangul-images/hangul_4.jpeg, 가

所有可能的标签/类别列表中的前几行是:

가
각
간
갇

An example jpeg of the first character is attached 在我看来,我已经得到了我需要的所有部分,我只需要知道我应该如何把它们放在一起训练网络。你知道吗


Tags: 文件csv数据image网络data字母数字