布雷·柯蒂斯·迪斯坦

2024-06-06 19:32:17 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在运行一个简单的KNN,它实际上从CSV文件中读取数据。实现是针对NLP的。数据输入到它是共振峰(1,2,和3)为一个元音说,在一个特定的词所说的不同用户(男性和女性不同口音)。总共有3个不同的元音,每个元音代表一个类。你知道吗

CSV文件头

对我来说,问题是试图找到最好的可能的准确性,目前我正在玩最好的公制距离。使用的n-邻域为27,结果最好。在这一点上,我的问题是我是否可以利用Bray-Curtis距离来实现这个特定的实现。你知道吗

我主要是问,因为对于布雷-柯蒂斯距离,获得了71%的精度,而对于欧几里德距离和任何其他使用的距离,获得了63%或更低的精度,用于相同的参数。你知道吗

提前谢谢

代码:

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.25, random_state=1, stratify=y)

# Create KNN classifier
knn = KNeighborsClassifier(metric='braycurtis', n_neighbors = 27)
knn.fit(X_train,y_train)

print('Accuracy:\t\t', knn.score(X_test, y_test), '\n')

Tags: 文件csv数据用户test距离nlp精度