与矢量量化相比，C++矢量实现低效率

In [1]: import numpy as np In [2]: a = np.random.randn(1000000) In [3]: a = a.astype(np.float32) In [4]: %timeit np.argsort(a) 86.1 ms ± 1.59 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)

#include <iostream> #include <vector> #include <cstddef> #include <algorithm> #include <opencv2/opencv.hpp> #include <numeric> #include <utility> int main() { //std::vector<float> numbers; float numbers[1000000]; for (int i = 0; i != 1000000; ++i) { numbers[i] = ((float)rand() / (RAND_MAX)); } double e1 = (double)cv::getTickCount(); std::vector<size_t> idx(1000000); std::iota(idx.begin(), idx.end(), 0); std::sort(idx.begin(), idx.end(), [&numbers](const size_t &a, const size_t &b) { return numbers[a] < numbers[b];}); double e2 = (double)cv::getTickCount(); std::cout << "Finished in " << 1000 * (e2 - e1) / cv::getTickFrequency() << " milliseconds." << std::endl; return 0; }

2条回答

网友

1楼 · 编辑于 2024-05-12 14:51:49

创意：

不同的基础算法：。np.argsort默认使用快速排序，C++中的实现可能取决于编译器。
~~函数调用开销：我不确定C++编译器是否内联了比较函数。如果不是，调用此函数也可能会带来一些开销。~~不是this post
编译器标志？

网友

2楼 · 编辑于 2024-05-12 14:51:49

我用10000000项来衡量你的实现。大约花了1.7秒。在

现在我介绍了一个班级

class valuePair {
  public:
    valuePair(int idx, float value) : idx(idx), value(value){};
    int idx;
    float value;
};

with初始化为

^{pr2}$

而排序比所做的还要多

std::sort(pairs.begin(), pairs.end(), [&](const valuePair &a, const valuePair &b) { return a.value < b.value; });

这段代码将运行时间缩短到1.1秒。我认为这是由于缓存的一致性更好，但与python的结果仍然相差甚远。在

相关问题更多 >

编程相关推荐

热门问题

热门文章