从数据库B向数据库A添加新的非重复记录的最快方法（两者都是巨大的）

list_from_A = read all rows into a list from database A list_from_B = read all rows into a list from database B no_dupe_list = list(set(list_from_A) - set(list_from_B)) append no_dupe_list into database A

1条回答

网友

1楼 · 发布于 2024-04-19 19:09:18

可以为两个数据库中的有序SELECT创建游标，并“并行”遍历游标记录（如在合并排序中）并在数据库A中插入缺少的行。最好先将它们插入临时表中，以免混淆游标，并且不需要内存使用（2行除外）

比如：

ca = db_a.cursor("SELECT ....")
cb = db_b.cursor("SELECT ....")
ra = ca.fetch_row()
rb = cb.fetch_row()
while ra and rb:
  if ra <= rb:
    last_row_in_new_A = ra
    ra = ca.fetch_row()
  else:  # rb < ra
    if rb != last_row_in_new_A:  # Removes possible duplicates
      insert row rb
      last_row_in_A = rb
    rb = cb.fetch_row()
# Insert remaining rows from B
while rb:
  if rb != last_row_in_new_A:
    insert row rb
    last_row_in_new_A = rb
  rb = cb.fetch_row()

相关问题更多 >

编程相关推荐

热门问题

热门文章

从数据库B向数据库A添加新的非重复记录的最快方法（两者都是巨大的）

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >