MongoDB 链接/嵌入/引用

1 投票
1 回答
814 浏览
提问于 2025-04-17 12:20

我一直在阅读MongoDB的文档和教程。

为了测试,我用Python和pymongo写了一个小脚本。

这个脚本基本上创建了3个数据库,每个数据库里有2个集合,分别是“订单”和“产品”。

在产品集合里插入了相同的产品,每个订单集合里放了一份订单,区别在于产品和订单的“关系”处理方式:一种是链接,另一种是嵌入,最后一种是引用。

最后,我更新了产品中的一个值,并打印出来。

我有几个问题:

1 - 这些“关系”处理得好吗?换句话说:引用、嵌入和链接的方式对吗?

2 - 嵌入的订单应该反映商品价格的变化吗?也就是说,商品价格变了,嵌入的订单也要跟着变,还是说这个得通过脚本来处理?

# -*- coding: utf-8 *-*
from pymongo import *
from bson import *

import sys


def connect():
    try:
        auxcon = Connection('localhost', 27017)
        print "Connection: %s  database_names: %s" % (
            auxcon, auxcon.database_names())
        return auxcon
    except error.ConnectionFailure as cf:
        print "Conection error: %s" % cf
        sys.exit(0)

def newDB(db_name, conx):
    try:
        ldb = database.Database(conx, db_name + "_linked")
        edb = database.Database(conx, db_name + "_embedded")
        rdb = database.Database(conx, db_name + "_referenced")
        return ldb, edb, rdb
    except (error.TypeError, error.InvalidName) as err:
        print "Error: %s" % err
        sys.exit(0)

def newCollections(db_name):
    try:
        colprod = db_name.create_collection("products")
        colord = db_name.create_collection("orders")
        return colprod, colord
    except errors.CollectionInvalid as err:
        print "Collection alrready exists %s" % err
        return db_name["products"], db_name["orders"]

def insertProducts(colname):
    product = {"name": "Tablet", "price": 200, "desc": "Android tablet"}
    product2 = {"name": "Phone", "price": 100, "desc": "Samsung Phone"}
    try:
        p1 = colname.insert(product, safe=True)
        p2 = colname.insert(product2, safe=True)
        return p1, p2
    except errors.OperationFailure as err:
        print "Error inserting %s" % err
        return None, None


def updateProducts(colname):
    for product in colname.find({}):
        product["price"] = product["price"] * 110 / 100
        colname.save(product)

def printProducts(colname):
    print "DATABASE: %s COLLECTION: %s" % (
        colname.database.name, colname.name)
    for product in colname.find({}):
        print product

def findOrders(colname):
    print "DATABASE: %s COLLECTION: %s" % (
        colname.database.name, colname.name)
    for order in colname.find({}):
        for key, value in order.items():
            print "%s : %s" % (key, value)

if __name__ == "__main__":
    cx = connect()
    try:
        cx.drop_database("carritodb_linked")
        cx.drop_database("carritodb_embedded")
        cx.drop_database("carritodb_referenced")
    except errors.TypeError as err:
        print "Error %s" % err

    dbl, dbe, dbr = newDB("carritodb", cx)
    licoll = newCollections(dbl)
    emcoll = newCollections(dbe)
    recoll = newCollections(dbr)

    lp1, lp2 = insertProducts(licoll[0])
    ep1, ep2 = insertProducts(emcoll[0])
    rp1, rp2 = insertProducts(recoll[0])

    linkedOrder = {"userInfo": "Alex Martinavarro", "items_chart": [lp1, lp2]}
    linkedOrder = licoll[1].insert(linkedOrder, safe=True)

    embeddedOrder = {"userInfo": "Alex Martinavarro", "items_chart": []}
    embeddedOrder = emcoll[1].insert(embeddedOrder, safe=True)
    embeddedOrder = emcoll[1].find_one(embeddedOrder)
    for product in emcoll[0].find({}):
        embeddedOrder["items_chart"].append(product)
    emcoll[1].save(embeddedOrder)

    p1ref = dbref.DBRef(recoll[0].name, rp1)
    p2ref = dbref.DBRef(recoll[0].name, rp2)
    referencedOrder = {"userInfo": "Alex Martinavarro", "items": [p1ref, p2ref]}
    referencedOrder = recoll[1].insert(referencedOrder, safe=True)

    print "INSERTED PRODUCTS"
    printProducts(licoll[0])
    printProducts(emcoll[0])
    printProducts(recoll[0])

    print "ORDERS"
    findOrders(licoll[1])
    findOrders(emcoll[1])
    findOrders(recoll[1])

    """UPDATING"""
    updateProducts(licoll[0])
    updateProducts(emcoll[0])
    updateProducts(recoll[0])

    print "UPDATED PRODUCTS"
    printProducts(licoll[0])
    printProducts(emcoll[0])
    printProducts(recoll[0])

    print "ORDERS AFTER UPDATE"
    findOrders(licoll[1])
    findOrders(emcoll[1])
    findOrders(recoll[1])

1 个回答

2

我在谷歌小组上回答这个问题,所以如果我的回答和上面提到的有些不同,请见谅。

“2- 嵌入的订单是否应该反映商品价格的变化?”

绝对不应该。想象一下,一个用户下了订单,然后在订单发货之前,突然发现价格莫名其妙地变了。这种情况下,你应该在下单时就把价格记录下来,并放到嵌入的商品列表中。这是大多数(如果不是全部的话)电商网站的做法。

“相同的商品被插入到商品集合中,每个订单集合中都有一个订单,区别在于商品和订单的‘关联’方式:一种是链接,另一种是嵌入,最后一种是引用。”

这三种方式都是有效的,当然要看你是怎么进行嵌入的。如果你是在订单中嵌入已订购的商品,那是可以的;但如果你是在商品中嵌入订单,那就不太合适了。因为我怀疑会有人下单买到超过16Mb的商品,所以你应该是安全的。

希望这能帮到你,

撰写回答