您好,登錄后才能下訂單哦!
這篇文章給大家分享的是有關MongoDB中使用JOIN操作的方法的內容。小編覺得挺實用的,因此分享給大家做個參考,一起跟隨小編過來看看吧。
前言
MongoDB是由C++語言所編寫的一種面向文檔的非關系型數據庫(是一種NoSql數據庫實現),也是介于關系型數據庫和非關系型數據庫之間的數據存儲產品,而眾所周知SQL與NoSQL最大的不同之一就是不支持JOIN,在傳統的數據庫中,SQL JOIN子句允許你使用普通的字段,在兩個或者是更多表中的組合表中的每行數據。例如,如果你有表books和publishers,你可以像下面這樣寫命令:
SELECT book.title, publisher.name FROM book LEFT JOIN book.publisher_id ON publisher.id;
換句話說,book表中的publisher_id字段引用了publishers表中的id字典。這些都是很常見的例子:對于每個publisher都可以擁有成千上萬本書,如果你想更新publisher的信息的時候,我們只需要更改一條記錄。數據的冗余是很小的,因為我們不需要為每本書來重復更新他的publisher信息,這種技術已基本當做一種規范化的東西了。SQL數據庫提供了一些列的規范與約束條件來保障數據關聯性。
--------------------------------------------------------------------------------
NoSQL == No JOIN?
并不都是這樣吧。。。。。
--------------------------------------------------------------------------------
面向文檔的數據庫,例如MongoDB,被設計用來存儲非結構化的數據,理想情況下,這些數據是在數據集合中是相互沒有關聯的,如果一條數據包含兩次或者更多次,那數據就重復了。因為大部分情況下我們還是需要數據關聯的,只有很少的情況下才會不需要關聯數據,看來NoSQL這些特性看來讓人失望啊。幸運的是MongoDB 3.2 介紹了一個新的$lookup操作,這個操作可以提供一個類似于LEFT OUTER JOIN的操作在兩個或者是更多的條件下。
--------------------------------------------------------------------------------
MongoDB Aggregation
$lookup僅僅在 aggregation操作中才被允許使用,想想他作為一個管道操作:查詢,過濾,組合結果。一個操作的輸出被作為下一個的輸入。Aggregation比簡單的查詢操作更難于理解,而且這些操作通常運行很慢,然而他們很高效,Aggregation可以使用一個很好的例子來解釋,假設我們使用user數據集合來創建一個社交平臺,在每個獨立的文檔中存儲沒個用戶的信息,例如:
{ "_id": ObjectID("45b83bda421238c76f5c1969"), "name": "User One", "email: "userone@email.com", "country": "UK", "dob": ISODate("1999-09-13T00:00:00.000Z") }
我們可以向user這個集合中添加足夠多的用戶,但是每個MongoDB文檔都必須有一個為一個_id字段值,這個_id字段值就像SQL中的鍵,在我們沒有明確指定_id的時候會被自動的加入到文檔中。我們的社交網站現在需要一個post集合,這個結合存儲用戶的評論,這個文檔存儲純文本,時間,評分,一個被寫到user_id字段的玩家引用。
{ "_id": ObjectID("17c9812acff9ac0bba018cc1"), "user_id": ObjectID("45b83bda421238c76f5c1969"), "date: ISODate("2016-09-05T03:05:00.123Z"), "text": "My life story so far", "rating": "important" }
我們現在想要顯示最近具有important評論的二十條數據,這些數據來自所有的用戶,并且是按照時間排序的。每一個返回的文檔中應該包含評論的文本,發布評論的時間,以及相關的用戶的名字和國家。
MongoDB數據庫的aggregate查詢是通過傳遞管道操作的數組,這個數組中順序的定了每個操作。首先,我們需要從所有的post集合中提取出所有的文檔,這些文檔使用$match記性準確rating過濾。
{ "$match": { "rating": "important" } }
我們現在需要對過濾出來的文檔按照時間,使用$sort操作進行排序。
{ "$sort": { "date": -1 } }
因為我們要僅僅返回二十條數據,我們可以使用$limit來限制我們需要處理的文檔數量。
{ "$limit": 20 }
我們現在使用$lookup操作從user集合中連接數據,這個操作需要一個四個參數的對象:
1、localField:在輸入文檔中的查找字段
2、from:需要連接的集合
3、foreignField:需要在from集合中查找的字段
4、as:輸出的字段名字
所以我們的操作是這樣的:
{ "$lookup": { "localField": "user_id", "from": "user", "foreignField": "_id", "as": "userinfo" } }
在我們的輸出中將會創建一個名為userinfo的新字段,他是一個數組,其中每個元素都是在user集合中匹配的元素。
"userinfo": [ { "name": "User One", ... } ]
在post.user_id與user._id之間,我們具有一對一的關系,因為對于每一個post只有一個用戶。因此我們的userinfo數組將會僅僅包含一個元素,我們可以說使用 $unwind操作來解構他并插入到一個自文檔中。
{ "$unwind": "$userinfo" }
現在的輸出將會轉化成更加常用的結構:
"userinfo": { "name": "User One", "email: "userone@email.com", … }
最終我們可以在管道中使用 $project操作返回評論信息,評論的時間,評論的用戶名,國家等。
{ "$project": { "text": 1, "date": 1, "userinfo.name": 1, "userinfo.country": 1 } }
合并上面所有的操作
我們最終的聚合查詢匹配的評論,按照順序排序,限制最新的二十條信息,連接用戶的數據,扁平用戶數組,最后只返回我們需要的必須數據,總的命令如下:
db.post.aggregate([ { "$match": { "rating": "important" } }, { "$sort": { "date": -1 } }, { "$limit": 20 }, { "$lookup": { "localField": "user_id", "from": "user", "foreignField": "_id", "as": "userinfo" } }, { "$unwind": "$userinfo" }, { "$project": { "text": 1, "date": 1, "userinfo.name": 1, "userinfo.country": 1 } } ]);
結果是一個擁有二十個文檔的集合,例如:
[ { "text": "The latest post", "date: ISODate("2016-09-27T00:00:00.000Z"), "userinfo": { "name": "User One", "country": "UK" } }, { "text": "Another post", "date: ISODate("2016-09-26T00:00:00.000Z"), "userinfo": { "name": "User One", "country": "UK" } } ... ]
MongoDB的$lookup很好用而且很高效,但是上面這個基礎的例子只是一個組合的集合查詢。他不是一個對SQL中的更加高效的JOIN子句的替代。而且MongoDB也提供了一些限制,如果user集合被刪除了,post文檔還是會保留。
理想情況下,這個$lookup操作應該不會經常使用,如果你需要經常使用它,那么你就使用了錯誤的數據存儲了(數據庫):如果你有相關聯的數據,應該使用關聯數據庫(SQL)。
也就是說$lookup是一個MongoDB 3.2新加入的,他解決了當在Nosql數據庫中使用一些小的相關聯的數據查詢的時候一些令人失望的問題。
感謝各位的閱讀!關于“MongoDB中使用JOIN操作的方法”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,讓大家可以學到更多知識,如果覺得文章不錯,可以把它分享出去讓更多的人看到吧!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。