首頁猿問請問MongoDB：聚合框架：獲取...

請問MongoDB：聚合框架：獲取每個分組ID的最新文檔

MongoDB

www說 2019-12-29 04:00:25

我想獲取所有其他字段的每個工作站的最后一個文檔：{ "_id" : ObjectId("535f5d074f075c37fff4cc74"), "station" : "OR", "t" : 86, "dt" : ISODate("2014-04-29T08:02:57.165Z")}{ "_id" : ObjectId("535f5d114f075c37fff4cc75"), "station" : "OR", "t" : 82, "dt" : ISODate("2014-04-29T08:02:57.165Z")}{ "_id" : ObjectId("535f5d364f075c37fff4cc76"), "station" : "WA", "t" : 79, "dt" : ISODate("2014-04-29T08:02:57.165Z")}我需要有t站和每個站的最新dt。使用聚合框架：db.temperature.aggregate([{$sort:{"dt":1}},{$group:{"_id":"$station", result:{$last:"$dt"}, t:{$last:"$t"}}}])退貨{ "result" : [ { "_id" : "WA", "result" : ISODate("2014-04-29T08:02:57.165Z"), "t" : 79 }, { "_id" : "OR", "result" : ISODate("2014-04-29T08:02:57.165Z"), "t" : 82 } ], "ok" : 1}這是最有效的方法嗎？謝謝

查看完整描述

3 回答

慕姐4208626

TA貢獻1852條經(jīng)驗獲得超7個贊

索引是您真正需要的：

db.temperature.ensureIndex({ 'station': 1, 'dt': 1 })

for s in db.temperature.distinct('station'):

db.temperature.find({ station: s }).sort({ dt : -1 }).limit(1)

當然使用實際上對您的語言有效的任何語法。

編輯：您是對的，像這樣的循環(huán)會導致每個站往返，這對幾個站來說非常有用，而對于1000個站則不太好。不過，您仍然希望station + dt上的復合索引能夠取降序排序的優(yōu)點：

db.temperature.aggregate([

{ $sort: { station: 1, dt: -1 } },

{ $group: { _id: "$station", result: {$first:"$dt"}, t: {$first:"$t"} } }

])

反對回復 2020-01-07

守候你守候我

TA貢獻1802條經(jīng)驗獲得超10個贊

至于您發(fā)布的聚合查詢，我將確定您在dt上有一個索引：

db.temperature.ensureIndex({'dt': 1 })

這將確保聚合管道開始時的$ sort盡可能高效。

至于是否是最有效的獲取數(shù)據(jù)的方法，與循環(huán)查詢相比，這可能取決于您擁有多少數(shù)據(jù)點。首先，我認為使用“成千上萬個站點”以及可能成千上萬個數(shù)據(jù)點，聚合方法會更快。

但是，隨著您添加越來越多的數(shù)據(jù)，一個問題是聚合查詢將繼續(xù)接觸所有文檔。隨著您擴展到數(shù)百萬或更多的文檔，這將變得越來越昂貴。這種情況的一種方法是在$ sort之后添加$ limit以限制所考慮的文檔總數(shù)。這有點hacky和不精確，但它將有助于限制需要訪問的文檔總數(shù)。

反對回復 2020-01-07