3 回答

TA貢獻(xiàn)1852條經(jīng)驗(yàn) 獲得超7個(gè)贊
索引是您真正需要的:
db.temperature.ensureIndex({ 'station': 1, 'dt': 1 })
for s in db.temperature.distinct('station'):
db.temperature.find({ station: s }).sort({ dt : -1 }).limit(1)
當(dāng)然使用實(shí)際上對(duì)您的語(yǔ)言有效的任何語(yǔ)法。
編輯:您是對(duì)的,像這樣的循環(huán)會(huì)導(dǎo)致每個(gè)站往返,這對(duì)幾個(gè)站來(lái)說(shuō)非常有用,而對(duì)于1000個(gè)站則不太好。不過(guò),您仍然希望station + dt上的復(fù)合索引能夠取降序排序的優(yōu)點(diǎn):
db.temperature.aggregate([
{ $sort: { station: 1, dt: -1 } },
{ $group: { _id: "$station", result: {$first:"$dt"}, t: {$first:"$t"} } }
])

TA貢獻(xiàn)1802條經(jīng)驗(yàn) 獲得超10個(gè)贊
至于您發(fā)布的聚合查詢(xún),我將確定您在dt上有一個(gè)索引:
db.temperature.ensureIndex({'dt': 1 })
這將確保聚合管道開(kāi)始時(shí)的$ sort盡可能高效。
至于是否是最有效的獲取數(shù)據(jù)的方法,與循環(huán)查詢(xún)相比,這可能取決于您擁有多少數(shù)據(jù)點(diǎn)。首先,我認(rèn)為使用“成千上萬(wàn)個(gè)站點(diǎn)”以及可能成千上萬(wàn)個(gè)數(shù)據(jù)點(diǎn),聚合方法會(huì)更快。
但是,隨著您添加越來(lái)越多的數(shù)據(jù),一個(gè)問(wèn)題是聚合查詢(xún)將繼續(xù)接觸所有文檔。隨著您擴(kuò)展到數(shù)百萬(wàn)或更多的文檔,這將變得越來(lái)越昂貴。這種情況的一種方法是在$ sort之后添加$ limit以限制所考慮的文檔總數(shù)。這有點(diǎn)hacky和不精確,但它將有助于限制需要訪(fǎng)問(wèn)的文檔總數(shù)。
- 3 回答
- 0 關(guān)注
- 841 瀏覽
添加回答
舉報(bào)