大数据 爬虫Python AI Sql

Python MongoDB 一些聚合查询方法

2019-04-14  本文已影响1人  绿岸公式

MongoDB 的聚合查询语法一直让我难以很好的入门,如果不是因为项目需要,我很少会用到它,但是用多了之后,会越来越喜欢它,尤其是接触了一些聚合查询方法后,我发现 MongoDB 真的在业务中提高了不少效率。总之,MongoDB 真香~~~

下面是我的一些平时使用聚合查询的记录

data 集合数据格式

{
    "_id" : ObjectId("5caef7f2c0cd2730919a038f"),
    "sn" : "1904010010000001",
    "dev_id" : 200,
    "dt" : ISODate("2036-02-07T14:29:00.000Z"),
    "data" : {
        "BT" : 20.0,
        "CSQ" : 23,
        "GPSLati" : 39.8679244,
        "GPSLongti" : 116.6568387,
        "Humidity" : 0.0,
        "Temprature" : 0.0,
        "Voltage" : 0.0
    }
}

查询所有 sn 下的最新一条数据

sn = ['1904010010000001', '1904010010000002', '1904010010000003']
pipeline = [
    {'$match': {'sn': {'$in': sn}}},
    {'$group': {'_id': "$sn", "data": {'$last': "$data"}, "dt": {'$last': "$dt"}}},
    {'$sort': {"dt": 1}}]

db.data.aggregate(pipeline)

返回结果(避免数据过长,仅显示一个数据)

[
    {
        '_id': '1812010009000100',
        'data': {
            'Ap': 1009.7, 'BT': 20.0, 'CSQ': 24, 
            'GPSLati': 39.8681678, 'GPSLongti': 116.6591262, 
            'Humidity': 31.400000000000002, 'Temprature': 21.5, 
            'Voltage': 0.98, 'WindDir': 0, 'WindSpeed': 0.0
        }, 
        'dt': datetime.datetime(2019, 4, 14, 17, 44)
    }
]

查询某个 sn 10 小时内每隔 10 分钟统计的平均值

sn = '1904010010000001'
pipeline = [
    {'$project': {'date': {'$substr': ["$dt", 0, 15]}, 'data': '$data'}},
    {'$group': {
        '_id': "$date",
        'temprature': {'$avg': '$data.Temprature'},
        'humidity': {'$avg': '$data.Humidity'},
        'wind_speed': {'$avg': '$data.WindSpeed'},
        'wind_dir': {'$avg': '$data.WindDir'}
    }},
    {'$limit': 60},
    {'$sort': {'_id': -1}}
]

db.data.aggregate(pipeline)

返回结果(避免数据过长,仅显示一个数据)

[
    {
        '_id': '2019-04-14T01:3', 
        'temprature': 10.861538461538462, 
        'humidity': 18.70769230769231, 
        'wind_speed': 0.49230769230769234, 
        'wind_dir': 167.6153846153846
    }
]

原文地址: Python MongoDB 一些聚合查询方法
我的博客: 时空路由器

上一篇下一篇

猜你喜欢

热点阅读