PostgreSQL 特有聚合函数

这些功能可以从 django.contrib.postgres.aggregates 模块中获得。在 PostgreSQL docs 中对这些功能有更详细的描述。

备注

所有函数都没有默认别名,因此您必须显式提供一个。例如:

  1. >>> SomeModel.objects.aggregate(arr=ArrayAgg("somefield"))
  2. {'arr': [0, 1, 2]}

通用聚合选项

所有的聚合都有 filter 关键字参数,大多数也有 default 关键字参数。

通用聚合函数

ArrayAgg

class ArrayAgg(expression, distinct=False, filter=None, default=None, ordering=(), **extra)

返回一个值的列表,包括空值,串联成一个数组,如果没有值,则返回 default

  • distinct

    一个可选的布尔参数,用于确定数组值是否会被去重。默认值为 False

  • ordering

    可选的字段名字符串(可选的 "-" 前缀表示降序)或表达式(或字符串和/或表达式的元组或列表),指定结果列表中元素的顺序。

    举例:

    1. "some_field"
    2. "-some_field"
    3. from django.db.models import F
    4. F("some_field").desc()

4.0 版后已移除: 如果没有行,并且没有提供 defaultArrayAgg 会返回一个空列表,而不是 None。这个行为已被废弃,并将在 Django 5.0 中被删除。如果你需要它,请明确设置 defaultValue([])

BitAnd

class BitAnd(expression, filter=None, default=None, **extra)

返回所有非空输入值的位式 ANDint,如果所有值为空,则返回 default

BitOr

class BitOr(expression, filter=None, default=None, **extra)

返回所有非空输入值的位式 ORint,如果所有值为空,则返回 default

BitXor

New in Django 4.1.

class BitXor(expression, filter=None, default=None, **extra)

返回所有非空输入值的按位异或(XOR)的整数,如果所有值都为空,则返回 default。需要 PostgreSQL 14+。

BoolAnd

class BoolAnd(expression, filter=None, default=None, **extra)

如果所有输入值为真,返回 True,如果所有值为空或没有值,返回 default,否则返回 False

使用实例:

  1. class Comment(models.Model):
  2. body = models.TextField()
  3. published = models.BooleanField()
  4. rank = models.IntegerField()
  1. >>> from django.db.models import Q
  2. >>> from django.contrib.postgres.aggregates import BoolAnd
  3. >>> Comment.objects.aggregate(booland=BoolAnd("published"))
  4. {'booland': False}
  5. >>> Comment.objects.aggregate(booland=BoolAnd(Q(rank__lt=100)))
  6. {'booland': True}

BoolOr

class BoolOr(expression, filter=None, default=None, **extra)

如果至少有一个输入值为真,则返回 True,如果所有值都为空或没有值,则返回 default,否则返回 False

使用实例:

  1. class Comment(models.Model):
  2. body = models.TextField()
  3. published = models.BooleanField()
  4. rank = models.IntegerField()
  1. >>> from django.db.models import Q
  2. >>> from django.contrib.postgres.aggregates import BoolOr
  3. >>> Comment.objects.aggregate(boolor=BoolOr("published"))
  4. {'boolor': True}
  5. >>> Comment.objects.aggregate(boolor=BoolOr(Q(rank__gt=2)))
  6. {'boolor': False}

JSONBAgg

class JSONBAgg(expressions, distinct=False, filter=None, default=None, ordering=(), **extra)

返回输入值为 JSON 数组,如果没有值,则返回 default。你可以使用 key 和 index 查找 来查询结果。

  • distinct

    一个可选的布尔参数,用于确定数组值是否会被去重。默认值为 False

  • ordering

    可选的字段名字符串(可选的 "-" 前缀表示降序)或表达式(或字符串和/或表达式的元组或列表),指定结果列表中元素的顺序。

    例子与 ArrayAgg.ordering 相同。

使用实例:

  1. class Room(models.Model):
  2. number = models.IntegerField(unique=True)
  3. class HotelReservation(models.Model):
  4. room = models.ForeignKey("Room", on_delete=models.CASCADE)
  5. start = models.DateTimeField()
  6. end = models.DateTimeField()
  7. requirements = models.JSONField(blank=True, null=True)
  1. >>> from django.contrib.postgres.aggregates import JSONBAgg
  2. >>> Room.objects.annotate(
  3. ... requirements=JSONBAgg(
  4. ... "hotelreservation__requirements",
  5. ... ordering="-hotelreservation__start",
  6. ... )
  7. ... ).filter(requirements__0__sea_view=True).values("number", "requirements")
  8. <QuerySet [{'number': 102, 'requirements': [
  9. {'parking': False, 'sea_view': True, 'double_bed': False},
  10. {'parking': True, 'double_bed': True}
  11. ]}]>

4.0 版后已移除: 如果没有记录,并且没有提供 defaultJSONBAgg 会返回一个空列表,而不是 None。这个行为已被废弃,并将在 Django 5.0 中删除。如果你需要它,请明确设置 defaultValue('[]')

StringAgg

class StringAgg(expression, delimiter, distinct=False, filter=None, default=None, ordering=())

返回输入值串联成的字符串,用 delimiter 字符串分隔,如果没有值,则返回 default

  • delimiter

    必要参数。需要是一个字符串。

  • distinct

    一个可选的布尔参数,用于确定连接的值是否是不同的。默认值为 False

  • ordering

    可选的字段名字符串(可选的 "-" 前缀表示降序)或表达式(或字符串和/或表达式的元组或列表),指定结果字符串中元素的顺序。

    例子与 ArrayAgg.ordering 相同。

使用实例:

  1. class Publication(models.Model):
  2. title = models.CharField(max_length=30)
  3. class Article(models.Model):
  4. headline = models.CharField(max_length=100)
  5. publications = models.ManyToManyField(Publication)
  1. >>> article = Article.objects.create(headline="NASA uses Python")
  2. >>> article.publications.create(title="The Python Journal")
  3. <Publication: Publication object (1)>
  4. >>> article.publications.create(title="Science News")
  5. <Publication: Publication object (2)>
  6. >>> from django.contrib.postgres.aggregates import StringAgg
  7. >>> Article.objects.annotate(
  8. ... publication_names=StringAgg(
  9. ... "publications__title",
  10. ... delimiter=", ",
  11. ... ordering="publications__title",
  12. ... )
  13. ... ).values("headline", "publication_names")
  14. <QuerySet [{
  15. 'headline': 'NASA uses Python', 'publication_names': 'Science News, The Python Journal'
  16. }]>

4.0 版后已移除: 如果没有记录,并且没有提供 defaultStringAgg 会返回一个空字符串,而不是 None。这个行为已经过时,在 Django 5.0 中会被删除。如果你需要它,请明确设置 defaultValue('')

统计的聚合功能

yx

所有这些函数的参数 yx 可以是字段名或返回数值数据的表达式。这两个参数都是必须的。

Corr

class Corr(y, x, filter=None, default=None)

返回相关系数为 float,如果没有任何匹配行,则返回 default

CovarPop

class CovarPop(y, x, sample=False, filter=None, default=None)

返回人口协方差为 float,如果没有任何匹配的行,则返回 default

  • sample

    可选。默认情况下,CovarPop 返回总体协方差。但是,如果 sample=True,返回值将是样本协方差。

RegrAvgX

class RegrAvgX(y, x, filter=None, default=None)

返回自变量的平均数(sum(x)/N)为 float,如果没有任何匹配的行,则返回 default

RegrAvgY

class RegrAvgY(y, x, filter=None, default=None)

返回因变量的平均数(sum(y)/N)为 float,如果没有匹配的行,则为 default

RegrCount

class RegrCount(y, x, filter=None)

返回两个表达式都不为空的输入行数的 int

备注

不支持 default 参数。

RegrIntercept

class RegrIntercept(y, x, filter=None, default=None)

返回由 (x, y) 对确定的最小二乘法线性方程的 y 截距为 float,如果没有任何匹配行,则返回 default

RegrR2

class RegrR2(y, x, filter=None, default=None)

返回相关系数的平方为 float,如果没有任何匹配行,则返回 default

RegrSlope

class RegrSlope(y, x, filter=None, default=None)

返回由 (x, y) 对确定的最小二乘法线性方程的斜率为 float,如果没有任何匹配行,则返回 default

RegrSXX

class RegrSXX(y, x, filter=None, default=None)

返回 sum(x^2) - sum(x)^2/N``(自变量的 “平方之和”)为 ``float,如果没有任何匹配的行,则返回 default

RegrSXY

class RegrSXY(y, x, filter=None, default=None)

返回 sum(x*y) - sum(x) * sum(y)/N``(自变量与因变量的“乘积之和”)为 ``float,如果没有任何匹配的行,则返回 default

RegrSYY

class RegrSYY(y, x, filter=None, default=None)

返回 sum(y^2) - sum(y)^2/N``(因变量的“平方之和”)为 ``float,如果没有任何匹配行,则返回 default

使用实例:

我们将使用这个示例表格:

  1. | FIELD1 | FIELD2 | FIELD3 |
  2. |--------|--------|--------|
  3. | foo | 1 | 13 |
  4. | bar | 2 | (null) |
  5. | test | 3 | 13 |

以下是一些通用聚合函数的示例:

  1. >>> TestModel.objects.aggregate(result=StringAgg("field1", delimiter=";"))
  2. {'result': 'foo;bar;test'}
  3. >>> TestModel.objects.aggregate(result=ArrayAgg("field2"))
  4. {'result': [1, 2, 3]}
  5. >>> TestModel.objects.aggregate(result=ArrayAgg("field1"))
  6. {'result': ['foo', 'bar', 'test']}

下面的示例演示了统计聚合函数的用法。底层的数学原理将不会被描述(您可以在 维基百科 上了解更多信息):

  1. >>> TestModel.objects.aggregate(count=RegrCount(y="field3", x="field2"))
  2. {'count': 2}
  3. >>> TestModel.objects.aggregate(
  4. ... avgx=RegrAvgX(y="field3", x="field2"), avgy=RegrAvgY(y="field3", x="field2")
  5. ... )
  6. {'avgx': 2, 'avgy': 13}