查询表达式

查询表达式可以作为过滤,分组,注解或者是聚合的一个值或者是计算。这里(文档中)有很多内置表达式可以帮助你完成自己的查询。表达式可以组合,甚至是嵌套,来完成更加复杂的计算

支持的算术

Django支持在查询表达式使用加减乘除,求模,幂运算,Python常量,变量甚至是其它表达式。

New in Django 1.7:

增加了对指数运算符**的支持。

一些例子

Changed in Django 1.8:

一些例子依赖于Django1.8中的新功能

  1. from django.db.models import F, Count
  2. from django.db.models.functions import Length
  3. # Find companies that have more employees than chairs.
  4. Company.objects.filter(num_employees__gt=F('num_chairs'))
  5. # Find companies that have at least twice as many employees
  6. # as chairs. Both the querysets below are equivalent.
  7. Company.objects.filter(num_employees__gt=F('num_chairs') * 2)
  8. Company.objects.filter(
  9. num_employees__gt=F('num_chairs') + F('num_chairs'))
  10. # How many chairs are needed for each company to seat all employees?
  11. >>> company = Company.objects.filter(
  12. ... num_employees__gt=F('num_chairs')).annotate(
  13. ... chairs_needed=F('num_employees') - F('num_chairs')).first()
  14. >>> company.num_employees
  15. 120
  16. >>> company.num_chairs
  17. 50
  18. >>> company.chairs_needed
  19. 70
  20. # Annotate models with an aggregated value. Both forms
  21. # below are equivalent.
  22. Company.objects.annotate(num_products=Count('products'))
  23. Company.objects.annotate(num_products=Count(F('products')))
  24. # Aggregates can contain complex computations also
  25. Company.objects.annotate(num_offerings=Count(F('products') + F('services')))
  26. # Expressions can also be used in order_by()
  27. Company.objects.order_by(Length('name').asc())
  28. Company.objects.order_by(Length('name').desc())

内置表达式

说明

这些表达式定义在django.db.models.expressionsdjango.db.models.aggregates中, 但为了方便,通常可以直接从django.db.models导入.

F() 表达式

class F

一个 F()对象代表了一个model的字段值或注释列。使用它就可以直接参考model的field和执行数据库操作而不用再把它们(model field)查询出来放到python内存中。

作为代替,Django使用 F()对象生成一个SQL表达式,来描述数据库层级所需要的操作

这些通过一个例子可以很容易的理解。往常,我们会这样做:

  1. # Tintin filed a news story!
  2. reporter = Reporters.objects.get(name='Tintin')
  3. reporter.stories_filed += 1
  4. reporter.save()

这里呢,我们把 reporter.stories_filed 的值从数据库取出放到内存中并用我们熟悉的python运算符操作它,最后再把它保存到数据库。然而,我们还可以这样做:

  1. from django.db.models import F
  2. reporter = Reporters.objects.get(name='Tintin')
  3. reporter.stories_filed = F('stories_filed') + 1
  4. reporter.save()

虽然reporter.stories_filed = F('stories_filed') + 1看起来像一个正常的Python分配值赋给一个实例属性,事实上这是一个描述数据库操作的SQL概念

当Django遇到 F()实例,它覆盖了标准的Python运算符创建一个封装的SQL表达式。在这个例子中,reporter.stories_filed就代表了一个指示数据库对该字段进行增量的命令。

无论reporter.stories_filed的值是或曾是什么,Python一无所知—这完全是由数据库去处理的。所有的Python,通过Django的F() 类,只是去创建SQL语法参考字段和描述操作。

为了获得用这种方法保存的新值,此对象应重新加载:

  1. reporter = Reporters.objects.get(pk=reporter.pk)

.和上面单独实例的操作一样, F()配合 update()可以应用于对象实例的QuerySets`这减少了我们上面使用的两个查询 -get()和[save()`]($instances.html#django.db.models.Model.save “django.db.models.Model.save”) - 只有一个:

  1. reporter = Reporters.objects.filter(name='Tintin')
  2. reporter.update(stories_filed=F('stories_filed') + 1)

我们可以使用update()方法批量地增加多个对象的字段值。这比先从数据库查询后,通过循环一个个增加,并一个个保存要快的很多。

  1. Reporter.objects.all().update(stories_filed=F('stories_filed') + 1)

F()表达式的效率上的优点主要体现在

  • 直接通过数据库操作而不是Python
  • 减少数据库查询次数

使用 F() 避免竞态条件

使用 F() 的另一个好处是通过数据库而不是Python来更新字段值以避免竞态条件.

如果两个Python线程执行上面第一个例子中的代码,一个线程可能在另一个线程刚从数据库中获取完字段值后获取、增加、保存该字段值。第二个线程保存的值将会基于原始字段值;第一个线程的工作将会丢失。

如果让数据库对更新字段负责,这个过程将变得更稳健:它将只会在 save()update()执行时根据数据库中该字段值来更新字段,而不是基于实例之前获取的字段值。

在过滤器中使用 F()

F()查询集 过滤器中也十分有用,它使得使用条件通过字段值而不是Python值过滤一组对象变得可能。

这在 在查询中使用F()表达式 中被记录。

使用F()和注释

F()可用于通过将不同字段与算术相结合来在模型上创建动态字段:

  1. company = Company.objects.annotate(
  2. chairs_needed=F('num_employees') - F('num_chairs'))

如果你组合的字段是不同类型,你需要告诉Django将返回什么类型的字段。由于F()不直接支持output_field,您需要使用ExpressionWrapper

  1. from django.db.models import DateTimeField, ExpressionWrapper, F
  2. Ticket.objects.annotate(
  3. expires=ExpressionWrapper(
  4. F('active_at') + F('duration'), output_field=DateTimeField()))

Func()表达式

New in Django 1.8.

Func() 表达式是所有表达式的基础类型,包括数据库函数如 COALESCELOWER, 或者 SUM聚合.用下面方式可以直接使用:

  1. from django.db.models import Func, F
  2. queryset.annotate(field_lower=Func(F('field'), function='LOWER'))

或者它们可以用于构建数据库函数库:

  1. class Lower(Func):
  2. function = 'LOWER'
  3. queryset.annotate(field_lower=Lower(F('field')))

但是这两种情况都将导致查询集,其中每个模型用从以下SQL大致生成的额外属性field_lower注释:

  1. SELECT
  2. ...
  3. LOWER("app_label"."field") as "field_lower"

有关内置数据库函数的列表,请参见数据库函数

Func API如下:

class Func(*expressions, **extra)

function

描述将生成的函数的类属性。具体来说,函数将被插入为模板中的函数占位符。默认为

template

类属性,作为格式字符串,描述为此函数生成的SQL。默认为'%(function)s(%(expressions)s)'

arg_joiner

类属性,表示用于连接表达式列表的字符。默认为', '

*expressions参数是函数将要应用与表达式的位置参数列表。表达式将转换为字符串,与arg_joiner连接在一起,然后作为expressions占位符插入template

位置参数可以是表达式或Python值。字符串假定为列引用,并且将包装在F()表达式中,而其他值将包裹在Value()表达式中。

**extra kwargs是可以插入到template属性中的key=value对。请注意,关键字functiontemplate可用于分别替换functiontemplate属性,而无需定义自己的类。output_field可用于定义预期的返回类型。

Aggregate()表达式

聚合表达式是Func() expression的一种特殊情况,它通知查询:GROUP BY子句是必须的。所有aggregate functions,如Sum()Count(),继承自Aggregate()

由于Aggregate是表达式和​​换行表达式,因此您可以表示一些复杂的计算:

  1. from django.db.models import Count
  2. Company.objects.annotate(
  3. managers_required=(Count('num_employees') / 4) + Count('num_managers'))

Aggregate API如下:

class Aggregate(expression, output_field=None, **extra)

template

类属性,作为格式字符串,描述为此聚合生成的SQL。默认为'%(函数)s( %(表达式)s )

function

描述将生成的聚合函数的类属性。具体来说,function将被插入为template中的function占位符。默认为None

expression参数可以是模型上的字段的名称,也可以是另一个表达式。它将转换为字符串,并用作template中的expressions占位符。

output_field参数需要一个模型字段实例,如IntegerField()BooleanField(),Django将在检索后数据库。通常在实例化模型字段时不需要任何参数,因为与数据验证相关的任何参数(max_lengthmax_digits等)不会对表达式的输出值强制执行。

注意,只有当Django无法确定结果应该是什么字段类型时,才需要output_field。混合字段类型的复杂表达式应定义所需的output_field。例如,将IntegerField()FloatField()添加在一起应该可以有output_field=FloatField()

Changed in Django 1.8:

output_field是一个新参数。

**extra kwargs是可以插入到template属性中的key=value对。

New in Django 1.8:

聚合函数现在可以在单个函数中使用算术和参考多个模型字段。

创建自己的聚合函数

创建自己的聚合是非常容易的。至少,您需要定义function,但也可以完全自定义生成的SQL。这里有一个简单的例子:

  1. from django.db.models import Aggregate
  2. class Count(Aggregate):
  3. # supports COUNT(distinct field)
  4. function = 'COUNT'
  5. template = '%(function)s(%(distinct)s%(expressions)s)'
  6. def __init__(self, expression, distinct=False, **extra):
  7. super(Count, self).__init__(
  8. expression,
  9. distinct='DISTINCT ' if distinct else '',
  10. output_field=IntegerField(),
  11. **extra)

Value()表达式

class Value(value, output_field=None)

Value()对象表示表达式的最小可能组件:简单值。当您需要在表达式中表示整数,布尔或字符串的值时,可以在Value()中包装该值。

您很少需要直接使用Value()。当您编写表达式F('field') + 1时,Django隐式包装1Value()中,允许在更复杂的表达式中使用简单的值。

value参数描述要包括在表达式中的值,例如1TrueNone。Django知道如何将这些Python值转换为相应的数据库类型。

output_field参数应为模型字段实例,如IntegerField()BooleanField(),Django将在检索后从数据库。通常在实例化模型字段时不需要任何参数,因为与数据验证相关的任何参数(max_lengthmax_digits等)不会对表达式的输出值强制执行。

ExpressionWrapper()表达式

class ExpressionWrapper(expression, output_field)

New in Django 1.8.

ExpressionWrapper简单地包围另一个表达式,并提供对其他表达式可能不可用的属性(例如output_field)的访问。当对Using F() with annotations中描述的不同类型的F()表达式使用算术时,必须使用ExpressionWrapper

条件表达式

New in Django 1.8.

条件表达式允许您使用ifelifelse查询中的逻辑。Django本地支持SQL CASE表达式。有关更多详细信息,请参阅Conditional Expressions

技术信息

下面您将找到对图书馆作者有用的技术实施细节。下面的技术API和示例将有助于创建可扩展Django提供的内置功能的通用查询表达式。

表达式API

查询表达式实现了query expression API,但也暴露了下面列出的一些额外的方法和属性。所有查询表达式必须从Expression()或相关子类继承。

当查询表达式包装另一个表达式时,它负责调用包装表达式上的相应方法。

class Expression

contains_aggregate

告诉Django此表达式包含聚合,并且需要将GROUP BY子句添加到查询中。

resolve_expression(query=None, allow_joins=True, reuse=None, summarize=False)

提供在将表达式添加到查询之前对表达式执行任何预处理或验证的机会。还必须在任何嵌套表达式上调用resolve_expression()。应该返回具有任何必要变换的selfcopy()

query是后端查询实现。

allow_joins是一个布尔值,允许或拒绝在查询中使用联接。

reuse是用于多连接场景的一组可重用连接。

summarize是一个布尔值,当True时,表示正在计算的查询是终端聚合查询。

get_source_expressions()

返回内部表达式的有序列表。例如:

  1. >>> Sum(F('foo')).get_source_expressions()
  2. [F('foo')]

set_source_expressions(expressions)

获取表达式列表并存储它们,以便get_source_expressions()可以返回它们。

relabeled_clone(change_map)

返回self的克隆(副本),并重新标记任何列别名。创建子查询时,将重命名列别名。relabeled_clone()也应该在任何嵌套表达式上调用并分配给克隆。

change_map是将旧别名映射到新别名的字典。

例:

  1. def relabeled_clone(self, change_map):
  2. clone = copy.copy(self)
  3. clone.expression = self.expression.relabeled_clone(change_map)
  4. return clone

convert_value(self, value, expression, connection, context)

允许表达式将value强制为更适当类型的钩子。

refs_aggregate(existing_aggregates)

Returns a tuple containing the (aggregate, lookup_path) of the first aggregate that this expression (or any nested expression) references, or (False, ()) if no aggregate is referenced. 例如:

  1. queryset.filter(num_chairs__gt=F('sum__employees'))

F()表达式此处引用前一个Sum()计算,这意味着此过滤器表达式应添加到HAVING WHERE子句。

在大多数情况下,对任何嵌套表达式返回refs_aggregate的结果应该是合适的,因为必要的内置表达式将返回正确的值。

get_group_by_cols()

负责返回此表达式的列引用列表。get_group_by_cols()应在任何嵌套表达式上调用。F()对象,特别是保存对列的引用。

asc()

返回准备好以升序排序的表达式。

desc()

返回准备好以降序排序的表达式。

reverse_ordering()

通过在order_by调用中反转排序顺序所需的任何修改,返回self。例如,执行NULLS LAST的表达式将其值更改为NULLS FIRST。仅对实现类似OrderBy的排序顺序的表达式需要修改。当在查询集上调用reverse()时,调用此方法。

编写自己的查询表达式

您可以编写自己的查询表达式类,这些类使用其他查询表达式,并可以与其集成。让我们通过编写一个COALESCE SQL函数的实现,而不使用内置的Func() expressions来演示一个例子。

COALESCE SQL函数定义为获取列或值的列表。它将返回不是NULL的第一列或值。

我们将首先定义用于生成SQL的模板,然后使用__init__()方法来设置一些属性:

  1. import copy
  2. from django.db.models import Expression
  3. class Coalesce(Expression):
  4. template = 'COALESCE( %(expressions)s )'
  5. def __init__(self, expressions, output_field, **extra):
  6. super(Coalesce, self).__init__(output_field=output_field)
  7. if len(expressions) < 2:
  8. raise ValueError('expressions must have at least 2 elements')
  9. for expression in expressions:
  10. if not hasattr(expression, 'resolve_expression'):
  11. raise TypeError('%r is not an Expression' % expression)
  12. self.expressions = expressions
  13. self.extra = extra

我们对参数进行一些基本验证,包括至少需要2列或值,并确保它们是表达式。我们在这里需要output_field,以便Django知道要将最终结果分配给什么样的模型字段。

现在我们实现预处理和验证。由于我们现在没有任何自己的验证,我们只是委托给嵌套表达式:

  1. def resolve_expression(self, query=None, allow_joins=True, reuse=None, summarize=False):
  2. c = self.copy()
  3. c.is_summary = summarize
  4. for pos, expression in enumerate(self.expressions):
  5. c.expressions[pos] = expression.resolve_expression(query, allow_joins, reuse, summarize)
  6. return c

接下来,我们编写负责生成SQL的方法:

  1. def as_sql(self, compiler, connection):
  2. sql_expressions, sql_params = [], []
  3. for expression in self.expressions:
  4. sql, params = compiler.compile(expression)
  5. sql_expressions.append(sql)
  6. sql_params.extend(params)
  7. self.extra['expressions'] = ','.join(sql_expressions)
  8. return self.template % self.extra, sql_params
  9. def as_oracle(self, compiler, connection):
  10. """
  11. Example of vendor specific handling (Oracle in this case).
  12. Let's make the function name lowercase.
  13. """
  14. self.template = 'coalesce( %(expressions)s )'
  15. return self.as_sql(compiler, connection)

我们使用compiler.compile()方法为每个expressions生成SQL,并用逗号连接结果。然后使用我们的数据填充模板,并返回SQL和参数。

我们还定义了一个特定于Oracle后端的自定义实现。如果Oracle后端正在使用,则将调用as_oracle()函数,而不是as_sql()

最后,我们实现允许我们的查询表达式与其他查询表达式一起播放的其他方法:

  1. def get_source_expressions(self):
  2. return self.expressions
  3. def set_source_expressions(self, expressions):
  4. self.expressions = expressions

让我们看看它是如何工作的:

  1. >>> from django.db.models import F, Value, CharField
  2. >>> qs = Company.objects.annotate(
  3. ... tagline=Coalesce([
  4. ... F('motto'),
  5. ... F('ticker_name'),
  6. ... F('description'),
  7. ... Value('No Tagline')
  8. ... ], output_field=CharField()))
  9. >>> for c in qs:
  10. ... print("%s: %s" % (c.name, c.tagline))
  11. ...
  12. Google: Do No Evil
  13. Apple: AAPL
  14. Yahoo: Internet Company
  15. Django Software Foundation: No Tagline