5.3 数据库 - 5.315 联结表 - 《Unity 从入门到精通》

第15章联结表
- 一、联结
  - 1、关系表
  - 2、为什么要使用联结
- 二、创建联结

第15章联结表

    联结
        关系表
        为什么要使用联结
    创建联结
        WHERE子句的重要性
        内部联结
        联结多个表

一、联结

SQL最强大的功能之一就是能在数据检索查询的执行中联结（join）表。联结是利用SQL的select能执行的最重要的操作，很好地理解联结及其语法是学习SQL的一个极为重要的组成部分。

在能够有效地使用联结前，必须了解关系表以及关系数据库设计的一些基础知识。下面的介绍并不是这个内容的全部知识，但作为入门已经足够了。

1、关系表

理解关系表的最好方法是来看一个现实世界中的例子。

假如有一个包含产品目录的数据库表，其中每种类别的物品占一行。对于每种物品要存储的信息包括产品描述和价格，以及生产该产品的供应商信息。

现在，假如有由同一供应商生产的多种物品，那么在何处存储供应商信息（如，供应商名、地址、联系方法等）呢？将这些数据与产品信息分开存储的理由如下。

※ 因为同一供应商生产的每个产品的供应商信息都是相同的，对每个产品重复此信息既浪费时间又浪费存储空间。 ※ 如果供应商信息改变（例如，供应商搬家或电话号码变动），只需改动一次即可。 ※ 如果有重复数据（即每种产品都存储供应商信息），很难保证每次输入该数据的方式都相同。不一致的数据在报表中很难利用。

关键是，相同数据出现多次绝不是一件好事，此因素是关系数据库设计的基础。关系表的设计就是要保证把信息分解成多个表，一类数据一个表。各表通过某些常用的值（即关系设计中的关系）互相关联。

在这个例子中，可建立两个表，一个存储供应商信息，另一个存储产品信息。vendors表包含所有供应商信息，每个供应商占一行，每个供应商具有唯一的标识。此标识称为主键，可以是供应商ID或任何其他唯一值。

products表只存储产品信息，它除了存储供应商ID（vendors表的主键）外不存储其他供应商信息。vendors表的主键又叫做products的外键，它将vendors表与products表关联，利用供应商ID能从vendors表中找出相应供应商的详细信息。

外键外键为某个表中的一列，它包含另一个表的主键值，定义了两个表之间的关系。

这样做的好处如下：

※ 供应商信息不重复，从而不浪费时间和空间； ※ 如果供应商信息变动，可以只更新vendors表中的单个记录，相关表中的数据不用改动； ※ 由于数据无重复，显然数据是一致的，这使得处理数据更简单。

总之，关系数据可以有效地存储和方便地处理。因此，关系数据库的可伸缩性远比非关系数据库要好。

可伸缩性能够适应不断增加的工作量而不失败。设计良好的数据库或应用程序称之为可伸缩性好。

2、为什么要使用联结

正如所述，分解数据为多个表能更有效地存储，更方便地处理，并且具有更大的可伸缩性。但这些好处是有代价的。

如果数据存储在多个表中，怎样用单条select语句检索出数据？

答案是使用联结。简单地说，联结是一种机制，用来在一条select语句中关联表，因此称之为联结。使用特殊的语法，可以联结多个表返回一组输出，联结在运行时关联表中正确的行。

维护引用完整性重要的是，要理解联结不是物理实体。换句话说，它在实际的数据库表中不存在。联结由MySQL根据需要建立，它存在于查询的执行当中。在使用关系表时，仅在关系列中插入合法的数据非常重要。回到这里的例子，如果在products表中插入拥有非法供应商ID（即没有在vendors表中出现）的供应商生产的产品，则这些产品是不可访问的，因为它们没有关联到某个供应商。为防止这种情况发生，可指示MySQL只允许在products表的供应商ID列中出现合法值（即出现在vendors表中的供应商）。这就是维护引用完整性，它是通过在表的定义中指定主键和外键来实现的。（这将在第21章介绍。）

二、创建联结

联结的创建非常简单，规定要联结的所有表以及它们如何关联即可。

    select vend_name, prod_name, prod_price
    from vendors, products
    where vendors.vend_id = products.vend_id
    order by vend_name, prod_name;

1、WHERE子句的重要性

利用where子句建立联结关系似乎有点奇怪，但实际上，有一个很充分的理由。请记住，在一条select语句中联结几个表时，相应的关系是在运行中构造的。在数据库表的定义中不存在能指示MySQL如何对表进行联结的东西。你必须自己做这件事情。在联结两个表时，你实际上做的是将第一个表中的每一行与第二个表中的每一行配对。where子句作为过滤条件，它只包含那些匹配给定条件（这里是联结条件）的行。没有where子句，第一个表中的每个行将与第二个表中的每个行配对，而不管它们逻辑上是否可以配在一起。

笛卡儿积由没有联结条件的表关系返回的结果为笛卡儿积。检索出的行的数目将是第一个表中的行数乘以第二个表中的行数。

不要忘了where子句应该保证所有联结都有where子句，否则MySQL将返回比想要的数据多得多的数据。同理，应该保证where子句的正确性。不正确的过滤条件将导致MySQL返回不正确的数据。

叉联结有时我们会听到返回称为叉联结的笛卡儿积的联结类型。

2、内部联结

目前为止所有的联结称为等值联结，它基于两个表之间的相等测试。这种联结也称为内部联结。其实，对于这种联结可以使用稍微不同的语法来明确指定联结的类型。下面的select语句返回与前面例子完全相同的数据：

    select vend_name, prod_name, prod_price
    from vendors inner join products
    on venders.vend_id = products.vend_id;

此语句中的select与前面的select语句相同，但from子句不同。这里，两个表之间的关系是from子句的组成部分，以inner join指定。在使用这种语法时，联结条件用特定的on子句而不是where子句给出。传递给on的实际条件与传递给where的相同。

使用哪种语法ANSI SQL规范首选inner join语法。此外，尽管使用where子句定义联结的确比较简单，但是使用明确的联结语法能够确保不会忘记联结条件，有时候这样做也能影响性能。

3、联结多个表

SQL对一条select语句中可以联结的表的数目没有限制。创建联结的基本规则也相同。首先列出所有表，然后定义表之间的关系。

    select prod_name, vend_name, prod_price, quantity
    from orderitems, products, vendors
    where products.vend_id = vendors.vend_id
        and orderitems.prod_id = products.prod_id
        and order_num = 20005;

性能考虑MySQL在运行时关联指定的每个表以处理联结。这种处理可能是非常耗费资源的，因此应该仔细，不要联结不必要的表。联结的表越多，性能下降越厉害。

现在可以回顾一下第14章中的例子。该例子如下所示，其select语句返回订购产品TNT2的客户列表：

    select cust_name, cust_contact
    from customers
    where cust_id in (select cust_id
                      from orders
                      where order_num in (select order_num
                                          from orderitems
                                          where prod_id = 'TNT2'));

正如第14章所述，子查询并不总是执行复杂select操作的最有效的方法，下面是使用联结的相同查询：

    select cust_name, cust_contact
    from customers, orders, orderitems
    where customers.cust_id = orders.cust_id
        and orderitems.order_num = orders.order_num
        and prod_id = 'TNT2';

正如第14章所述，这个查询中返回数据需要使用3个表。但这里我们没有在嵌套子查询中使用它们，而是使用了两个联结。这里有3个where子句条件。前两个关联联结中的表，后一个过滤产品TNT2的数据。

多做实验正如所见，为执行任一给定的SQL操作，一般存在不止一种方法。很少有绝对正确或绝对错误的方法。性能可能会受操作类型、表中数据量、是否存在索引或键以及其他一些条件的影响。因此，有必要对不同的选择机制进行实验，以找出最适合具体情况的方法。

5.315 联结表

第15章 联结表