MySQL中Join算法实现原理分析

 
   | |

导读:文章介绍了MySQL中Join算法实现原理分析。作者在文中分析了表结构等方面的内容。

关键词:MySQL MySQL中Join算法 分析MySQL中Join算法原理

正在加载数据...

  在MySQL中,只有一种Join算法,就是大名鼎鼎的Nested Loop Join,他没有其他很多数据库所提供的Hash Join,也没有Sort Merge Join。顾名思义,Nested Loop Join实际上就是通过驱动表的结果集作为循环基础数据,然后一条一条的通过该结果集中的数据作为过滤条件到下一个表中查询数据,然后合并结果。如果还有第三个参与 Join,则再通过前两个表的Join 结果集作为循环基础数据,再一次通过循环查询条件到第三个表中查询数据,如此往复。

  还是通过示例和图解来说明吧,后面将通过我个人数据库测试环境中的一个 example(自行设计,非MySQL 自己提供) 数据库中的三个表的 Join 查询来进行示例。

  注意:由于这里有些内容需要在MySQL 5.1.18之后的版本中才会体现出来,所以本测试的MySQL 版本为5.1.26

  表结构:


example 11:09:32> show create table user_group\G 
*************************** 1. row *************************** 
Table: user_group 
Create Table: CREATE TABLE `user_group` ( 
`user_id` int(11) NOT NULL, 
`group_id` int(11) NOT NULL, 
`user_type` int(11) NOT NULL, 
`gmt_create` datetime NOT NULL, 
`gmt_modified` datetime NOT NULL, 
`status` varchar(16) NOT NULL, 
KEY `idx_user_group_uid` (`user_id`) 
) ENGINE=MyISAM DEFAULT CHARSET=utf8 
1 row in set (0.00 sec) 
sky@localhost : example 11:10:32> show create table group_message\G 
*************************** 1. row *************************** 
Table: group_message 
Create Table: CREATE TABLE `group_message` ( 
`id` int(11) NOT NULL AUTO_INCREMENT, 
`gmt_create` datetime NOT NULL, 
`gmt_modified` datetime NOT NULL, 
`group_id` int(11) NOT NULL, 
`user_id` int(11) NOT NULL, 
`author` varchar(32) NOT NULL, 
`subject` varchar(128) NOT NULL, 
PRIMARY KEY (`id`), 
KEY `idx_group_message_author_subject` (`author`,`subject`(16)), 
KEY `idx_group_message_author` (`author`), 
KEY `idx_group_message_gid_uid` (`group_id`,`user_id`) 
) ENGINE=MyISAM AUTO_INCREMENT=97 DEFAULT CHARSET=utf8 
1 row in set (0.00 sec) 
sky@localhost : example 11:10:43> show create table group_message_content\G 
*************************** 1. row *************************** 
Table: group_message_content 
Create Table: CREATE TABLE `group_message_content` ( 
`group_msg_id` int(11) NOT NULL, 
`content` text NOT NULL, 
KEY `group_message_content_msg_id` (`group_msg_id`) 
) ENGINE=MyISAM DEFAULT CHARSET=utf8 
1 row in set (0.00 sec)
  
  使用Query如下:

1 select m.subject msg_subject, c.content msg_content2 3 from user_group g,group_message m,group_message_content c4 5 where g.user_id = 16 7 and m.group_id = g.group_id8 9 and c.group_msg_id = m.id

  看看我们的Query的执行计划:


sky@localhost : example 11:17:04> explain select m.subject msg_subject, c.content msg_content
-> from user_group g,group_message m,group_message_content c
-> where g.user_id = 1
-> and m.group_id = g.group_id
-> and c.group_msg_id = m.id\G
*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: g
type: ref
possible_keys: user_group_gid_ind,user_group_uid_ind,user_group_gid_uid_ind
key: user_group_uid_ind
key_len: 4
ref: const
rows: 2
Extra:
*************************** 2. row ***************************
id: 1
select_type: SIMPLE
table: m
type: ref
possible_keys: PRIMARY,idx_group_message_gid_uid
key: idx_group_message_gid_uid
key_len: 4
ref: example.g.group_id
rows: 3
Extra:
*************************** 3. row ***************************
id: 1
select_type: SIMPLE
table: c
type: ref
possible_keys: idx_group_message_content_msg_id
key: idx_group_message_content_msg_id
key_len: 4
ref: example.m.id
rows: 2
Extra:

  我们可以看出,MySQL Query Optimizer选择了user_group作为驱动表,首先利用我们传入的条件user_id通过 该表上面的索引user_group_uid_ind来进行 const 条件的索引ref查找,然后以user_group表中过滤出来的结果集的group_id 字段作为查询条件,对group_message循环查询,然后再通过 user_group 和 group_message 两个表的结果集中的group_message的id作为条件与group_message_content的 group_msg_id 比较进行循环查询,才得到最终的结果。没啥特别的,后一个引用前一个的结果集作为条件,实现过程可以通过下图表示:

  MySQL中Join算法实现原理分析(图一)

  
  下面的我们调整一下 group_message_content 去掉上面的 idx_group_message_content_msg_id 这个索引,然后再看看会是什么效果:


sky@localhost : example 11:25:36> drop index idx_group_message_content_msg_id on group_message_content;
Query OK, 96 rows affected (0.11 sec)

sky@localhost : example 10:21:06> explain
-> select m.subject msg_subject, c.content msg_content
-> from user_group g,group_message m,group_message_content c
-> where g.user_id = 1
-> and m.group_id = g.group_id
-> and c.group_msg_id = m.id\G
*************************** 1. row ***************************
id: 1
select_type: SIMPLE
table: g
type: ref
possible_keys: idx_user_group_uid
key: idx_user_group_uid
key_len: 4
ref: const
rows: 2
Extra:
*************************** 2. row ***************************
id: 1
select_type: SIMPLE
table: m
type: ref
possible_keys: PRIMARY,idx_group_message_gid_uid
key: idx_group_message_gid_uid
key_len: 4
ref: example.g.group_id
rows: 3
Extra:
*************************** 3. row ***************************
id: 1
select_type: SIMPLE
table: c
type: ALL
possible_keys: NULL
key: NULL
key_len: NULL
ref: NULL
rows: 96
Extra: Using where; Using join buffer

  我们看到不仅仅 group_message_content 表的访问从 ref 变成了 ALL,此外,在最后一行的 Extra信息从没有任何内容变成为 Using where; Using join buffer,也就是说,对于从 ref 变成 ALL 很容易理解,没有可以使用的索引的索引了嘛,当然得进行全表扫描了,Using where 也是因为变成全表扫描之后,我们需要取得的 content 字段只能通过对表中的数据进行 where 过滤才能取得,但是后面出现的 Using join buffer 是一个啥呢?


  我们知道,MySQL 中有一个供我们设置的参数 join_buffer_size ,这里实际上就是使用到了通过该参数所设置的 Buffer 区域。那为啥之前的执行计划中没有用到呢?

  实际上,Join Buffer 只有当我们的 Join 类型为 ALL(如示例中),index,rang 或者是 index_merge 的时候 才能够使用,所以,在我们去掉 group_message_content 表的 group_msg_id 字段的索引之前,由于 Join 是 ref 类型的,所以我们的执行计划中并没有看到有使用 Join Buffer。

  当我们使用了 Join Buffer 之后,我们可以通过下面的这张图片来表示 Join 完成过程:

  MySQL中Join算法实现原理分析(图二)

原文出处:http://www.itpub.net/viewthread.php?tid=1102238
 
来源:IT168    作者:简朝阳    
 
 
 
 
 

MySQL数据库设计

 
本文为专家对于有关MySQL的问题作出的回答,提问者想从表'y'中获取整数列'x'并得到以下结果……

热门技术手册排行

 

在本次的技术手册中,我们为您提供了PL/SQL的基础知识以及专家指导,包括了PL/SQL中的数据类型简介、PL/SQL函数与触发器以及PL/SQL中的存储过程等,相信您无论是高手还是菜鸟都可以获得有帮助的信息。

 

本系列文章由三部分组成,为Oracle数据库管理员(DBA)面试成功的必备手册。本专题内容囊括从DBA最初的面试开始,从写“杀手简历”到求职信、到面试过程到Oracle认证再到上升到公司高层最后到你成为公司里的明星DBA。专家为你一一指点迷津,最终让你登上成功的宝座。

 

要成为一名DBA,你需要具备哪些素质?DBA的薪酬待遇如何?DBA的职业道路究竟可以走向何方?我们将在本次的技术手册中为您一一解答。

 

在本次技术手册中,我们将对SQL Server存储过程的调试进行详细的介绍,包括了基础的调试方法和在调试过程中出现的T-SQL性能问题和解决方法。

 

本技术专题主要围绕sql server设计这个话题展开,侧重介绍了sql server集簇索引的设计、如何创建sql server索引、如何优化索引、索引的能与不能、处理sql server 2000索引碎片技巧以及维护sql server索引以实现查询优化等等。

查看更多
 
 

登录TechTarget中国

关闭
本服务仅向TechTarget中国的会员开放,请登录或立即免费注册
电子邮件地址:
请输入您的电子邮件地址
密码:
下次自动登录