前言

通常,当我们将SQL语句提交给Oracle数据库时,Oracle会选择一种最优方式来执行,这是通过查询优化器Query Optimizer来实现的。CBO(Cost-Based Optimizer)是Oracle默认使用的查询优化器模式。在CBO中,SQL执行计划的生成,是以一种寻找成本(Cost)最优为目标导向的执行计划探索过程。所谓成本(Cost)就是将CPU和IO消耗整合起来的量化指标,每一个执行计划的成本就是经过优化器内部公式估算出的数字值。
我们在写SQL语句的时候,经常会碰到where子句后面有多个条件的情况,也就是根据多列的条件筛选得到数据。默认情况下,oracle会把多列的选择率(selectivity)相乘从而得到where语句的选择率,这样有可能造成选择率(selectivity)不准确,从而导致优化器做出错误的判断。为了能够让优化器做出准确的判断,从而生成准确的执行计划,oracle在11g数据库中引入了收集多列统计信息。本文通过对测试表的多条件查询,介绍收集多列统计信息的重要性。
一、环境准备
我们在Oracle 11g中进行试验。
SQL> SQL> select * from v$version; BANNER -------------------------------------------------------------------------------- Oracle Database 11g Enterprise Edition Release 11.2.0.3.0 - Production PL/SQL Release 11.2.0.3.0 - Production CORE 11.2.0.3.0 Production TNS for Linux: Version 11.2.0.3.0 - Production NLSRTL Version 11.2.0.3.0 - Production SQL>
在hr用户下创建测试表hoegh,重复插入数据,数据量相当于16个employees表(总行数1712=107*16)。
SQL> SQL> conn hr/hr Connected. SQL> SQL> create table hoegh as select * from employees; Table created. SQL> select count(*) from hoegh; COUNT(*) ---------- 107 SQL> SQL> insert into hoegh select * from hoegh; 107 rows created. SQL> / 214 rows created. SQL> / 428 rows created. SQL> / 856 rows created. SQL> commit; Commit complete. SQL> select count(*) from hoegh; COUNT(*) ---------- 1712 SQL>
二、按照常规方法收集统计量信息;
SQL> SQL> exec dbms_stats.gather_table_stats(\'HR\',\'HOEGH\'); PL/SQL procedure successfully completed. SQL>
三、查看执行单个条件的where语句的执行计划
SQL> SQL> explain plan for select * from hoegh where employee_id=110; Explained. SQL> select * from table(dbms_xplan.display); PLAN_TABLE_OUTPUT -------------------------------------------------------------------------------- Plan hash value: 774871165 --------------------------------------------------------------------------- | Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time | --------------------------------------------------------------------------- | 0 | SELECT STATEMENT | | 16 | 1104 | 8 (0)| 00:00:01 | |* 1 | TABLE ACCESS FULL| HOEGH | 16 | 1104 | 8 (0)| 00:00:01 | --------------------------------------------------------------------------- Predicate Information (identified by operation id): --------------------------------------------------- PLAN_TABLE_OUTPUT -------------------------------------------------------------------------------- 1 - filter(\"EMPLOYEE_ID\"=110) 13 rows selected. SQL>
从执行计划可以看出返回了16行记录,结果没有问题。可是,这个16是哪儿来的呢,我们先要了解选择率(selectivity)和返回行数是如何计算的:
选择率(selectivity)=在本例中是 1/唯一值
返回行数=选择率(selectivity)*表记录总数
也就是说,在这个查询语句中,选择率=1/107,返回行数=1/107*1712=16
四、查看执行两个条件的where语句的执行计划
SQL> SQL> explain plan for select * from hoegh where employee_id=110 and email=\'JCHEN\'; Explained. SQL> SQL> select * from table(dbms_xplan.display); PLAN_TABLE_OUTPUT -------------------------------------------------------------------------------- Plan hash value: 774871165 --------------------------------------------------------------------------- | Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time | --------------------------------------------------------------------------- | 0 | SELECT STATEMENT | | 1 | 69 | 8 (0)| 00:00:01 | |* 1 | TABLE ACCESS FULL| HOEGH | 1 | 69 | 8 (0)| 00:00:01 | --------------------------------------------------------------------------- Predicate Information (identified by operation id): --------------------------------------------------- PLAN_TABLE_OUTPUT -------------------------------------------------------------------------------- 1 - filter(\"EMPLOYEE_ID\"=110 AND \"EMAIL\"=\'JCHEN\') 13 rows selected. SQL>
从执行计划可以看出返回了1行记录,而事实又是什么样的呢?我们执行一下这条sql语句。
SQL> select count(*) from hoegh where employee_id=110 and email=\'JCHEN\'; COUNT(*) ---------- 16 SQL>
由此看出,测试表hoegh符合查询条件的数据有16行,而执行计划提示的只有1行,出错了。这是怎么回事呢,也就是我们在开篇提到的选择率(selectivity)出了问题。
在这个多列条件查询语句中,选择率=1/107*1/107,返回行数=1/107*1/107*1712=16/107<1;由于表中存在符合条件的记录,并且返回行数不可能小于1,所以Oracle返回了1。
五、收集多列统计信息,再次查看两个条件的where语句的执行计划
SQL> SQL> exec dbms_stats.gather_table_stats(\'HR\',\'HOEGH\',method_opt=>\'for columns(employee_id,email)\'); PL/SQL procedure successfully completed. SQL> SQL> explain plan for select * from hoegh where employee_id=110 and email=\'JCHEN\'; Explained. SQL> select * from table(dbms_xplan.display); PLAN_TABLE_OUTPUT -------------------------------------------------------------------------------- Plan hash value: 774871165 --------------------------------------------------------------------------- | Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time | --------------------------------------------------------------------------- | 0 | SELECT STATEMENT | | 16 | 1152 | 8 (0)| 00:00:01 | |* 1 | TABLE ACCESS FULL| HOEGH | 16 | 1152 | 8 (0)| 00:00:01 | --------------------------------------------------------------------------- Predicate Information (identified by operation id): --------------------------------------------------- PLAN_TABLE_OUTPUT -------------------------------------------------------------------------------- 1 - filter(\"EMPLOYEE_ID\"=110 AND \"EMAIL\"=\'JCHEN\') 13 rows selected. SQL>
从执行计划的结果来看,同样的一条sql查询语句,在收集多列统计信息后,Oracle的选择率(selectivity)由错变对,这是由于sql语句中的两个条件是有关联的,即employee_id和email在employees表中都是唯一的,都可以唯一标识一行记录;而在收集多列统计信息之前,Oracle并不知道这两个查询条件有关联,所以在计算选择率(selectivity)时,只是简单地采取了相乘的方法。
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对的支持。
# oracle
# 多列统计
# 收集统计信息
# 11g
# 统计信息
# Oracle收集和查看统计信息的方法
# Oracle 12c新特性之如何检测有用的多列统计信息详解
# Oracle统计信息的导出导入测试示例详解
# oracle自动统计信息时间的修改过程记录
# ORACLE中锁住/解锁统计信息的操作代码
# Oracle数据库统计信息方法详解
# 行数
# 这是
# 在这个
# 可以看出
# 最优
# 子句
# 不可能
# 出了
# 是有
# 又是
# 多个
# 有可能
# 而在
# 这两个
# 错了
# 这条
# 当我们
# 会把
# 这篇文章
相关文章:
如何续费美橙建站之星域名及服务?
建站之星免费版是否永久可用?
广德云建站网站建设方案与建站流程优化指南
免费制作统计图的网站有哪些,如何看待现如今年轻人买房难的情况?
如何在沈阳梯子盘古建站优化SEO排名与功能模块?
儿童网站界面设计图片,中国少年儿童教育网站-怎么去注册?
交易网站制作流程,我想开通一个网站,注册一个交易网址,需要那些手续?
已有域名和空间如何搭建网站?
c# Task.ConfigureAwait(true) 在什么场景下是必须的
网站制作壁纸教程视频,电脑壁纸网站?
天津个人网站制作公司,天津网约车驾驶员从业资格证官网?
湖南网站制作公司,湖南上善若水科技有限公司做什么的?
如何通过虚拟主机快速搭建个人网站?
C++如何使用std::optional?(处理可选值)
已有域名和空间,如何快速搭建网站?
如何在腾讯云免费申请建站?
如何在阿里云域名上完成建站全流程?
如何用花生壳三步快速搭建专属网站?
免费视频制作网站,更新又快又好的免费电影网站?
javascript中对象的定义、使用以及对象和原型链操作小结
如何通过商城自助建站源码实现零基础高效建站?
C++时间戳转换成日期时间的步骤和示例代码
网站好制作吗知乎,网站开发好学吗?有什么技巧?
公司门户网站制作公司有哪些,怎样使用wordpress制作一个企业网站?
佛山企业网站制作公司有哪些,沟通100网上服务官网?
头像制作网站在线制作软件,dw网页背景图像怎么设置?
GML (Geography Markup Language)是什么,它如何用XML来表示地理空间信息?
XML的“混合内容”是什么 怎么用DTD或XSD定义
建站之星IIS配置教程:代码生成技巧与站点搭建指南
建站之星伪静态规则如何正确配置?
网站制作的软件有哪些,制作微信公众号除了秀米还有哪些比较好用的平台?
,怎么在广州志愿者网站注册?
如何通过FTP服务器快速搭建网站?
内部网站制作流程,如何建立公司内部网站?
购物网站制作费用多少,开办网上购物网站,需要办理哪些手续?
c++23 std::expected怎么用 c++优雅处理函数错误返回【详解】
网站制作免费,什么网站能看正片电影?
小型网站建站如何选择虚拟主机?
合肥做个网站多少钱,合肥本地有没有比较靠谱的交友平台?
建站之星后台密码遗忘?如何快速找回?
如何快速生成专业多端适配建站电话?
武汉网站设计制作公司,武汉有哪些比较大的同城网站或论坛,就是里面都是武汉人的?
淘宝制作网站有哪些,淘宝网官网主页?
网页设计与网站制作内容,怎样注册网站?
七夕网站制作视频,七夕大促活动怎么报名?
北京的网站制作公司有哪些,哪个视频网站最好?
网站微信制作软件,如何制作微信链接?
代购小票制作网站有哪些,购物小票的简要说明?
大连网站制作公司哪家好一点,大连买房网站哪个好?
制作网站的基本流程,设计网站的软件是什么?
*请认真填写需求信息,我们会在24小时内与您取得联系。