sql 的優(yōu)化大多數(shù)情況下是索引的優(yōu)化,那么,什么情況下該創(chuàng)建索引,什么情況下不創(chuàng)建索引呢,回答這個(gè)問題之前,先來了解一下基數(shù)和選擇性吧 。
基數(shù)在 Oracle 數(shù)據(jù)庫中,某一列的唯一鍵的數(shù)量叫做基數(shù) 。
舉個(gè)例子,比如一張表中有個(gè) sex 字段,它的值只有 “男” 和 “女” 兩種情況,那我們就說這一列的基數(shù)是2 。
我們可以通過如下語句來查詢一個(gè)字段的基數(shù) 。
select count(distinct deptno) as num from emp

當(dāng)一個(gè)字段的基數(shù)越大的時(shí)候,該列的數(shù)據(jù)分布可能就越均衡 。字段的基數(shù)越小時(shí),該列的數(shù)據(jù)分布可能就越不均衡 。
舉個(gè)例子,在一個(gè)有10000行數(shù)據(jù)的表中,sex 字段基數(shù)為2,他的數(shù)據(jù)分布可能為9999行是男的,1行是女的,這是分布不均衡的現(xiàn)象 。而在身份證字段中,它的基數(shù)是10000,每一行都是一個(gè)不同的身份證號碼,這是分布均衡的現(xiàn)象 。
我們可以通過 group by 語句來查看數(shù)據(jù)的分布情況 。
select deptno,count(1) from emp group by deptno
這個(gè)時(shí)候如果我們要查詢表中性別為男的數(shù)據(jù),那么返回的數(shù)據(jù)就占了表中數(shù)據(jù)的 99.99%,其實(shí)就相當(dāng)于是全表掃描,這種情況就不應(yīng)該走索引了 。但是如果查詢表中性別為女的數(shù)據(jù),那么返回的數(shù)據(jù)就占了表中數(shù)據(jù)的 0.01%,這個(gè)時(shí)候時(shí)候應(yīng)該走索引 。
一般來說,當(dāng)返回表中 5% 以內(nèi)的數(shù)據(jù)的時(shí)候,就應(yīng)該走索引 。超過 5% 的數(shù)據(jù)就要使用全表掃描 。但是這個(gè)說法太絕對了,就像上面查詢 sex 字段時(shí),查詢男性時(shí)候超過了 5%,查詢女性時(shí)候小于 5%,那這個(gè)字段需不需要?jiǎng)?chuàng)建索引呢?
這個(gè)時(shí)候,就需要引入選擇性的概念了 。
選擇性基數(shù)與表的總行數(shù)的比值就是選擇性 。
我們可以通過以下 sql 語句來查詢列的選擇性 。
【oracle數(shù)據(jù)庫菜鳥教程 oracle 性能優(yōu)化工具】
select count(distinct deptno)/count(1) as selectivity from emp
當(dāng)一個(gè)字段的選擇性大于 20%,說明該列數(shù)據(jù)分布就是比較均衡的了 。這個(gè)時(shí)候如果在 where 子句中使用了該字段,那么就應(yīng)該創(chuàng)建索引 。
PS:文中使用了數(shù)據(jù)量較少的表來舉例子,是因?yàn)閿?shù)據(jù)清晰直觀,方便大家理解 。而在實(shí)際情況中,只有大表才會(huì)產(chǎn)生性能問題 。如果一個(gè)表里只有十幾二十條數(shù)據(jù),也就無所謂優(yōu)化了 。
推薦閱讀
- mysql數(shù)據(jù)庫架構(gòu)講解 mysql數(shù)據(jù)庫介紹基本情況
- 數(shù)據(jù)庫多表查詢sql語句 sql數(shù)據(jù)庫安裝教程
- elasticsearch菜鳥教程 阿里云elasticsearch內(nèi)核介紹
- oracle數(shù)據(jù)庫菜鳥教程 sqlserver日志查看
- linux虛擬機(jī)安裝mysql步驟 虛擬機(jī)安裝mysql是數(shù)據(jù)庫
- oracle數(shù)據(jù)庫重啟命令 卸載oracle客戶端步驟
- oracle環(huán)境變量設(shè)置方法 oracle密碼永不過期語句
- shell連接oracle執(zhí)行sql腳本 linux連接oracle數(shù)據(jù)庫命令
- 菜鳥三階魔方還原圖解
- 我的世界菜鳥的皮膚那里來 兩種途徑均可擁有不同皮膚
