基础知识
数据库(database) 是一个以某种有组织的方式存储的数据集合。理解数据库的一种最简单的办法是将其想象为一个文件柜。此文件柜是一个存放数据的物理位置,不管数据是什么以及如何组织的
表(table) 是一种结构化的文件,可用来存储某种特定类型的数据(数据库中的每个表名都是唯一的)
模式(schema) 是指数据库的结构和组织方式,描述了数据库中对象的布局、特性及它们之间的关系
列(column) 是表中的一个字段。所有表都是由一个或多个列组成的。
行(row) 是表中的一个记录。
主键(primary key) 是一列(或一组列),其值能够唯一区分表中每个行。
- 一列:主键列不允许null值和重复值
- 一组列:所有列值的组合必须是唯一的(但单个列的值可以不唯一)
打开数据库
打开数据库:
mysql -u 用户名 -p
选择数据库:
use 数据库名;
必须先使用 use 打开数据库,才能读取其中的数据。
基础命令
命令输入在 mysql> 之后;
命令用
;或\g结束,换句话说,仅按enter不执行命令;输入
help或\h获得帮助,也可以输入更多的文本获得特定命令的帮助(如,输入help select;获得使用select语句的帮助);输入
quit或exit退出命令行实用程序。
显示信息
显示数据库信息:
show databases;
获得一个数据库内的表的列表:
show tables;
显示表列:
show columns from 表名; describe 表名; # 另一种快捷方式
显示广泛的服务器状态信息:
show status;
显示创建特定数据库:
show create database 数据库名;
显示创建特定表:
show create table 表名;
显示表的列结构:
desc 表名;
显示各列数据:
select 列名1, 列名2, ... from 表名;
select 命令还能用来显示与数据库无关的值;例如:
select '测试123123'; # 输出结果为:`测试123123` select 2+3*4; # 输出结果为:`14`
显示表格中全部列的数据:
select * from 表名;
显示授予用户的安全权限:
show grants;
显示服务器错误或者警告信息:
show erroes; show warnings;
显示允许的 show 语句:
help show;
查看和显示数据库的编码方式:
show create database 数据库名;
显示当前使用的数据库:
select database();
显示索引
show insex from 表名;
增删改
创建数据库:
create database 数据库名;
# 举例:创建并使用数据库 create database phone; # 创建数据库 phone show databases; # 查看是否成功创建 phone use phone; # 使用数据库 /* 在使用 use 选择数据库的状态下,也能够操作其他数据库中的表。(将数据库名和表名用 . 连接起来)*/ select * from db2.table1;
创建数据库并设置数据库的字符编码:
create database 数据库名 character set utf8; # 另一种缩写方式 create database 数据库名 charset utf8;
创建表:
create table 表名(列名1 字段类型, 列名2 字段类型, 列名3 字段类型, …);
为创建索引
create index 索引名 on 表名 (列名1, 列名2, ...);
复制表的列结构和记录:
create table 新表名 as select * from 旧表名;
仅复制表的列结构:
create table 新表名 like 原表名;
仅复制表的记录:
insert into 新表名 select * from 原表名;选择某一列进行复制:(复制 列的数据结构必须一致,否则可能会复制失败)
insert into 新表名(新列名) select 原列名 from 原表名;
设置主键:
# 设置单个主键列 create table 表名 (主键列名 数据类型 primary key, 普通列名 数据类型); # 设置复合主键 create table 表名 (主键列名1 数据类型, 主键列名2 数据类型, 普通列名 数据类型, primary key (主键列名1, 主键列名2));
设置唯一键:
create table 表名 (唯一键列名 数据类型 unique, 普通列名 数据类型);
主键和唯一键区别:
| 特性 | 主键约束 (primary key) | 唯一约束 (unique) |
|---|---|---|
| 列的唯一性 | 确保列值唯一,且不能为 null。 | 确保列值唯一,但可以包含 null(根据数据库的具体实现)。 |
| null 值 | 不允许有 null 值。 | 可以有 null 值,但通常每个 null 只能出现一次(具体依赖数据库实现)。 |
| 索引 | 自动创建唯一索引,且该索引被视为主索引。 | 自动创建唯一索引,但它不是主索引。 |
| 表中的数量 | 每个表只能有一个主键。 | 一个表可以有多个唯一约束。 |
| 用途 | 用于标识每行唯一数据。 | 用于确保某列的值是唯一的,适用于不需要作为行标识符的列。 |
添加能自动连续编号的列,列要求:
- 数据类型为 int 等整数类型
- 加上关键字
auto_increment(每个表中只能有一个auto_increment列)- 必须是 主键 或 唯一键。
create table 表名 (能自动编号的列名 整数数据类型 auto_increment primary key, 其他列名 数据类型); create table 表名 (能自动编号的列名 整数数据类型 auto_increment unique, 其他列名 数据类型);
插入数据验证是否连续编号:
insert into 表名 (其他列名) values(插入的值); # 举例 insert into phone_test (name) values('mike');设置连续编号的初始值:
insert into 表名 values(连续编号值, 其他列值); # 举例 insert into phone_test values(100, 'mike');如果把表中数据都删除,然后重新输入,编号不会从头开始,而是从 最大值+1 开始分配
create table test1 (id1 int auto_increment primary key, name char(10)); insert into test1 (name) values('mmike'); # 1 mmike insert into test1 values(100, 'mike'); # 1 mmike 和 100 mike delete from test1; # 删除上面两条数据 insert into test1 (name) values('moke'); # 101 moke初始化
auto_increment的值 (如果初始化的值小于现有表格中最大值,那么初始化会不起作用;如果想要重新从 1 开始,必须清空表中的数据。)alter table 表名 auto_increment=200;
设置列的默认值
create table 表名 (列名 数据类型 default 默认值 ...);
# 修改已有列并为其添加默认值 alter table 表名 modify column 列名 数据类型 default 默认值; # 添加默认值到新列 alter table 表名 add column 列名 数据类型 default 默认值; # 添加默认值,不更改数据类型 alter table 表名 alter column 列名 set default 默认值;
更新数据:
update customers # 更新 customers 表 set cust_name = 'the fudds', cust_email='elmer@fudd.com' # 将 cust_name 列的值更新为 the fudds,cust_email 列的值更新为 elmer@fudd.com where cust_id = 10005; # 仅更新 cust_id 等于 '10005' 的行 update ignore 表名 set 列1 = 值1, 列2 = 值2, ... where 条件; # 在执行 update 操作时,如果出现某些错误(如重复键错误),则忽略这些错误并继续更新其余记录
重命名表:
rename table 旧表名1 to 新表名1,旧表名2 to 新表名2... ;
删除数据库:
drop database 数据库名;
删除表:
drop table 表名; # 如果目标表不存在的情况下执行drop命令会报错,可以加个 if exists drop table if exists 表名;
删除列:
alter table 表名 drop 列名;
删除表中所有记录:
delete from 表名; # 删除符合条件的那一行数据 delete from 表名 where 列名=1006; # turncate table(速度比delect快) # 如果表被其他表通过外键约束引用,通常无法执行 truncate 操作。你需要先删除外键约束,或使用 delete 操作。 # 通常,truncate 不会触发与表相关的触发器(triggers),而 delete 可能会触发 before delete 或 after delete 触发器。 # truncate 不支持条件where,它会删除表中所有的记录,没有条件限制。 truncate table 表名; # 删除整个表的数据,表结构不变
修改数据库编码:
alter database 数据库名 character set utf8;
修改字段数据类型:
alter table 表名 modify 列名 数据类型;
修改字段的数据类型并且改名:
alter table 表名 change 原列名 新列名 数据类型;
修改列的顺序:
# 把某一列放在最前面 alter table 表名 modify 列名 数据类型 first;
向表中插入一列数据:
alter table 表名 add 列名 数据类型; # 把列添加到最前面 alter table 表名 add 列名 数据类型 first; # 把列插到某一列后面 alter table 表名 add 列名 数据类型 after 某一列列名;
删除默认值
alter table 表名 modify column 列名 数据类型 default null;
删除索引
drop index 索引名 on 表名;
create index my_ind on test1 (name); # 在 表test1 的 列name 上创建名为 my_ind 的索引 show index from test1; # 显示创建的索引 show index from test1 \g # 纵向显示列值方便查看 drop index my_ind on test1; # 删除索引
定义外键
alter table 表名 # 指定要修改的表 add constraint 外键名称 # 定义外键名称 foreign key (外键列名) # 当前表中哪个列将作为外键 references 参照表名(主键列名); # 引用目标表及其主键 # 假设我们有两个表:orders 和 customers。我们想要在 orders 表中添加一个外键,以引用 customers 表中的 customer_id 列。 create table customers (customer_id int primary key, name varchar(100)); create table orders (order_id int primary key, order_date date, customer_id int); alter table orders add constraint fk_customer foreign key (customer_id) references customers(customer_id);
复杂的表结构更改一般需要手动删除过程,:
- 用新的列布局创建一个新表;
- 使用insert select语句从旧表复制数据到新表。如果有必要,可使用转换函数和计算字段;
- 检验包含所需数据的新表;
- 重命名旧表或者删除旧表;
- 用旧表原来的名字重命名新表;
- 根据需要,重新创建触发器、存储过程、索引和外键。
向表中插入一行数据:
insert into 表名 values(数据1, 数据2, ...); # 句高度依赖于表中列的定义次序
指定列名插入数据:
insert into 表名 (列名1, 列名2, ...) values(数据1, 数据2, ...); # 也可以一次性插入多条数据: insert into 表名 (列名1, 列名2, ...) values (数据1, 数据2, ...),(数据1, 数据2, ...),(数据1, 数据2, ...)...; # 举例 insert into phone (pid, name, color) values(456, 'marry', 'blue'); insert into phone (pid, name, color) values(456, 'aaa', 'rrrr'),(789, 'bbb', 'ooo'),(012, 'ccc', 'yyy');
插入列往往比较耗时,可以使用low_priority降低insert语句的优先级(尤其是在数据库有大量的并发写操作时)
insert low_priority into 表名 (列名1, 列名2, ...) values (值1, 值2, ...);
插入检索出的数据
insert into 新表名(列1, 列2, ...) select 列1, 列2, ... from 原表名 where 条件;
检索
检索不同的列:
# 从表中检索一列 select 列名 from 表名; # 从表中检索多列 select 列名, 列名, 列名 from 表名; # 检索所有列 select * from 表名;
检索不同的行:
# 返回每列的唯一值 (distinct 会作用于查询中的所有列的组合,而不是单独某一列。) select distinct 列名, 列名 from 表名; # 如果只去除某一列的重复,应该只选择该列,而不是整个组合。 select distinct 列名 from 表名;
限制结果:
# 显示前m行 select * from 表名 limit m; # 如果要得出m行后的n行,可指定要检索的开始行和行数 select * from 表名 limit m,n; # m:跳过前m行,即从第m+1行开始; n:从第m+1行开始,返回后n行数据
使用完全限定的表名:
select 表名.列名 from 数据库名.表名;
按顺序检索:
# 按顺序检索某一列 select 列名1 from 表名 order by 列名2; # 按列名2的顺序给列名1排序(order by后面的排序列和select的选择列可以不一样) # 按多个列排序 select 列名1, 列名2, 列名3... from 表名 order by 列名1, 列名2...; # 先按 order by 中列1的顺序排序,如果列1有相同值,相同部分按列2排序 # 降序排序 select 列名1, 列名2, 列名3... from 表名 order by 列名1 desc; # 也可以指定某一列为降序 select 列名1, 列名2, 列名3... from 表名 order by 列名1 desc, 列名2... ; # 列1降序,列2升序,如果每列都想降序;必须对每列都指定desc关键字
找到一列中最高或最低值:
# 结合order by + limit select 列名 from 表名 order by 列名 desc limit 1; # 找到最高值
按指定搜索条件过滤检索:
select 列名1, 列名2 from 表名 where 列名1 = 'a'; # 找到列名1中值等于a的 列1列2数据 select 列名1, 列名2 from 表名 where 列名1 between a and b; # 找到列名1中值在`a<=值<=b`范围内的 列1列2数据 # where 子句可以组合使用 select 列名1, 列名2, 列名3 from 表名 where 列名1=100 and 列名2 <=10; # 找到 列名1中值=100 并且 列2数据<=10 的 列1列2列3数据 select 列名1, 列名2, 列名3 from 表名 where 列名1=100 or 列名2 =200; # 找到 列名1中值=100 或者 列2数据=200 的 列1列2列3数据
# where子句的计算次序(默认 and 的优先级高于 or) select 列名1, 列名2, 列名3 from 表名 where 列名1=100 or 列名2 =200 and 列名3>=10; # 等价于where (列名1 = 100) or (列名2 = 200 and 列名3 >= 10);找到 列名1中值=100 或者 (列2数据=200并且列名3>=10) 的 列1列2列3数据 select 列名1, 列名2, 列名3 from 表名 where (列名1=100 or 列名2 =200) and 列名3>=10; # 找到 (列名1中值=100或者列2数据=200)并且 列名3>=10 的 列1列2列3数据
# where 子句的 in 操作符:in 操作符等价于多个 or 条件组合。它的作用是检查 列名1 的值是否匹配括号中的任意一个值 select 列名1, 列名2, 列名3 from 表名 where 列名1 in (值1, 值2, 值3) order by 列名2;
# where 子句的 not 操作符:not 操作符否定它之后所跟的任何条件 select 列名1, 列名2, 列名3 from 表名 where 列名1 not in (值1, 值2, 值3) order by 列名2;
在同时使用
order by和where子句时,应该让order by位于where之后,否则将会产生错误
where 子句操作符:
| 操作符 | 说明 |
|---|---|
| = | 等于 |
| <> | 不等于 |
| != | 不等于 |
| < | 小于 |
| <= | 小于等于 |
| > | 大于 |
| >= | 大于等于 |
| between | 在指定的两个值之间 (包括边界值) |
空值检索:
select 列名 from 表名 where 列名 is null;
用通配符过滤检索:
# %通配符:%表示任何字符出现任意次数。(%会区分大小写;%可以匹配0个字符) select 列名 from 表名 where 列名 like 'aaa' order by 列名; # 检索字符串 完全等于 'aaa' 的字符串 select 列名1 from 表名 where 列名1 like 'aaa%'; # 检索任意以aaa开头的字符串(字符串:aaa也会被检索) select 列名1 from 表名 where 列名1 like '%aaa%'; # 检索任何包含aaa的字符串 select 列名1 from 表名 where 列名1 like 'a%b'; # 检索任何以a开头b结尾的字符串 # %通配符不能匹配null select 列名1 from 表名 where 列名1 like '%'; # 这样也检索不到 null 值
# _通配符:和%通配符用途一样,但只匹配单个字符 select 列名1 from 表名 where 列名1 like 'aaa_'; # 检索任意以aaa开头且后面只跟一个字符的字符串 (字符串:aaa不会被检索;aaall也不会被检索,只能检索到aaal)
用正则表达式进行搜索
# 基本字符匹配(正则表达式不会区分大小写,区分大小写的话需要在 regexp 后面添加 binary 关键字,) select 列名 from 表名 where 列名 regexp 'aaa' order by 列名; # 检索字符串所有包含aaa的字符串 select 列名 from 表名 where 列名 regexp '.aaa' order by 列名; # 检索字符串所有包含aaa结且前面跟有一个字符 的 字符串(.表示匹配任意一个字符,例如:22aaa,2aaa,2aaab) # or 匹配 (|) select 列名 from 表名 where 列名 regexp 'aaa|bbb|ccc' order by 列名; # 匹配包含 aaa、bbb 或 ccc 任意一个的字符串 # 匹配几个字符之一 ([]) select 列名 from 表名 where 列名 regexp '[123]aaa' order by 列名; # 它要求该字符串必须以 1、2 或 3 之一开始,并紧接着是 aaa。换句话说,它会匹配 1aaa、2aaa 或 3aaa 开头的任何字符串。 # 匹配范围 select 列名 from 表名 where 列名 regexp '[1-5]aaa' order by 列名; # 匹配 列名 中以数字 1 到 5 之间的任何一个数字开头,并紧接着是 aaa 的字符串 # 匹配特殊字符(例如:.[]|_等):用\\为前导 select 列名 from 表名 where 列名 regexp '\\.' order by 列名; # 匹配包含 .(点号)的字符串
空白元字符
| 元 字 符 | 说 明 |
|---|---|
\\f | 换页 |
\\n | 换行 |
\\r | 回车 |
\\t | 制表 |
\\v | 纵向制表 |
字符类:放在 方括号内部 ,例如 [[:alnim:]]
| 类 | 说 明 |
|---|---|
| [:alnum:] | 任意字母和数字(同[a-z a-z 0-9]) |
| [:alpha:] | 任意字符(同[a-z a-z]) |
| [:blank:] | 空格和制表(同[\\t]) |
| [:cntrl:] | ascii控制字符(ascii 0到31和127) |
| [:digit:] | 任意数字(同[0-9]) |
| [:graph:] | 与[:print:]相同,但不包括空格 |
| [:lower:] | 任意小写字母(同[a-z]) |
| [:print:] | 任意可打印字符 |
| [:punct:] | 既不在[:alnum:]又不在[:cntrl:]中的任意字符 |
| [:space:] | 包括空格在内的任意空白字符(同[\\f \\n \\r \\t \\v]) |
| [:upper:] | 任意大写字母(同[a-z]) |
| [:xdigit:] | 任意十六进制数字(同[a-fa-f0-9]) |
重复元字符
| 元 字 符 | 说明 |
|---|---|
| * | 0个或多个匹配 |
| + | 1个或多个匹配(等于{1,}) |
| ? | 0个或1个匹配(等于{0,1}) |
| {n} | 指定数目的匹配 |
| {n,} | 不少于指定数目的匹配 |
| {n,m} | 匹配数目的范围(m不超过255) |
# 举例
select 列名 from 表名 where 列名 regexp '[[:digit:]]{4}' # 匹配任何包含 4个连续数字 的字符串
select 列名 from 表名 where 列名 regexp '[0-9][0-9][0-9][0-9]' # 和上面一致:匹配任何包含 4个连续数字 的字符串
select 列名 from 表名 where 列名 regexp '\\([0-9]aas?\\)' # 匹配任何包含 以(开头,后跟一个数字,后跟aas或者aa(aaa? 只匹配 aas 或 aa) 最后跟一个) 的字符串
定位元字符
| 元 字 符 | 说明 |
|---|---|
| ^ | 文本的开始 |
| $ | 文本的结尾 |
| [[:<:]] | 词的开始 |
| [[:>:]] | 词的结尾 |
# 举例 select 列名 from 表名 where 列名 regexp '^[0-9\\.]' # 匹配任何 以一个数字(0-9)或一个点(.)开始 的字符串 select 列名 from 表名 where 列名 regexp '[0-9\\.]' # 匹配任何 包含至少一个数字(0-9)或一个点号(.)的字符串。
创建计算字段
拼接字段:concat()需要一个或多个指定的串,各个串之间用逗号分隔。
select concat(列名1, '(', 列名2, ')') from 表名 order by 列名1; # 返回结果:列名1(列名2)
删除数据右侧多余的空格:rtrim()
select concat(rtrim(列名1), '(', 列名2, ')') from 表名 order by 列名1; # rtrim():去掉右边所有空格; ltrim():去掉左边所有空格; trim():去掉两边所有空格
使用别名:as
select concat(rtrim(列名1), '(', 列名2, ')') as 新列名 from 表名 order by 列名1;
执行算数计算:
select 列名3+列名4 as 新列名 from 表名;
算术操作符
| 操作符 | 说明 |
|---|---|
| + | 加 |
| - | 减 |
| * | 乘 |
| / | 除 |
使用数据处理函数
文本处理函数
| 函数 | 说明 |
|---|---|
| upper(string) | 将文本转换为大写 |
| trim(string) | 去掉两边所有空格 |
| left(string, length) | 返回串左边的字符 |
| length(string) | 返回串的长度 |
| locate(substring, string, [start_position]) | 返回一个子字符串在另一个字符串中首次出现的位置 |
| lower(string) | 将串转换为小写 |
| right(string, length) | 返回串右边的字符 |
| soundex(string) | 将字符串转换为一个表示其发音的编码值(用于模糊匹配和声音相似度比较) |
| substring(string, start, length) | 从一个字符串中提取指定位置开始的子字符串 |
select left(列名1, 3) as 新列名 from 表名; # 返回列名1的前3个字符
select locate('pro', product_name, 3) from 表名; # 从 列product_name 第3个字符开始 找到 pro 首次出现的位置(找不到返回 0 )
select right(列名1, 3) as 新列名 from 表名; # 返回列名1的后3个字符
select soundex(列名) from 表名; # 返回每个数据发音的编码值
select 列名 from 表名 where soundex(列名) = soundex('smith'); # 想找出所有发音与 "smith" 相似的数据
select substring(列名, 1, 3) from 表名; # 提取前 3 个字符
select substring(列名, 4) from 表名; # 从第 4 个字符开始提取,提取到字符串的末尾
日期和时间处理函数
| 函数 | 说明 |
|---|---|
| adddate() | 增加一个日期(天、周等) |
| addtime() | 增加一个时间(时、分等) |
| curdate() | 返回当前日期 |
| curtime() | 返回当前时间 |
| date() | 返回日期时间的日期部分 |
| datediff() | 计算两个日期之差 |
| date_add() | 高度灵活的日期运算函数 |
| date_format() | 返回一个格式化的日期或时间串 |
| day() | 返回一个日期的天数部分 |
| dayofweek() | 对于一个日期,返回对应的星期几 |
| hour() | 返回一个时间的小时部分 |
| minute() | 返回一个时间的分钟部分 |
| month() | 返回一个日期的月份部分 |
| now() | 返回当前日期和时间 |
| second() | 返回一个时间的秒部分 |
| time() | 返回一个日期时间的时间部分 |
| year() | 返回一个日期的年份部分 |
数值处理函数
| 函数 | 说明 |
|---|---|
| abs() | 返回一个数的绝对值 |
| cos() | 返回一个角度的余弦 |
| exp () | 返回一个数的指数值 |
| mod() | 返回除操作的余数 |
| pi() | 返回圆周率 |
| rand() | 返回一个随机数 |
| sin() | 返回一个角度的正弦 |
| sqrt() | 返回一个数的平方根 |
| tan() | 返回一个角度的正切 |
select abs(列名) from 表名; # 返回绝对值
汇总数据
聚合函数 (mysql返回结果一般比你在自己的客户机应用程序中计算要快得多。)
| 函数 | 说 明 |
|---|---|
| avg() | 返回某列的平均值, 忽略列值为nul的行。 |
| count() | 返回某列的行数() count(*)对表中行的数目进行计数,不管表列中包含的是空值(null)还是非空值;count(column) 对特定列中具有值的行进行计数,忽略null值 |
| max() | 返回某列的最大值 |
| min() | 返回某列的最小值 |
| sum() | 返回某列值之和 |
以上5个聚集函数都可以如下使用:
- 对所有的行执行计算,指定all参数或不给参数(因为
all是默认行为);- 只包含不同的值,指定distinct参数。(如果指定列名,则
distinct只能用于count()。distinct不能用于count(*),因此不允许使用count(distinct))
select avg(数值列名) from 表名; select count(*) from 表名; select avg(distinct prod_price) as acg_price from prducts where vend_id = 1003; select count(*) as num_items, min(prod_price) as price_min, max(prod_price) as price_max, avg(prod_price) as price_avg from products;
数据分组
group by子句
- 如果在
group by子句中嵌套了分组,数据将在最后规定的分组上进行汇总。 group by子句中列出的每个列都必须是检索列或有效的表达式(但不能是聚集函数)。- 如果分组列中具有
null值,则null将作为一个分组返回。如果列中有多行null值,它们将分为一组。 group by子句必须出现在where子句之后,order by子句之前。- 使用
with rollup关键字,可以得到每个分组以及每个分组汇总级别(针对每个分组)的值
select vend_id, count(*) as num_prods from products group by vend_id; # 对每个vend_id而不是整个表计算num_prods select vend_id, count(*) as num_prods from products group by vend_id with rollup; # with rollup 是一个用于生成汇总数据的特殊选项。它在原本分组的基础上,额外生成一个“总计”行,该行显示所有vend_id的总产品数量。
having子句
where过滤行,having过滤分组。
select cust_id,count(*) as orders from orders group by cust_id having count(*) >= 2; # 过滤掉 聚合后cust_id数量 小于2 的 cust_id select vend_id,count(*) as num_prods from products where prod_price >=10 group by vend_id having count(*) >= 2; # 过滤掉 聚合后vend_id数量小于2 且 prod_price大于或等于10的 vend_id
order by 子句
- 一般在使用
group by子句时,应该也给出order by子句
select order_num, sum(quantity*item_price) as ordertotal from orderitems group by order_num having sum(quantity*item_price) >= 50 order by ordertotal; # 查询返回了所有ordertotal大于或等于 50 的order_num,并且按照ordertotal从小到大排序。
select 子句顺序
| 子句 | 说明 | 是否必须使用 |
|---|---|---|
| select | 要返回的列或表达式 | 是 |
| from | 从中检索数据的表 | 仅在从表选择数据时使用 |
| where | 行级过滤 | 否 |
| group by | 分组说明 | 仅在按组计算聚集时使用 |
| having | 组级过滤 | 否 |
| order by | 输出排序顺序 | 否 |
| limit | 要检索的行数 | 否 |
使用子查询
- 子查询:嵌套在其他查询中的查询
- 子查询
从内向外处理 - 在
where子句中使用子查询,应该保证select语句具有与where子句中相同数目的列。
select cust_nume,cust_contact from customers where cust_id in (select cust_id from orders where order_num in (select order_num from orderitems where prod_id = 'tnt2')); # 先在表orderitems中查询prod_id='tnt2'的order_num,再在orders表中找 order_num=子句中查询结果 的cust_id,最后在表customers中找到 cust_id=子句中查询结果 的cust_nume和cust_contact
# 修改格式
select cust_nume,cust_contact
from customers
where cust_id in (select cust_id
from orders
where order_num in (select order_num
from orderitems
where prod_id = 'tnt2'));
# 等同于
select cust_name,cust_contact
from customers,orders,orderitems
where customers.cust_id = orders.cust_id
and orderitems.order_num = orders.order_num
and prod_id = 'tnt2';
相关子查询:涉及外部查询的子查询
select cust_name,
cust_state,
(select count(*)
from orders
where orders.cust_id = customers.cust_id) as orders
from customers
order by cust_name;
联结表
使用表别名
- 例如:
customers as c - 表别名只在查询执行中使用
select concat(rtrim(vend_name),'(',rtrim(vend_country),')') as vend_title
from vendors
order by vend_name;
select cust_name,cust_contact
from customers as c,orders as o,orderitems as oi
where c.cust_id = o.cust_id
and oi.order_num = o.order_num
and prod_id = 'tnt2';
- 等值联结(内部联结)
例如:
vendors.vend_id = products.vend_id外键为某个表中的一列,它包含另一个表的主键值,定义了两个表之间的关系。
联结是一种机制,用来在一条
select语句中关联表,因此称之为联结。完全限定列名:在引用的列可能出现二义性时,必须使用完全限定列名(用一个点分隔的表名和列名)。
笛卡儿积:由没有联结条件的表关系返回的结果为笛卡儿积。检索出的行的数目将是第一个表中的行数乘以第二个表中的行数
# 联结(很少用,基本都用下面的内联结方式) select vend_name,prod_name,prod_price from vendors,products where vendors.vend_id = products.vend_id order by vend_name, prod_name; # 笛卡尔积 select vend_name,prod_name,prod_price from vendors,products order by vend_name,prod_name;
- 联结多个表
select prod_name, vend_name, prod_price, quantity from orderitems,products,vendors where products.vend_id = vendors.vend_id and orderitems.prod_id = products.prod_id and order_num = 20005;
- 内联结
- 例如:
vendors inner join products on vendors.vend_id = products.vend_id
- 例如:
# 用内联结实现上面等值联结的查询 select vend_name, prod_name, prod_price from vendors inner join products on vendors.vend_id = products.vend_id; # inner join 表示将 vendors 表与 products 表按照 vend_id 进行连接,连接条件是 vendors.vend_id 与 products.vend_id 相等。这样能获取所有与供应商相关的产品信息。
- 自联结
- 例如:
pl.vend_id = p2.vend_id - p1和p2是同一个表
- 例如:
select prod_id, prod_name
from products
where vend_id = (select vend_id
from products
where prod_id = 'dtntr');
# 自联结实现上述查询
select pl.prod_id, pl.prod_name
from products as pl, products as p2
where pl.vend_id = p2.vend_id
and p2.prod_id = 'dtntr';

自然联结
无论何时对表进行联结,应该至少有一个列出现在不止一个表中(被联结的列)。标准的联结返回所有数据,甚至相同的列多次出现。自然联结排除多次出现,使每个列只返回一次。
自然联结是这样一种联结,其中你只能选择那些唯一的列。这一般是通过对表使用通配符(
select *),对所有其他表的列使用明确的子集来完成的
select c.*, o.order_num, o.order_date, oi.prod_id, oi.quantity, oi.item_price from customers as c, orders as o, orderitems as oi where c.cust_id = o.cust_id and oi.order_num = o.order_num and oi.prod_id = 'fb';
- 外部联结
- 联结包含了那些在相关表中没有关联行的行。这种类型的联结称为外部联结
- 在使用
outer join语法时,必须使用right或left关键字指定包括其所有行的表(right指出的是outer join右边的表)。上面的例子使用left outer join从from子句的左边表(customers表)中选择所有行。
- 在使用
- 联结包含了那些在相关表中没有关联行的行。这种类型的联结称为外部联结
select customers.cust_id, orders.order_num from customers left outer join orders on customers.cust_id = orders.cust_id; # 返回 左表(第一个表) 中的所有记录,对于没有匹配的右表记录,查询结果中的相关列会显示为 null

- 使用带聚集函数的联结
select customers.cust_name, customers.cust_id, count(orders.order_num) as num_ord from customers inner join orders on customers.cust_id = orders.cust_id group by customers.cust_id; select customers.cust_name, customers.cust_id, count(orders.order_num) as num_ord from customers left outer join orders on customers.cust_id= orders.cust_id group by customers.cust_id;


组合查询
有两种基本情况,其中需要使用组合查询:
在单个查询中从不同的表返回类似结构的数据;
对单个表执行多个查询,按单个查询返回数据。
union规则:
union必须由两条或两条以上的select语句组成,语句之间用关键字union分隔。union中的每个查询必须包含相同的列、表达式或聚集函数(不过各个列不需要以相同的次序列出)。- 列数据类型必须兼容:类型不必完全相同,但必须是
dbms可以隐含地转换的类型(例如,不同的数值类型或不同的日期类型)。
select vend_id, prod_id, prod_price from products where prod_price <= 5; select vend_id, prod_id, prod_price from products where vend_id in (1001,1002); # 组合上面两条语句 select vend_id, prod_id, prod_price from products where prod_price <= 5 union select vend_id, prod_id, prod_price from products where vend_id in (1001,1002); # 会自动去除重复的行 # 等同于 select vend_id, prod_id, prod_price from products where prod_price <= 5 or vend_id in (1001,1002); # 包含重复的行 select vend_id, prod_id, prod_price from products where prod_price <= 5 union all select vend_id, prod_id, prod_price from products where vend_id in (1001,1002); # 对组合查询结果排序 select vend_id, prod_id, prod_price from products where prod_price <= 5 union select vend_id, prod_id, prod_price from products where vend_id in (1001,1002) order by vend_id, prod_price; # 对返回最终结果进行排序,不是只对第二条select语句进行排序
全文本搜索
- 全文索引的默认行为是忽略长度小于一定字符数的词。这个长度阈值可以通过系统变量
ft_min_word_len来配置,默认值是 4 字符 - mysql规定了一条50%规则,如果一个词出现在50%以上的行中,则将它作为一个非用词忽略。50%规则不用于
in boolean mode - 如果表中的行数少于3行,则全文本搜索不返回结果
- 忽略词中的单引号。例如,don’t索引为dont
- 不具有词分隔符(包括日语和汉语)的语言不能恰当地返回全文本搜索结果。
create table productnotes ( note_id int not null auto_increment, prod_id char(10) not null, note_date datetime not null, note_text text null, primary key(note_id), fulltext(note_text) # 为 note_text 字段创建全文索引 )engine=myisam;
- 如果正在导入数据到一个新表,应该首先导入所有数据,然后再修改表,定义
fulltext。 - 必须先创建了
fulltext索引,才能使用match()against()进行全文检索查询 match()指定被搜索的列,against()指定要使用的搜索表达式
select note_text
from productnotes
where match(note_text) against('rabbit');
select note_text,
match(note_text) against('rabbit') as rank # 计算每条记录与搜索词的相关性
from productnotes; # 查询结果返回note_text,rank两列
查询扩展
- 进行一个基本的全文本搜索,找出与搜索条件匹配的所有行
mysql检查这些匹配行并选择所有有用的词mysql再次进行全文本搜索,这次不仅使用原来的条件,而且还使用所有有用的词。
select note_text
from productnotes
where match(note_text) against('anvils' with query expansion); # 在原始查询基础上,自动找到与 'anvils' 相关的其他词汇(这些词是基于 fulltext 索引的相关文档生成的)。
布尔文本搜索
- 即使没有
fulltext索引也可以使用 - 在布尔方式中,不按等级值降序排序返回的行
select note_text
from productnotes
where match(note_text) against('heavy -rope*'in boolean mode); # 匹配包含heavy但不包含任意以rope开始的词的行
全文本布尔操作符
| 布尔操作符 | 说明 |
|---|---|
| + | 包含,词必须存在 |
| - | 排除,词必须不出现 |
| > | 包含,而且增加等级值 |
| < | 包含,且减少等级值 |
| () | 把词组成子表达式(允许这些子表达式作为一个组被包含、排除、排列等) |
| ~ | 取消一个词的排序值 |
| * | 词尾的通配符 |
| “” | 定义一个短语(与单个词的列表不一样,它匹配整个短语以便包含或排除这个短语) |
select note_text
from productnotes
where match(note_text) against('+rabbit +bait' in boolean mode); # 匹配包含词rabbit和bait的行
select note_text
from productnotes
where match(note_text) against('rabbit bait' in boolean mode); # 匹配包含rabbit和bait中的至少一个词的行
select note_text
from productnotes
where match(note_text) against('"rabbit bait"' in boolean mode); # 匹配短语rabbit bait而不是匹配两个词rabbit和 bait
select note_text
from productnotes
where match(note_text) against('>rabbit <carrot' in boolean mode); # 匹配rabbit和carrot,增加前者的等级,降低后者的等级
select note_text
from productnotes
where match(note_text) against('+safe +(<combination)' in boolean mode); # 匹配词safe和combination,降低后者的等级。
总结
到此这篇关于mysql数据库语句的文章就介绍到这了,更多相关mysql语句详解内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!
发表评论