精华内容
下载资源
问答
  • 常见的SQL优化面试题

    千次阅读 2019-07-05 14:13:20
    现在面试过程中,除了开发的基础,面试官通常还会问SQL优化的方面,SQL优化也能体现出来平时对数据库的理解和技术的高低。现在就总结了几个,希望对大家有帮助。       1.在表中建立...

    现在面试过程中,除了开发的基础,面试官通常还会问SQL优化的方面,SQL优化也能体现出来平时对数据库的理解和技术的高低。现在就总结了几个,希望对大家有帮助。

          1.在表中建立索引,优先考虑where.group by使用到的字段。


          2.查询条件中,一定不要使用select * ,因为会返回过多无用的字段会降低查询效率。应该使用具体的字段代替*,只返回使用到的字段。


          3.不要在where条件中使用左右两边都是%的like模糊查询,如:

                SELECT * FROM t_order WHERE customer LIKE ‘%zhang%’

                这样会导致数据库引擎放弃索引进行全表扫描。

                优化:尽量在字段后面使用模糊查询。如下:

                SELECT * FROM t_order WHERE customer LIKE ‘zhang%’


          4.尽量不要使用in 和not in,会造成全表扫描。如下:

                SELECT * FROM t_order WHERE id IN (2,3)

                SELECT * FROM t_order1 WHERE customer IN (SELECT customer FROM t_order2)

          优化:

                对于连续的数值,能用 between 就不要用 in ,如下:
                SELECT * FROM t_order WHERE id BETWEEN 2 AND 3

                对于子查询,可以用exists代替。如下:
                SELECT * FROM t_order1 WHERE EXISTS (SELECT * FROM t_order2 WHERE t1.customer = t2.customer)


          5.尽量不要使用or,会造成全表扫描。如下:

                SELECT * FROM t_order WHERE id = 1 OR id = 3

                优化:可以用union代替or。如下:

                SELECT * FROM t_order WHERE id = 1

                UNION

                SELECT * FROM t_order WHERE id = 3


          6.尽量不要在 where 子句中对字段进行表达式操作,这样也会造成全表扫描。如:

                select id FROM t_order where num/2=100

                应改为:

                select id FROM t_order where num=100*2


          7.where条件里尽量不要进行null值的判断,null的判断也会造成全表扫描。如下:

                SELECT * FROM t_order WHERE score IS NULL

                优化:

                给字段添加默认值,对默认值进行判断。如:

                SELECT * FROM t_order WHERE score = 0


          8.尽量不要在where条件中等号的左侧进行表达式.函数操作,会导致全表扫描。如下:

                SELECT * FROM t_order2 WHERE score/10 = 10

                SELECT * FROM t_order2 WHERE SUBSTR(customer,1,5) = ‘zhang’

                优化:

                将表达式.函数操作移动到等号右侧。如下:

                SELECT * FROM t_order2 WHERE score = 10*10

                SELECT * FROM t_order2 WHERE customer LIKE ‘zhang%’


          9.尽量不要使用where 1=1的条件

                有时候,在开发过程中,为了方便拼装查询条件,我们会加上该条件,这样,会造成进行全表扫描。如下:

                SELECT * FROM t_order WHERE 1=1

                优化:

                如果用代码拼装sql,则由代码进行判断,没where加where,有where加and

                如果用mybatis,请用mybatis的where语法。


          10.程序要尽量避免大事务操作,提高系统并发能力。


          11.一个表的索引数最好不要超过6个,如果索引太多的话,就需要考虑一下那些不常使用到的列上建的索引是否有必要。

    展开全文
  • 数据库面试题索引sql优化.pdf+数据库SQL优化总结之百万级数据库优化.pdf 附赠Oracle高性能sql优化
  • SQL优化面试题

    万次阅读 多人点赞 2019-06-13 22:21:12
    最近在面试的时候经常被问到SQL优化,总结如下: 1、在表中建立索引,优先考虑where、group by使用到的字段。 2、尽量避免使用select *,返回无用的字段会降低查询效率。如下: SELECT * FROM t 优化方式:...

    最近在面试的时候经常被问到SQL优化,总结如下:

    1、在表中建立索引,优先考虑where、group by使用到的字段。

     

    2、尽量避免使用select *,返回无用的字段会降低查询效率。如下:

    SELECT * FROM t

    优化方式:使用具体的字段代替*,只返回使用到的字段。

     

    3、尽量避免使用in 和not in,会导致数据库引擎放弃索引进行全表扫描。如下:

    SELECT * FROM t WHERE id IN (2,3)

    SELECT * FROM t1 WHERE username IN (SELECT username FROM t2)

    优化方式:如果是连续数值,可以用between代替。如下:

    SELECT * FROM t WHERE id BETWEEN 2 AND 3

    如果是子查询,可以用exists代替。如下:

    SELECT * FROM t1 WHERE EXISTS (SELECT * FROM t2 WHERE t1.username = t2.username)

     

    4、尽量避免使用or,会导致数据库引擎放弃索引进行全表扫描。如下:

    SELECT * FROM t WHERE id = 1 OR id = 3

    优化方式:可以用union代替or。如下:

    SELECT * FROM t WHERE id = 1
    UNION
    SELECT * FROM t WHERE id = 3

    (PS:如果or两边的字段是同一个,如例子中这样。貌似两种方式效率差不多,即使union扫描的是索引,or扫描的是全表)

     

    5、尽量避免在字段开头模糊查询,会导致数据库引擎放弃索引进行全表扫描。如下:

    SELECT * FROM t WHERE username LIKE '%li%'

    优化方式:尽量在字段后面使用模糊查询。如下:

    SELECT * FROM t WHERE username LIKE 'li%'

     

    6、尽量避免进行null值的判断,会导致数据库引擎放弃索引进行全表扫描。如下:

    SELECT * FROM t WHERE score IS NULL

    优化方式:可以给字段添加默认值0,对0值进行判断。如下:

    SELECT * FROM t WHERE score = 0

     

    7、尽量避免在where条件中等号的左侧进行表达式、函数操作,会导致数据库引擎放弃索引进行全表扫描。如下:

    SELECT * FROM t2 WHERE score/10 = 9

    SELECT * FROM t2 WHERE SUBSTR(username,1,2) = 'li'

    优化方式:可以将表达式、函数操作移动到等号右侧。如下:

    SELECT * FROM t2 WHERE score = 10*9

    SELECT * FROM t2 WHERE username LIKE 'li%'

     

    8、当数据量大时,避免使用where 1=1的条件。通常为了方便拼装查询条件,我们会默认使用该条件,数据库引擎会放弃索引进行全表扫描。如下:

    SELECT * FROM t WHERE 1=1

    优化方式:用代码拼装sql时进行判断,没where加where,有where加and。

    展开全文
  • mysql的sql语句优化方法面试题总结.docxmysql的sql语句优化方法面试题总结.docxmysql的sql语句优化方法面试题总结.docxmysql的sql语句优化方法面试题总结.docxmysql的sql语句优化方法面试题总结.docx
  • SQL优化面试专题及答案.pdf
  • 面试 SQL整理 常见的SQL面试题:经典50题

    万次阅读 多人点赞 2019-09-12 22:16:11
    常见的SQL面试题:经典50题 三、50道面试题 2.汇总统计分组分析 3.复杂查询 sql面试题:topN问题 4.多表查询 【面试题类型总结】这类题目属于行列如何互换,解题思路如下: 其他面试题: SQL基础知识整理...

     

    目录

    SQL基础知识整理:

    常见的SQL面试题:经典50题

    三、50道面试题

     

    2.汇总统计分组分析

    3.复杂查询

    sql面试题:topN问题

    4.多表查询

    【面试题类型总结】这类题目属于行列如何互换,解题思路如下:

    其他面试题:



    preview

    SQL基础知识整理:

    select 查询结果    如: [学号,平均成绩:组函数avg(成绩)]
    from 从哪张表中查找数据   如:[涉及到成绩:成绩表score]
    where 查询条件    如:[b.课程号='0003' and b.成绩>80]
    group by 分组    如:[每个学生的平均:按学号分组](oracle,SQL server中出现在select 子句后的非分组函数,必须出现                                                                                        在group by子句后出现),MySQL中可以不用
    having 对分组结果指定条件    如:[大于60分]
    order by 对查询结果排序    如:[增序: 成绩  ASC / 降序: 成绩 DESC];

    limit   使用limt子句返回topN(对应这个问题返回的成绩前两名)如:[ limit  2 ==>从0索引开始读取2个]
    limit==>从0索引开始 [0,N-1]

    ① select * from table limit 2,1;                
    
    //含义是跳过2条取出1条数据,limit后面是从第2条开始读,读取1条信息,即读取第3条数据
    
    ② select * from table limit 2 offset 1;     
    
    //含义是从第1条(不包括)数据开始取出2条数据,limit后面跟的是2条数据,offset后面是从第1条开始读取,即读取第2,3条

     

    组函数: 去重 distinct()  统计总数sum()   计算个数count()  平均数avg()  最大值max() 最小数min() 

    多表连接: 内连接(省略默认inner) join ...on..左连接left join tableName ason a.key ==b.key右连接right join  连接union(无重复(过滤去重))和union all(有重复[不过滤去重])

    --union 并集
    --union all(有重复)

    oracle(SQL server)数据库

    --intersect 交集 
    --minus(except) 相减(差集)

    oracle

    一、数据库对象: 表(table)  视图(view)  序列(sequence)  索引(index)  同义词(synonym)

    1. 视图: 存储起来的 select 语句
    create view emp_vw
    as
    select employee_id, last_name, salary
    from employees
    where department_id = 90;

    select * from emp_vw;

    --可以对简单视图进行 DML 操作
    update emp_vw
    set last_name = 'HelloKitty'
    where employee_id = 100;

    select * from employees
    where employee_id = 100;

    1). 复杂视图
    create view emp_vw2
    as
    select department_id, avg(salary) avg_sal
    from employees
    group by department_id;

    select * from emp_vw2;

    --复杂视图不能进行 DML 操作
    update emp_vw2
    set avg_sal = 10000
    where department_id = 100;

    2. 序列:用于生成一组有规律的数值。(通常用于为主键设置值)
    create sequence emp_seq1
    start with 1
    increment by 1
    maxvalue 10000
    minvalue 1
    cycle
    nocache;

    select emp_seq1.currval from dual;

    select emp_seq1.nextval from dual;

    --问题:裂缝 .  原因:①当多个表共用同一个序列时。  ②rollback  ③发生异常
    create table emp1(
           id number(10),
           name varchar2(30)
    );

    insert into emp1
    values(emp_seq1.nextval, '张三');

    select * from emp1;

    3. 索引:提高查询效率
    --自动创建:Oracle 会为具有唯一约束(唯一约束,主键约束)的列,自动创建索引
    create table emp2(
           id number(10) primary key,
           name varchar2(30)
    )

    --手动创建
    create index emp_idx
    on emp2(name);

    create index emp_idx2
    on emp2(id, name);

    4. 同义词
    create synonym d1 for departments;

    select * from d1;

    5. 表:
    DDL :数据定义语言 create table .../ drop table ... / rename ... to..../ truncate table.../alter table ...
    DML : 数据操纵语言

    insert into ... values ...
    update ... set ... where ...
    delete from ... where ...

    【重要】
    select ... 组函数(MIN()/MAX()/SUM()/AVG()/COUNT())
    from ...join ... on ... 左外连接:left join ... on ... 右外连接: right join ... on ...
    where ... 
    group by ...
    (oracle,SQL server中出现在select 子句后的非分组函数,必须出现在 group by子句后)
    having ... 用于过滤 组函数
    order by ... asc 升序, desc 降序

    limit (0,4) 限制N条数据 如: topN数据

    --union 并集
    --union all(有重复)
    --intersect 交集 
    --minus 相减

    DCL : 数据控制语言  commit : 提交 / rollback : 回滚 / 授权grant...to...  /revoke 

     

     

     

    索引

    何时创建索引:

     

    一、
    select employee_id, last_name, salary, department_id
    from employees
    where department_id in (70, 80) --> 70:1  80:34
    --union 并集
    --union all(有重复部分)
    --intersect 交集 
    --minus 相减

    select employee_id, last_name, salary, department_id
    from employees
    where department_id in (80, 90)  --> 90:4  80:34


    --问题:查询工资大于149号员工工资的员工的信息
    select * 
    from employees
    where salary > (
          select salary
          from employees
          where employee_id = 149
    )

    --问题:查询与141号或174号员工的manager_id和department_id相同的其他员工的
    --employee_id, manager_id, department_id  
    select employee_id, manager_id, department_id
    from employees
    where manager_id in (
          select manager_id
          from employees
          where employee_id in(141, 174)
    ) and department_id in (
          select department_id
          from employees
          where employee_id in(141, 174)
    ) and employee_id not in (141, 174);

    select employee_id, manager_id, department_id
    from employees
    where (manager_id, department_id) in (
          select manager_id, department_id
          from employees
          where employee_id in (141, 174)
    ) and employee_id not in(141, 174);

    --1. from 子句中使用子查询
    select max(avg(salary))
    from employees
    group by department_id;

    select max(avg_sal)
    from (
          select avg(salary) avg_sal
          from employees
          group by department_id
    ) e

    --问题:返回比本部门平均工资高的员工的last_name, department_id, salary及平均工资

    select last_name, department_id, salary, (select avg(salary) from employees where department_id = e1.department_id)
    from employees e1
    where salary > (
          select avg(salary)
          from employees e2
          where e1.department_id = e2.department_id
    )

    select last_name, e1.department_id, salary, avg_sal
    from employees e1, (
         select department_id, avg(salary) avg_sal
         from employees
         group by department_id
    ) e2
    where e1.department_id = e2.department_id
    and e1.salary > e2.avg_sal;


    --case...when ... then... when ... then ... else ... end 
    --查询:若部门为10 查看工资的 1.1 倍,部门号为 20 工资的1.2倍,其余 1.3 倍
    select employee_id, last_name, salary, case department_id when 10 then salary * 1.1
                                                              when 20 then salary * 1.2
                                                              else salary * 1.3
                                                              end "new_salary"
    from employees;

    select employee_id, last_name, salary, decode(department_id, 10, salary * 1.1,
                                                                 20, salary * 1.2,
                                                                 salary * 1.3) "new_salary"
    from employees;


    --问题:显式员工的employee_id,last_name和location。其中,若员工
    --department_id与location_id为1800的department_id相同,则location为’Canada’,其余则为’USA’。
    select employee_id, last_name, case department_id when (
                        select department_id
                        from departments
                        where location_id = 1800
    ) then 'Canada' else 'USA' end "location"
    from employees;

    --问题:查询员工的employee_id,last_name,要求按照员工的department_name排序
    select employee_id, last_name
    from employees e1
    order by (
          select department_name
          from departments d1
          where e1.department_id = d1.department_id
    )

    -- SQL 优化:能使用 EXISTS 就不要使用 IN

    --问题:查询公司管理者的employee_id,last_name,job_id,department_id信息
    select employee_id, last_name, job_id, department_id
    from employees
    where employee_id in (
          select manager_id
          from employees
    )


    select employee_id, last_name, job_id, department_id
    from employees e1
    where exists (
          select 'x'
          from employees e2
          where e1.employee_id = e2.manager_id

    -- 问题:查询departments表中,不存在于employees表中的部门的department_id和department_name
    select department_id, department_name
    from departments d1
    where not exists (
          select 'x'
          from employees e1
          where e1.department_id = d1.department_id
    )

    --55. 更改 108 员工的信息: 使其工资变为所在部门中的最高工资, job 变为公司中平均工资最低的 job
        
    update employees e1
    set salary = (
        select max(salary)
        from employees e2
        where e1.department_id = e2.department_id
    ), job_id = (
       select job_id
       from employees
       group by job_id
       having avg(salary) = (
             select min(avg(salary))
             from employees
             group by job_id
       )
    )
    where employee_id = 108;
        
    --56. 删除 108 号员工所在部门中工资最低的那个员工.
    delete from employees e1
    where salary = (
          select min(salary)
          from employees
          where department_id = (
                select department_id
                from employees
                where employee_id = 108
          )
    )

    select * from employees where employee_id = 108;
    select * from employees where department_id = 100
    order by salary;

    rollback;

     

    常见的SQL面试题:经典50题

    ========================================================

    已知有如下4张表:

    学生表:student(学号,学生姓名,出生年月,性别)

    成绩表:score(学号,课程号,成绩)

    课程表:course(课程号,课程名称,教师号)

    教师表:teacher(教师号,教师姓名)

     

    根据以上信息按照下面要求写出对应的SQL语句。

    ps:这些题考察SQL的编写能力,对于这类型的题目,需要你先把4张表之间的关联关系搞清楚了,最好的办法是自己在草稿纸上画出关联图,然后再编写对应的SQL语句就比较容易了。下图是我画的这4张表的关系图,可以看出它们之间是通过哪些外键关联起来的:

     

    一、创建数据库和表

    为了演示题目的运行过程,我们先按下面语句在客户端navicat中创建数据库和表。

    (如何你还不懂什么是数据库,什么是客户端navicat,可以先学习这个:

    1.创建表

    1)创建学生表(student)

    按下图在客户端navicat里创建学生表

     

    学生表的“学号”列设置为主键约束,下图是每一列设置的数据类型和约束

    创建完表,点击“保存”

    2)创建成绩表(score)

    同样的步骤,创建"成绩表“。“课程表的“学号”和“课程号”一起设置为主键约束(联合主键),“成绩”这一列设置为数值类型(float,浮点数值)

    3)创建课程表(course)

    课程表的“课程号”设置为主键约束

    4)教师表(teacher)

    教师表的“教师号”列设置为主键约束,

    教师姓名这一列设置约束为“null”(红框的地方不勾选),表示这一列允许包含空值(null)

     

    2.向表中添加数据

    1)向学生表里添加数据

    添加数据的sql

    insert into student(学号,姓名,出生日期,性别) 
    values('0001' , '猴子' , '1989-01-01' , '男');
    
    insert into student(学号,姓名,出生日期,性别) 
    values('0002' , '猴子' , '1990-12-21' , '女');
    
    insert into student(学号,姓名,出生日期,性别) 
    values('0003' , '马云' , '1991-12-21' , '男');
    
    insert into student(学号,姓名,出生日期,性别) 
    values('0004' , '王思聪' , '1990-05-20' , '男');

    在客户端navicat里的操作

    2)成绩表(score)

    添加数据的sql

    insert into score(学号,课程号,成绩) 
    values('0001' , '0001' , 80);
    
    insert into score(学号,课程号,成绩) 
    values('0001' , '0002' , 90);
    
    insert into score(学号,课程号,成绩) 
    values('0001' , '0003' , 99);
    
    insert into score(学号,课程号,成绩) 
    values('0002' , '0002' , 60);
    
    insert into score(学号,课程号,成绩) 
    values('0002' , '0003' , 80);
    
    insert into score(学号,课程号,成绩) 
    values('0003' , '0001' , 80);
    
    insert into score(学号,课程号,成绩) 
    values('0003' , '0002' , 80);
    
    insert into score(学号,课程号,成绩) 
    values('0003' , '0003' , 80);

    客户端navicat里的操作

    3)课程表

    添加数据的sql

    insert into course(课程号,课程名称,教师号)
    values('0001' , '语文' , '0002');
    
    insert into course(课程号,课程名称,教师号)
    values('0002' , '数学' , '0001');
    
    insert into course(课程号,课程名称,教师号)
    values('0003' , '英语' , '0003');

    客户端navicat里的操作

    4)教师表里添加数据

    添加数据的sql

    -- 教师表:添加数据
    insert into teacher(教师号,教师姓名) 
    values('0001' , '孟扎扎');
    
    insert into teacher(教师号,教师姓名) 
    values('0002' , '马化腾');
    
    -- 这里的教师姓名是空值(null)
    insert into teacher(教师号,教师姓名) 
    values('0003' , null);
    
    -- 这里的教师姓名是空字符串('')
    insert into teacher(教师号,教师姓名) 
    values('0004' , '');

    客户端navicat里操作

    添加结果

     

    三、50道面试题

    为了方便学习,我将50道面试题进行了分类

     

    查询姓“猴”的学生名单

    查询姓“孟”老师的个数

    select count(教师号)
    from teacher
    where 教师姓名 like '孟%';

     

    2.汇总统计分组分析

    面试题:查询课程编号为“0002”的总成绩

    *
    分析思路
    select 查询结果 [总成绩:汇总函数sum]
    from 从哪张表中查找数据[成绩表score]
    where 查询条件 [课程号是0002]
    */
    select sum(成绩)
    from score
    where 课程号 = '0002';

    查询选了课程的学生人数

    /*
    这个题目翻译成大白话就是:查询有多少人选了课程
    select 学号,成绩表里学号有重复值需要去掉
    from 从课程表查找score;
    */
    select count(distinct 学号) as 学生人数 
    from score;

    查询各科成绩最高和最低的分, 以如下的形式显示:课程号,最高分,最低分

    /*
    分析思路
    select 查询结果 [课程ID:是课程号的别名,最高分:max(成绩) ,最低分:min(成绩)]
    from 从哪张表中查找数据 [成绩表score]
    where 查询条件 [没有]
    group by 分组 [各科成绩:也就是每门课程的成绩,需要按课程号分组];
    */
    select 课程号,max(成绩) as 最高分,min(成绩) as 最低分
    from score
    group by 课程号;

    查询每门课程被选修的学生数

    /*
    分析思路
    select 查询结果 [课程号,选修该课程的学生数:汇总函数count]
    from 从哪张表中查找数据 [成绩表score]
    where 查询条件 [没有]
    group by 分组 [每门课程:按课程号分组];
    */
    select 课程号, count(学号)
    from score
    group by 课程号;

    查询男生、女生人数

    /*
    分析思路
    select 查询结果 [性别,对应性别的人数:汇总函数count]
    from 从哪张表中查找数据 [性别在学生表中,所以查找的是学生表student]
    where 查询条件 [没有]
    group by 分组 [男生、女生人数:按性别分组]
    having 对分组结果指定条件 [没有]
    order by 对查询结果排序[没有];
    */
    select 性别,count(*)
    from student
    group by 性别;

    查询平均成绩大于60分学生的学号和平均成绩

    /* 
    题目翻译成大白话:
    平均成绩:展开来说就是计算每个学生的平均成绩
    这里涉及到“每个”就是要分组了
    平均成绩大于60分,就是对分组结果指定条件
    
    分析思路
    select 查询结果 [学号,平均成绩:汇总函数avg(成绩)]
    from 从哪张表中查找数据 [成绩在成绩表中,所以查找的是成绩表score]
    where 查询条件 [没有]
    group by 分组 [平均成绩:先按学号分组,再计算平均成绩]
    having 对分组结果指定条件 [平均成绩大于60分]
    */
    select 学号, avg(成绩)
    from score
    group by 学号
    having avg(成绩)>60;

    查询至少选修两门课程的学生学号

    /* 
    翻译成大白话:
    第1步,需要先计算出每个学生选修的课程数据,需要按学号分组
    第2步,至少选修两门课程:也就是每个学生选修课程数目>=2,对分组结果指定条件
    
    分析思路
    select 查询结果 [学号,每个学生选修课程数目:汇总函数count]
    from 从哪张表中查找数据 [课程的学生学号:课程表score]
    where 查询条件 [至少选修两门课程:需要先计算出每个学生选修了多少门课,需要用分组,所以这里没有where子句]
    group by 分组 [每个学生选修课程数目:按课程号分组,然后用汇总函数count计算出选修了多少门课]
    having 对分组结果指定条件 [至少选修两门课程:每个学生选修课程数目>=2]
    */
    select 学号, count(课程号) as 选修课程数目
    from score
    group by 学号
    having count(课程号)>=2;

    查询同名同性学生名单并统计同名人数

    /* 
    翻译成大白话,问题解析:
    1)查找出姓名相同的学生有谁,每个姓名相同学生的人数
    查询结果:姓名,人数
    条件:怎么算姓名相同?按姓名分组后人数大于等于2,因为同名的人数大于等于2
    分析思路
    select 查询结果 [姓名,人数:汇总函数count(*)]
    from 从哪张表中查找数据 [学生表student]
    where 查询条件 [没有]
    group by 分组 [姓名相同:按姓名分组]
    having 对分组结果指定条件 [姓名相同:count(*)>=2]
    order by 对查询结果排序[没有];
    */
    
    select 姓名,count(*) as 人数
    from student
    group by 姓名
    having count(*)>=2;

    查询不及格的课程并按课程号从大到小排列

    /* 
    分析思路
    select 查询结果 [课程号]
    from 从哪张表中查找数据 [成绩表score]
    where 查询条件 [不及格:成绩 <60]
    group by 分组 [没有]
    having 对分组结果指定条件 [没有]
    order by 对查询结果排序[课程号从大到小排列:降序desc];
    */
    select 课程号
    from score 
    where 成绩<60
    order by 课程号 desc;

    查询每门课程的平均成绩,结果按平均成绩升序排序,平均成绩相同时,按课程号降序排列

    /* 
    分析思路
    select 查询结果 [课程号,平均成绩:汇总函数avg(成绩)]
    from 从哪张表中查找数据 [成绩表score]
    where 查询条件 [没有]
    group by 分组 [每门课程:按课程号分组]
    having 对分组结果指定条件 [没有]
    order by 对查询结果排序[按平均成绩升序排序:asc,平均成绩相同时,按课程号降序排列:desc];
    */
    select 课程号, avg(成绩) as 平均成绩
    from score
    group by 课程号
    order by 平均成绩 asc,课程号 desc;

    检索课程编号为“0004”且分数小于60的学生学号,结果按按分数降序排列

    /* 
    分析思路
    select 查询结果 []
    from 从哪张表中查找数据 [成绩表score]
    where 查询条件 [课程编号为“04”且分数小于60]
    group by 分组 [没有]
    having 对分组结果指定条件 []
    order by 对查询结果排序[查询结果按按分数降序排列];
    */
    select 学号
    from score
    where 课程号='04' and 成绩 <60
    order by 成绩 desc;

    统计每门课程的学生选修人数(超过2人的课程才统计)

    要求输出课程号和选修人数,查询结果按人数降序排序,若人数相同,按课程号升序排序

    /* 
    分析思路
    select 查询结果 [要求输出课程号和选修人数]
    from 从哪张表中查找数据 []
    where 查询条件 []
    group by 分组 [每门课程:按课程号分组]
    having 对分组结果指定条件 [学生选修人数(超过2人的课程才统计):每门课程学生人数>2]
    order by 对查询结果排序[查询结果按人数降序排序,若人数相同,按课程号升序排序];
    */
    select 课程号, count(学号) as '选修人数'
    from score
    group by 课程号
    having count(学号)>2
    order by count(学号) desc,课程号 asc;

    查询两门以上不及格课程的同学的学号及其平均成绩

    /*
    分析思路
    先分解题目:
    1)[两门以上][不及格课程]限制条件
    2)[同学的学号及其平均成绩],也就是每个学生的平均成绩,显示学号,平均成绩
    分析过程:
    第1步:得到每个学生的平均成绩,显示学号,平均成绩
    第2步:再加上限制条件:
    1)不及格课程
    2)两门以上[不及格课程]:课程数目>2
    
    
    /* 
    第1步:得到每个学生的平均成绩,显示学号,平均成绩
    select 查询结果 [学号,平均成绩:汇总函数avg(成绩)]
    from 从哪张表中查找数据 [涉及到成绩:成绩表score]
    where 查询条件 [没有]
    group by 分组 [每个学生的平均:按学号分组]
    having 对分组结果指定条件 [没有]
    order by 对查询结果排序[没有];
    */
    select 学号, avg(成绩) as 平均成绩
    from score
    group by 学号;
    
    
    /* 
    第2步:再加上限制条件:
    1)不及格课程
    2)两门以上[不及格课程]
    select 查询结果 [学号,平均成绩:汇总函数avg(成绩)]
    from 从哪张表中查找数据 [涉及到成绩:成绩表score]
    where 查询条件 [限制条件:不及格课程,平均成绩<60]
    group by 分组 [每个学生的平均:按学号分组]
    having 对分组结果指定条件 [限制条件:课程数目>2,汇总函数count(课程号)>2]
    order by 对查询结果排序[没有];
    */
    select 学号, avg(成绩) as 平均成绩
    from score
    where 成绩 <60
    group by 学号
    having count(课程号)>=2;

    如果上面题目不会做,可以复习这部分涉及到的sql知识:

    3.复杂查询

    查询所有课程成绩小于60分学生的学号、姓名

    【知识点】子查询
    
    1.翻译成大白话
    1)查询结果:学生学号,姓名
    2)查询条件:所有课程成绩 < 60 的学生,需要从成绩表里查找,用到子查询
    
    第1步,写子查询(所有课程成绩 < 60 的学生)
    select 查询结果[学号]
    from 从哪张表中查找数据[成绩表:score]
    where 查询条件[成绩 < 60]
    group by 分组[没有]
    having 对分组结果指定条件[没有]
    order by 对查询结果排序[没有]
    limit 从查询结果中取出指定行[没有];
    
    select 学号 
    from score
    where 成绩 < 60;
    
    第2步,查询结果:学生学号,姓名,条件是前面1步查到的学号
    
    select 查询结果[学号,姓名]
    from 从哪张表中查找数据[学生表:student]
    where 查询条件[用到运算符in]
    group by 分组[没有]
    having 对分组结果指定条件[没有]
    order by 对查询结果排序[没有]
    limit 从查询结果中取出指定行[没有];
    */
    select 学号,姓名
    from student
    where  学号 in (
    select 学号 
    from score
    where 成绩 < 60
    );

    查询没有学全所有课的学生的学号、姓名|

    /*
    查找出学号,条件:没有学全所有课,也就是该学生选修的课程数 < 总的课程数
    【考察知识点】in,子查询
    */
    select 学号,姓名
    from student
    where 学号 in(
    select 学号 
    from score
    group by 学号
    having count(课程号) < (select count(课程号) from course)
    );

    查询出只选修了两门课程的全部学生的学号和姓名|

    select 学号,姓名
    from student
    where 学号 in(
    select 学号
    from score
    group by 学号
    having count(课程号)=2
    );

    1990年出生的学生名单

    /*
    查找1990年出生的学生名单
    学生表中出生日期列的类型是datetime
    */
    select 学号,姓名 
    from student 
    where year(出生日期)=1990; 
    

    查询各科成绩前两名的记录

    这类问题其实就是常见的:分组取每组最大值、最小值,每组最大的N条(top N)记录。

    sql面试题:topN问题

    工作中会经常遇到这样的业务问题:

    • 如何找到每个类别下用户最喜欢的产品是哪个?
    • 如果找到每个类别下用户点击最多的5个商品是什么?

     

    这类问题其实就是常见的:分组取每组最大值、最小值,每组最大的N条(top N)记录。

     

    面对该类问题,如何解决呢?

     

    下面我们通过成绩表的例子来给出答案。

     

    成绩表是学生的成绩,里面有学号(学生的学号),课程号(学生选修课程的课程号),成绩(学生选修该课程取得的成绩)

     

     

    • 分组取每组最大值

     

    案例:按课程号分组取成绩最大值所在行的数据

     

    我们可以使用分组(group by)和汇总函数得到每个组里的一个值(最大值,最小值,平均值等)。但是无法得到成绩最大值所在行的数据。

     

    select 课程号,max(成绩) as 最大成绩from score group by 课程号;

     

    我们可以使用关联子查询来实现:

     

    select * from score as a where 成绩 = (select max(成绩) from score as b where b.课程号 = a.课程号);

     

     

    上面查询结果课程号“0001”有2行数据,是因为最大成绩80有2个

     

    • 分组取每组最小值

     

    案例:按课程号分组取成绩最小值所在行的数据

     

    同样的使用关联子查询来实现

    select * from score as a where 成绩 = (select min(成绩) from score as b where b.课程号 = a.课程号);

     

     

     

    • 每组最大的N条记录

     

    案例:查询各科成绩前两名的记录

     

    第1步,查出有哪些组

    我们可以按课程号分组,查询出有哪些组,对应这个问题里就是有哪些课程号

    select 课程号,max(成绩) as 最大成绩from score group by 课程号;

     

     

    第2步:先使用order by子句按成绩降序排序(desc),然后使用limt子句返回topN(对应这个问题返回的成绩前两名)

    -- 课程号'0001' 这一组里成绩前2名select * from score where 课程号 = '0001' order by 成绩  desc limit 2;

    同样的,可以写出其他组的(其他课程号)取出成绩前2名的sql

     

    第3步,使用union all 将每组选出的数据合并到一起

    -- 左右滑动可以可拿到全部sql(select * from score where 课程号 = '0001' order by 成绩  desc limit 2)union all(select * from score where 课程号 = '0002' order by 成绩  desc limit 2)union all(select * from score where 课程号 = '0003' order by 成绩  desc limit 2);

     

     

    前面我们使用order by子句按某个列降序排序(desc)得到的是每组最大的N个记录。如果想要达到每组最小的N个记录,将order by子句按某个列升序排序(asc)即可。

     

    求topN的问题还可以使用自定义变量来实现,这个在后续再介绍。

     

    如果对多表合并还不了解的,可以看下我讲过的《从零学会SQL》的“多表查询”。

     

     

     

    • 总结

    常见面试题:分组取每组最大值、最小值,每组最大的N条(top N)记录。

    4.多表查询

    查询所有学生的学号、姓名、选课数、总成绩

    selecta.学号,a.姓名,count(b.课程号) as 选课数,sum(b.成绩) as 总成绩
    from student as a left join score as b
    on a.学号 = b.学号
    group by a.学号;

    查询平均成绩大于85的所有学生的学号、姓名和平均成绩

    select a.学号,a.姓名, avg(b.成绩) as 平均成绩
    from student as a left join score as b
    on a.学号 = b.学号
    group by a.学号
    having avg(b.成绩)>85;

    查询学生的选课情况:学号,姓名,课程号,课程名称

    select a.学号, a.姓名, c.课程号,c.课程名称
    from student a inner join score b on a.学号=b.学号
    inner join course c on b.课程号=c.课程号;

    查询出每门课程的及格人数和不及格人数

    -- 考察case表达式
    select 课程号,
    sum(case when 成绩>=60 then 1 
    	 else 0 
        end) as 及格人数,
    sum(case when 成绩 <  60 then 1 
    	 else 0 
        end) as 不及格人数
    from score
    group by 课程号;

    使用分段[100-85],[85-70],[70-60],[<60]来统计各科成绩,分别统计:各分数段人数,课程号和课程名称

    -- 考察case表达式
    select a.课程号,b.课程名称,
    sum(case when 成绩 between 85 and 100 
    	 then 1 else 0 end) as '[100-85]',
    sum(case when 成绩 >=70 and 成绩<85 
    	 then 1 else 0 end) as '[85-70]',
    sum(case when 成绩>=60 and 成绩<70  
    	 then 1 else 0 end) as '[70-60]',
    sum(case when 成绩<60 then 1 else 0 end) as '[<60]'
    from score as a right join course as b 
    on a.课程号=b.课程号
    group by a.课程号,b.课程名称;

    查询课程编号为0003且课程成绩在80分以上的学生的学号和姓名|

    select a.学号,a.姓名
    from student  as a inner join score as b on a.学号=b.学号
    where b.课程号='0003' and b.成绩>80;

    下面是学生的成绩表(表名score,列名:学号、课程号、成绩)

    使用sql实现将该表行转列为下面的表结构

    【面试题类型总结】这类题目属于行列如何互换,解题思路如下:

    【面试题】下面是学生的成绩表(表名score,列名:学号、课程号、成绩)

     

     

    使用sql实现将该表行转列为下面的表结构

     

     

    【解答】

     

    第1步,使用常量列输出目标表的结构

    可以看到查询结果已经和目标表非常接近了

     

    select 学号,'课程号0001','课程号0002','课程号0003'from score;

     

     

    第2步,使用case表达式,替换常量列为对应的成绩

    select 学号,(case 课程号 when '0001' then 成绩 else 0 end) as '课程号0001',(case 课程号 when '0002' then 成绩 else 0 end) as  '课程号0002',(case 课程号 when '0003' then 成绩 else 0 end) as '课程号0003'from score;

     

     

    在这个查询结果中,每一行表示了某个学生某一门课程的成绩。比如第一行是'学号0001'选修'课程号00001'的成绩,而其他两列的'课程号0002'和'课程号0003'成绩为0。

     

    每个学生选修某门课程的成绩在下图的每个方块内。我们可以通过分组,取出每门课程的成绩。

     

     

    第3关,分组

    分组,并使用最大值函数max取出上图每个方块里的最大值

    select 学号,max(case 课程号 when '0001' then 成绩 else 0 end) as '课程号0001',max(case 课程号 when '0002' then 成绩 else 0 end) as '课程号0002',max(case 课程号 when '0003' then 成绩 else 0 end) as '课程号0003'from scoregroup by 学号;

     

    这样我们就得到了目标表(行列互换)

     

    其他面试题:

    https://blog.csdn.net/u010565545/article/details/100786293

     

    展开全文
  • SQL 常见面试题解析 内容简介 本文介绍并分析了 100 道常见 SQL 面试题,主要分为三个模块:SQL 初级查询、SQL 高级查询以及数据库设计与开发。文章内容结构如下图所示: 本文主要使用三个示例表:员工表(employee...
  • SQL优化面试专题及答案

    千次阅读 2019-12-31 12:06:36
    字符串类型是: SET BLOB ENUM CHAR TEXT VARCHAR 15:SQL标准定义的四个隔离级别为: read uncommited :读到未提交数据 read committed:脏读,不可重复读 repeatable read:可重读 serializable :串行事物 16:...

    1:LIKE和REGEXP操作有什么区别?

            SELECT * FROM app_user WHERE user REGEXP "^lz";
    SELECT * FROM app_user WHERE user LIKE "lz%";
          

    v2-1a3ee781556b82f726d764f07fce2214_b.jpg
            SELECT * FROM app_user WHERE user REGEXP "^lz";
          

    只要有lz就行,只有以^开头的一种语法

            SELECT * FROM app_user WHERE user LIKE "lz%";
          

    匹配以lz开头的字符串

    2:Mysql查询是否区分大小写?

    不区分

            SELECT VERSION(), CURRENT_DATE;
    SeLect version(), current_date;
    seleCt vErSiOn(), current_DATE;
          

    v2-f2aaad34dd28c8174f0f4766b1b763fd_b.jpg

    3:我们如何得到受查询影响的行数?

    行数可以通过以下代码获得(查询数据有多少条数):

            SELECT COUNT(user_id)FROM users;
          

    4:列比较运算符有哪些?

    在SELECT语句的列比较中使用=,<>,<=,<,> =,>,BETWEEN,AND,OR或LIKE运算符。

    5:LIKE声明中的%和_是什么意思?

    %对应于0个或更多字符,_只是LIKE语句中的一个字符。

    6:查询某张表的索引?

            show index from app_user;
          

    v2-a42d743c2c2c9321967ac722df883120_b.jpg

    7:最后一次插入时分配了哪个自动增量?

            SELECT LAST_INSERT_ID()
          

    8:数据库有一个字段是timestamp会怎样?

    已验证:每当行被更改时,时间戳字段将获取当前时间戳。

    v2-1a1c01955a2bdc85ca01d6d5d993b017_b.jpg
            `create_time` timestamp not null default current_timestamp comment '创建时间',
    `update_time` timestamp not null default current_timestamp on update current_timestamp comment '修改时间',
          

    9:如何控制HEAP表的最大尺寸?

    Heal表的大小可通过称为max_heap_table_size的Mysql配置变量来控制。

    10:Heap表是什么?

    HEAP表存在于内存中,用于临时高速存储。

    BLOB或TEXT字段是不允许的

    只能使用比较运算符=,<,>,=>,= <

    HEAP表不支持AUTO_INCREMENT

    索引不可为NULL

            CREATE TABLE test (
    	id INT UNSIGNED NOT NULL auto_increment PRIMARY KEY,
    	state CHAR (10),
    	type CHAR (20),
    	date CHAR (30)
    ) ENGINE = MEMORY DEFAULT CHARSET = utf8;
          

    11:一张表,里面有ID自增主键,当insert了17条记录之后,删除了第15,16,17条记录,再把Mysql重启,再insert一条记录,这条记录的ID是18还是15 ?

    (1)如果表的类型是MyISAM,那么是18

    因为MyISAM表会把自增主键的最大ID记录到数据文件里,重启MySQL自增主键的最大ID也不会丢失

    (2)如果表的类型是InnoDB,那么是15

    InnoDB表只是把自增主键的最大ID记录到内存中,所以重启数据库或者是对表进行OPTIMIZE操作,都会导致最大ID丢失

    总结:主要看最大id存储在数据文件中,还是在内存中。

    12:在Mysql中ENUM的用法是什么?

             CREATE TABLE test4 (  
         id BIGINT UNSIGNED  PRIMARY KEY AUTO_INCREMENT,  
         brand VARCHAR(255) NOT NULL,  
         color ENUM('RED','GREEN','BLUE')
      ) ENGINE = InnoDB; 
          

    13:CHAR和VARCHAR的区别?

            以下是CHAR和VARCHAR的区别:
    CHAR和VARCHAR类型在存储和检索方面有所不同
    CHAR列长度固定为创建表时声明的长度,长度值范围是1到255
    当CHAR值被存储时,它们被用空格填充到特定长度,检索CHAR值时需删除尾随空格。
          

    14:列的字符串类型可以是什么?

    字符串类型是:

            SET
    BLOB
    ENUM
    CHAR
    TEXT
    VARCHAR
          

    15:SQL标准定义的四个隔离级别为:

            read uncommited :读到未提交数据
    read committed:脏读,不可重复读
    repeatable read:可重读
    serializable :串行事物
          

    16:Mysql表中允许有多少个TRIGGERS?

    在Mysql表中允许有六个触发器,如下:

            BEFORE INSERT
    AFTER INSERT
    BEFORE UPDATE
    AFTER UPDATE
    BEFORE DELETE
    AFTER DELETE
          

    17:mysql支持事物嘛?

    和引擎有关 innodb支持

    18:Btree B+tree(滴滴面试画图)

            对B+Tree主键的范围查找和分页查找
    下面做一个推算:
    InnoDB存储引擎中页的大小为16KB,一般表的主键类型为INT(占用4个字节)或BIGINT(占用8个字节),指针类型也一般为4或8个字节,也就是说一个页(B+Tree中的一个节点)中
    大概存储16KB/(8B+8B)=1K个键值(因为是估值,为方便计算,这里的K取值为〖10〗^3)。也就是说一个深度为3的B+Tree索引可以维护10^3 * 10^3 * 10^3 = 10亿 条记录。
          

    以下两张图参考网络,理解能画出来就行了

    B+树

    v2-cf7dc82551c6046be684351dcee592a5_b.jpg


    BTree

    v2-f34ac4fa1caf4013aed74a602fb86848_b.jpg

    展开全文
  • Java面试题(十) - SQL语句的优化

    千次阅读 2019-03-26 20:41:56
    SQL语句的优化一般有以下几种方式: 一、设置合适的字段属性 (1) 例如,设置中国的电话号码是11位,varchar的长度不设置默认255,设置11位。 (2) 字段的长度越小,占用的内存就越小,性能就越好 二、使用JOIN语法...
  • 阿里面试真题:慢SQL优化思路

    千次阅读 2020-01-12 16:55:10
    其实这是个常见的面试题目: 1、知识点一:执行计划:具体参数可以参见:https://segmentfault.com/a/1190000008131735 各列的含义如下: id: SELECT 查询的标识符. 每个 SELECT 都会自动分配一个唯一的标识符. ...
  • 前几天找工作,面试sql优化,explain命令应该大家都用到过,只是之前我也没注意过具体参数的含义,导致面试时很尴尬,事后学习了一下。 Explain命令是用来直接检查sql语句的,有两个参数很重要“Type”和“Extra”...
  • SQL岗位30个面试题SQL面试问题及答案

    万次阅读 多人点赞 2019-06-19 17:42:34
    SQL岗位30个面试题SQL面试问题及答案: 什么是SQLSQL(结构化查询语言)是一种设计用于检索和操作数据的数据库。它属于美国国家标准协会(ANSI)的一种标准,可用于执行Select(选择)、Update(更新)、...
  • sql优化和常见问题解决方案,面试常见问题等
  • 很好的sql面试题哦 很细的几乎都包括了面试时候会问所以问题
  • Sql优化总结!详细!(2021最新面试必问)

    万次阅读 多人点赞 2021-04-09 16:20:03
    Sql优化基础Sql优化查询SQL尽量不要使用select *,而是具体字段避免在where子句中使用or来连接条件使用varchar代替char尽量使用数值替代字符串类型查询尽量避免返回大量数据使用explain分析你SQL执行计划是否使用了...
  • 面试题5————sql优化

    千次阅读 2017-07-05 20:40:06
    20+条MySQL性能优化的最佳经验 By Lee - Last updated: 星期三, 八月 19, 2015 Leave a Comment 今天,数据库的操作越来越成为整个应用的性能瓶颈了,这点对于Web应用尤其明显。关于数据库的性能,这并不只是DBA才...
  • sql优化面试必问一)

    万次阅读 多人点赞 2016-07-28 10:59:42
    这时候就需要你谈一下sql优化相关的内容 , 一下几个方面1、慢查询2、索引3、拆分表数据库索引变快全部检索(扫描)系统集成二叉树算法--》索引文件 物理位置log2N 检索10次可以检索2的10次方个数(1024)全文索引,...
  • MySQL数据库面试题(2020最新版)

    万次阅读 多人点赞 2020-03-10 17:20:40
    文章目录数据库基础知识为什么要使用数据库什么是SQL?什么是MySQL?数据库三大范式是什么mysql有关权限的表都有哪几个MySQL的binlog有有几种录入格式?分别有什么区别?数据类型mysql有哪些数据类型引擎MySQL存储...
  • 数据库面试题索引sql优化

    热门讨论 2010-05-28 21:59:50
    数据库面试题索引sql优化数据库面试题索引sql优化数据库面试题索引sql优化数据库面试题索引sql优化数据库面试题索引sql优化数据库面试题索引sql优化数据库面试题索引sql优化数据库面试题索引sql优化数据库面试题索引...
  • sql优化和索引常见的面试题(面试总结)

    万次阅读 多人点赞 2019-08-23 11:44:16
    9. sql优化您们是怎么做的? 一.首先开启数据库慢查询日志,定位到查询效率比较低的sql , 找出对应的sql语句并进行分析 1.表设计是否规范,是否符合三范式的标准 (1)第一范式:保证原子性(不可拆分) (2)第...
  • Oracle优化面试题

    千次阅读 2017-11-20 10:51:32
    Oracle SQL性能优化 (1)选择最有效率的表名顺序(只在基于规则的优化器中有效): ORACLE的解析器按照从右到左的顺序处理FROM子句中的表名,FROM子句中写在最后的表(基础表 driving table)将被最先处理,在FROM...
  • 常见Sql面试题及答案

    万次阅读 2018-08-27 19:34:00
    7、sql优化 (1)、explain出来的各种item的意义; (2)、profile的意义以及使用场景;   8、备份计划,mysqldump以及xtranbackup的实现原理 (1)、备份计划; 视库的大小来定,一般来说 100G 内的...
  • mysql优化方面的面试题

    万次阅读 多人点赞 2019-08-15 18:25:48
    1.MySQL数据库作发布系统的存储,一天五万条以上的增量,预计运维三年,怎么优化? a. 设计良好的数据库结构,允许部分数据冗余,尽量避免join查询,提高效率。 b. 选择合适的表字段数据类型和存储引擎,适当的添加...
  • java面试(3)SQL优化

    千次阅读 多人点赞 2018-07-09 15:44:11
    对查询进行优化,要尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引。任何在Order by语句的非索引项或者有计算表达式都将降低查询速度应尽量避免在 where 子句中对字段进行 null 值判断,否则...
  • Java基础知识面试题(2020最新版)

    万次阅读 多人点赞 2020-02-19 12:11:27
    Java面试总结(2021优化版)已发布在个人微信公众号【技术人成长之路】,优化版首先修正了读者反馈的部分答案存在的错误,同时根据最新面试总结,删除了低频问题,添加了一些常见面试题,对文章进行了精简优化,欢迎...
  • 优化1——数据库优化面试题

    万次阅读 2016-08-12 20:01:58
    1) SQL语句及索引的优化 2) 数据库表结构的优化 3) 系统配置的优化 4) 硬件优化   2.索引的底层实现原理和优化 在 DB2 数据库中索引采用的是 B+ 树的结构,索引的叶子节点上包含索引键的值和一个指向...
  • 2021-05-15 SqlServer面试题 高级篇

    万次阅读 2021-05-15 09:57:32
    三、SqlServer笔试高级篇 1.什么是内存泄漏? 一般我们所说的内存泄漏指的是堆内存的泄漏。堆内存是程序从堆中为其分配的,大小任意的,使用完后要显示释放内存。当应用程序用关键字new 等创建对象时,就从堆中为它...
  • Java面试题大全(2020版)

    万次阅读 多人点赞 2019-11-26 11:59:06
    发现网上很多Java面试题都没有答案,所以花了很长时间搜集整理出来了这套Java面试题大全,希望对大家有帮助哈~ 本套Java面试题大全,全的不能再全,哈哈~ 一、Java 基础 1. JDK 和 JRE 有什么区别? JDK:Java ...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 44,421
精华内容 17,768
关键字:

sql优化面试题