当前位置: 代码网 > it编程>编程语言>正则表达式 > 力扣上的SQL复健记录7

力扣上的SQL复健记录7

2024年08月01日 正则表达式 我要评论
查询患有 I 类糖尿病的患者 ID (patient_id)、患者姓名(patient_name)以及其患有的所有疾病代码(conditions)。如果这个值是负数,提取将从字符串的右侧开始计数。这样的正则表达式可以更准确地匹配以 "DIAB1" 开头的疾病代码,而不会错误地匹配到其他包含 "DIAB1" 的字符串。起初筛选处使用的是like "%DIAB1%",但这并不能筛选中间含有DIAB1的记录,随后改用上正则表达式形式,编写解决方案,修复名字,使得只有第一个字符是大写的,其余都是小写的。

题1.

你是餐馆的老板,现在你想分析一下可能的营业额变化增长(每天至少有一位顾客)。

计算以 7 天(某日期 + 该日期前的 6 天)为一个时间段的顾客消费平均值。average_amount 要 保留两位小数。

结果按 visited_on 升序排序

返回结果格式的例子如下。

示例 1:

输入:
customer 表:
+-------------+--------------+--------------+-------------+
| customer_id | name         | visited_on   | amount      |
+-------------+--------------+--------------+-------------+
| 1           | jhon         | 2019-01-01   | 100         |
| 2           | daniel       | 2019-01-02   | 110         |
| 3           | jade         | 2019-01-03   | 120         |
| 4           | khaled       | 2019-01-04   | 130         |
| 5           | winston      | 2019-01-05   | 110         | 
| 6           | elvis        | 2019-01-06   | 140         | 
| 7           | anna         | 2019-01-07   | 150         |
| 8           | maria        | 2019-01-08   | 80          |
| 9           | jaze         | 2019-01-09   | 110         | 
| 1           | jhon         | 2019-01-10   | 130         | 
| 3           | jade         | 2019-01-10   | 150         | 
+-------------+--------------+--------------+-------------+
输出:
+--------------+--------------+----------------+
| visited_on   | amount       | average_amount |
+--------------+--------------+----------------+
| 2019-01-07   | 860          | 122.86         |
| 2019-01-08   | 840          | 120            |
| 2019-01-09   | 840          | 120            |
| 2019-01-10   | 1000         | 142.86         |
+--------------+--------------+----------------+

记录1.

select
    distinct date_add(visited_on,interval 6 day) as visited_on,
    amount,
    round(amount/7,2) as average_amount
from(
    select
        visited_on,
        sum(amount) over(order by visited_on range between current row and interval 6 day following) as amount
    from
        customer
)a
where date_add(visited_on,interval 6 day)<=(select max(visited_on) from customer)
order by visited_on

主要补充学习了一下窗口函数中的另一个参数设置,即range between实现7天范围内的累加。

题2.

编写解决方案,修复名字,使得只有第一个字符是大写的,其余都是小写的。

返回按 user_id 排序的结果表。

返回结果格式示例如下。

记录2.

select
    user_id,
    concat(upper(substring(name,1,1)),lower(substring(name,2))) as name
from   
    users
order by user_id

复习一下mysql中的文本操作函数 substring():

mysql 中的 substring() 函数用于从字符串中提取子字符串。这个函数可以有三个参数,其含义如下:

1. 第一个参数:表示要从中提取子字符串的原始字符串。

2. 第二个参数:表示子字符串开始的位置。如果这个值是正数,提取将从字符串的左侧开始计数;如果这个值是负数,提取将从字符串的右侧开始计数。

3. 第三个参数(可选):表示要提取的字符数。如果省略这个参数,substring() 将从开始位置一直提取到字符串的末尾。

题3.

查询患有 i 类糖尿病的患者 id (patient_id)、患者姓名(patient_name)以及其患有的所有疾病代码(conditions)。i 类糖尿病的代码总是包含前缀 diab1 。

按 任意顺序 返回结果表。

记录3.

select
    patient_id,
    patient_name,
    conditions
from
    patients
where
    conditions rlike '(^|[^a-za-z])diab1'

起初筛选处使用的是like "%diab1%",但这并不能筛选中间含有diab1的记录,随后改用上正则表达式形式,
这里的正则表达式 `(^|[^a-za-z])diab1` 解释如下:

  • (^|[^a-za-z]) 表示字符串的开始 (^) 或者任何非字母字符,这确保了 "diab1" 是作为一个单独的词出现。
  • diab1 紧跟其后,确保匹配以 "diab1" 开头的词。

这样的正则表达式可以更准确地匹配以 "diab1" 开头的疾病代码,而不会错误地匹配到其他包含 "diab1" 的字符串。

题4.

编写解决方案 删除 所有重复的电子邮件,只保留一个具有最小 id 的唯一电子邮件。

(对于 sql 用户,请注意你应该编写一个 delete 语句而不是 select 语句。)

运行脚本后,显示的答案是 person 表。驱动程序将首先编译并运行您的代码片段,然后再显示 person 表。person 表的最终顺序 无关紧要 。

记录4.

delete a from person a
join person b
on a.email=b.email and a.id>b.id

这个 sql 语句的解释如下:

  • delete a 指定从 person 表中删除记录,这里使用别名 a。
  • join person b 将 person 表自身与别名为 b 的同一表进行连接。
  • on a.email = b.email and a.id > b.id 是连接条件,它确保我们只比较具有相同电子邮件的记录,并且 a 的 id 必须大于 b 的 id。这意味着对于每个电子邮件地址,只有具有最小 id 的记录会被保留,其他的则会被删除。

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com