力扣上的SQL复健记录7_正则表达式

题1.

你是餐馆的老板，现在你想分析一下可能的营业额变化增长（每天至少有一位顾客）。

计算以 7 天（某日期 + 该日期前的 6 天）为一个时间段的顾客消费平均值。average_amount 要 保留两位小数。

结果按 visited_on 升序排序。

返回结果格式的例子如下。

示例 1:

输入：
customer 表:
+-------------+--------------+--------------+-------------+
| customer_id | name         | visited_on   | amount      |
+-------------+--------------+--------------+-------------+
| 1           | jhon         | 2019-01-01   | 100         |
| 2           | daniel       | 2019-01-02   | 110         |
| 3           | jade         | 2019-01-03   | 120         |
| 4           | khaled       | 2019-01-04   | 130         |
| 5           | winston      | 2019-01-05   | 110         | 
| 6           | elvis        | 2019-01-06   | 140         | 
| 7           | anna         | 2019-01-07   | 150         |
| 8           | maria        | 2019-01-08   | 80          |
| 9           | jaze         | 2019-01-09   | 110         | 
| 1           | jhon         | 2019-01-10   | 130         | 
| 3           | jade         | 2019-01-10   | 150         | 
+-------------+--------------+--------------+-------------+
输出：
+--------------+--------------+----------------+
| visited_on   | amount       | average_amount |
+--------------+--------------+----------------+
| 2019-01-07   | 860          | 122.86         |
| 2019-01-08   | 840          | 120            |
| 2019-01-09   | 840          | 120            |
| 2019-01-10   | 1000         | 142.86         |
+--------------+--------------+----------------+

记录1.

select
    distinct date_add(visited_on,interval 6 day) as visited_on,
    amount,
    round(amount/7,2) as average_amount
from(
    select
        visited_on,
        sum(amount) over(order by visited_on range between current row and interval 6 day following) as amount
    from
        customer
)a
where date_add(visited_on,interval 6 day)<=(select max(visited_on) from customer)
order by visited_on

主要补充学习了一下窗口函数中的另一个参数设置，即range between实现7天范围内的累加。

题2.

编写解决方案，修复名字，使得只有第一个字符是大写的，其余都是小写的。

返回按 user_id 排序的结果表。

返回结果格式示例如下。

记录2.

select
    user_id,
    concat(upper(substring(name,1,1)),lower(substring(name,2))) as name
from   
    users
order by user_id

复习一下mysql中的文本操作函数 substring()：

mysql 中的 substring() 函数用于从字符串中提取子字符串。这个函数可以有三个参数，其含义如下：

1. 第一个参数：表示要从中提取子字符串的原始字符串。

2. 第二个参数：表示子字符串开始的位置。如果这个值是正数，提取将从字符串的左侧开始计数；如果这个值是负数，提取将从字符串的右侧开始计数。

3. 第三个参数（可选）：表示要提取的字符数。如果省略这个参数，substring() 将从开始位置一直提取到字符串的末尾。

题3.

查询患有 i 类糖尿病的患者 id （patient_id）、患者姓名（patient_name）以及其患有的所有疾病代码（conditions）。i 类糖尿病的代码总是包含前缀 diab1 。

按 任意顺序 返回结果表。

记录3.

select
    patient_id,
    patient_name,
    conditions
from
    patients
where
    conditions rlike '(^|[^a-za-z])diab1'

起初筛选处使用的是like "%diab1%"，但这并不能筛选中间含有diab1的记录，随后改用上正则表达式形式，
这里的正则表达式 `(^|[^a-za-z])diab1` 解释如下：

(^|[^a-za-z]) 表示字符串的开始 (^) 或者任何非字母字符，这确保了 "diab1" 是作为一个单独的词出现。

diab1 紧跟其后，确保匹配以 "diab1" 开头的词。

这样的正则表达式可以更准确地匹配以 "diab1" 开头的疾病代码，而不会错误地匹配到其他包含 "diab1" 的字符串。

题4.

编写解决方案删除所有重复的电子邮件，只保留一个具有最小 id 的唯一电子邮件。

（对于 sql 用户，请注意你应该编写一个 delete 语句而不是 select 语句。）

运行脚本后，显示的答案是 person 表。驱动程序将首先编译并运行您的代码片段，然后再显示 person 表。person 表的最终顺序 无关紧要 。

记录4.

delete a from person a
join person b
on a.email=b.email and a.id>b.id

这个 sql 语句的解释如下：

delete a 指定从 person 表中删除记录，这里使用别名 a。

join person b 将 person 表自身与别名为 b 的同一表进行连接。

on a.email = b.email and a.id > b.id 是连接条件，它确保我们只比较具有相同电子邮件的记录，并且 a 的 id 必须大于 b 的 id。这意味着对于每个电子邮件地址，只有具有最小 id 的记录会被保留，其他的则会被删除。

力扣上的SQL复健记录7

2024年08月01日 • 正则表达式 •我要评论

相关文章:

AR的光学原理？

Boost库编译指南

发表评论


验证码：