Redis存储断点续传文件状态的最佳实践_Redis

1. redis 中存储文件上传状态

redis 提供了丰富的数据结构，可以灵活地存储和更新文件上传的各类状态。以下是几种常见的实现方式。

使用 hash 存储文件状态

在 redis 中，每个文件的上传状态可以使用一个独特的键（如 file_id 或者用户 id + 文件名的组合）来标识，所有与文件上传相关的数据（如已上传字节数、文件总大小、已上传的分块等）则存储在一个 hash 表中。例如：

key: file_upload:<file_id>
fields:
  - uploaded_size: 已上传的字节数
  - file_size: 文件的总大小
  - chunks: 已上传的分块索引列表
  - status: 当前上传状态（如 "uploading", "paused", "completed"）
  - last_update_time: 上次更新的时间

存储分块上传状态

对于大文件分块上传，redis 的集合（set）或者列表（list）可以存储每个已上传的分块。比如：

key: file_chunks:<file_id>
set: {chunk_1, chunk_2, chunk_3, ...}

这样，每个上传的分块都会被记录，上传状态能被精准地追踪和管理。

使用 ttl 进行状态过期管理

对于文件上传的临时状态，可以设置适当的过期时间。比如，当文件上传完成后，自动清理 redis 中的状态数据：

expire file_upload:<file_id> 86400  # 设置该文件状态一天后过期

这样避免了无用数据的长期占用内存。

2. redis 与数据库保持一致

尽管 redis 高效且快速，但它毕竟是内存数据库，系统重启或故障时，存储的数据可能会丢失。因此，将 redis 中的断点续传状态与数据库中的持久化数据保持一致显得尤为重要。

方法 1：定期同步

最简单的方式是通过定时任务（如 cron job）定期将 redis 中的上传状态同步到数据库。可以设置一个后台服务，每隔一定时间（如每小时）扫描 redis 中所有的上传状态，将其写入数据库。

数据库表设计：

create table file_upload_status (
    file_id varchar(255) primary key,
    uploaded_size bigint,
    file_size bigint,
    chunks text,  -- 存储已上传的分块信息，格式为 json
    status enum('uploading', 'paused', 'completed'),
    last_update_time datetime
);

方法 2：实时同步

如果需要更高的实时性，可以采用实时同步的方法。每当 redis 中某个文件的上传状态发生变化时，立即同步到数据库。可以使用消息队列（如 kafka 或 rabbitmq）来异步处理同步任务，或者直接在代码中同步更新。

例如：

更新 redis 中的状态时，触发异步任务。
利用 redis 的 keyspace notifications（键空间通知）来监听 redis 中键的变化，并自动将变化同步到数据库。

方法 3：双写机制

双写机制是在每次更新 redis 时，直接同步更新数据库。这种方式确保了每次写操作都会同时影响 redis 和数据库，从而避免了数据的不一致。

例如，在更新文件上传进度时：

multi  # redis 事务
hset file_upload:<file_id> uploaded_size 1024
exec

-- 同时更新数据库
update file_upload_status set uploaded_size = 1024 where file_id = '<file_id>';

方法 4：系统重启后的恢复

为了在系统重启后能够恢复上传状态，可以在系统启动时从数据库加载上传状态，并同步到 redis。这样即使服务重启，断点续传的状态也不会丢失。

for record in db.query("select * from file_upload_status where status = 'uploading'"):
    redis.hmset(f"file_upload:{record['file_id']}", {
        "uploaded_size": record['uploaded_size'],
        "file_size": record['file_size'],
        "status": record['status']
    })

3. 一致性保障

为了确保 redis 和数据库中的数据一致性，我们可以采用以下策略：

事务控制：确保 redis 和数据库的写入操作在同一个事务中完成，以保证数据的一致性。
消息队列：通过消息队列记录 redis 的变更事件，再由后台服务同步到数据库，从而避免直接操作数据库带来的性能瓶颈。
幂等性设计：确保每次操作是幂等的，即即使重复执行，数据也不会出现冲突或不一致。
定期数据对账：定期对 redis 和数据库中的数据进行比对，确保一致性。如果发现不一致，可以触发修复机制。

4. 总结

redis 作为临时存储，能高效地支持断点续传系统的状态管理。结合定时同步、实时更新或双写机制，能够确保 redis 和数据库中的数据保持一致性。在实现时，我们还要注意一致性保障，避免因 redis 失效或重启导致的数据丢失。

5. 代码实践

5.1 在 redis 中存储文件上传状态

首先，我们需要在 redis 中为每个文件的上传状态创建一个 hash 表来记录文件的状态。假设我们正在上传一个大文件，采用分块上传。

#include <hiredis/hiredis.h>
#include <iostream>
#include <string>

// 连接 redis
rediscontext* connecttoredis() {
    rediscontext* c = redisconnect("127.0.0.1", 6379);
    if (c == null || c->err) {
        if (c) {
            std::cerr << "redis connection error: " << c->errstr << std::endl;
        } else {
            std::cerr << "unable to allocate redis context\n";
        }
        exit(1);
    }
    return c;
}

// 设置文件上传状态
void setfileuploadstatus(rediscontext* c, const std::string& file_id, size_t uploaded_size, size_t file_size, const std::string& status) {
    redisreply* reply = (redisreply*)rediscommand(c, 
        "hset file_upload:%s uploaded_size %zu file_size %zu status %s",
        file_id.c_str(), uploaded_size, file_size, status.c_str());
    freereplyobject(reply);
}

int main() {
    rediscontext* c = connecttoredis();
    
    std::string file_id = "file123";
    size_t uploaded_size = 5000;  // 已上传 5000 字节
    size_t file_size = 10000;     // 文件总大小 10000 字节
    std::string status = "uploading";  // 上传状态：正在上传
    
    // 更新 redis 中的文件状态
    setfileuploadstatus(c, file_id, uploaded_size, file_size, status);

    redisfree(c);
    return 0;
}

5.2 存储已上传的分块状态

对于分块上传，可以在 redis 中使用 set 来记录已上传的分块。

// 添加已上传分块到 redis set
void adduploadedchunk(rediscontext* c, const std::string& file_id, const std::string& chunk_id) {
    redisreply* reply = (redisreply*)rediscommand(c,
        "sadd file_chunks:%s %s", file_id.c_str(), chunk_id.c_str());
    freereplyobject(reply);
}

int main() {
    rediscontext* c = connecttoredis();

    std::string file_id = "file123";
    std::string chunk_id = "chunk_1";  // 上传的第一个分块
    
    // 将已上传的分块存储到 redis set 中
    adduploadedchunk(c, file_id, chunk_id);
    
    redisfree(c);
    return 0;
}

5.3 数据同步到数据库

将 redis 中的状态同步到 mysql 数据库，以确保持久化存储的一致性。

#include <mysql/mysql.h>

// 连接 mysql 数据库
mysql* connecttodatabase() {
    mysql* conn = mysql_init(null);
    if (conn == null) {
        std::cerr << "mysql_init() failed\n";
        exit(1);
    }

    conn = mysql_real_connect(conn, "localhost", "root", "password", "file_upload", 3306, null, 0);
    if (conn == null) {
        std::

cerr << "mysql_real_connect() failed\n";
        exit(1);
    }

    return conn;
}

// 将文件上传状态同步到数据库
void synctodatabase(mysql* conn, const std::string& file_id, size_t uploaded_size, size_t file_size, const std::string& status) {
    std::string query = "update file_upload_status set uploaded_size = " + std::to_string(uploaded_size) + 
                        ", file_size = " + std::to_string(file_size) + 
                        ", status = '" + status + 
                        "' where file_id = '" + file_id + "'";

    if (mysql_query(conn, query.c_str())) {
        std::cerr << "mysql query failed: " << mysql_error(conn) << std::endl;
    }
}

int main() {
    mysql* conn = connecttodatabase();

    std::string file_id = "file123";
    size_t uploaded_size = 5000;
    size_t file_size = 10000;
    std::string status = "uploading";

    // 将文件上传状态同步到数据库
    synctodatabase(conn, file_id, uploaded_size, file_size, status);
    
    mysql_close(conn);
    return 0;
}

通过这种方式，我们可以实现高效、稳定的断点续传系统，同时确保 redis 和数据库中的数据一致性。

到此这篇关于redis存储断点续传文件状态的最佳实践的文章就介绍到这了,更多相关redis存储断点续传文件内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网！

Redis存储断点续传文件状态的最佳实践

2024年12月19日 • Redis •我要评论