前言
近段时间业务在一个局点测试clickhouse,用java写的代码在环境上一直连接不上clickhouse服务,报错信息也比较奇怪,no client available
,研发查了一段时间没查出来,让运维这边继续查:
运维同学查了各种监听配置,防火墙这些,都没什么问题,但是没有明确证据能够提供证明通过http方式能访问到数据库,时间拖得比较久,项目上就急了,让尽快找到问题,所以就用go写了个小工具拉到集群上试试看8123这个端口到底能不能正常提供服务。
正文
先安装必要的库,clickhouse官方提供了2个版本的库,v1和v2,v1版本已经明确不会继续更新了,所以用新不用旧哈,可以用官方库的方式或者用dsn的方式,这个我下面一起说,安装库的命令:
go get github.com/clickhouse/clickhouse-go/v2
构造结构体
编写结构体,存放基本信息:
type clickhouse struct { host string // 服务端主机 port int // 端口 db string // 数据库 user string // 用户名 password string // 密码 connection *sql.db // 建立连接后存放连接 rows *sql.rows // 运行sql后的结果存放 }
connection
主要是用来建立连接后把相关信息存放,这样方便继续调用其他的方法,因为我的主要目的是测试数据库能否连通和运行sql,所以这里rows
用来存放测试的select语句的结果。
参数读取
这块没什么好说的,连接的参数直接从命令行读取,用flag包就好:
var ( host = flag.string("host", "localhost", "clickhouse host") port = flag.int("port", 8123, "clickhouse port") user = flag.string("user", "default", "clichouse user") pass = flag.string("password", "", "clickhouse password") db = flag.string("db", "default", "clickhouse database") query = flag.string("query", "show tables", "query you will run") mode = flag.string("mode", "driver", "driver or dsn") )
前面几个参数不用解释,主要是query
和mode
,query
是要运行的sql语句,我们默认就认为跑的是select语句,然后是mode
,允许选择模式,用户可以使用driver
或者dsn
两种模式进行连接,我写了两个不同的方法,其实也可以在一个connect方法里做判断,看个人习惯;
建立连接
接下来我们建立数据库连接:
// func (c *clickhouse) conn() { c.connection = clickhouse.opendb(&clickhouse.options{ addr: []string{fmt.sprintf("%s:%d", c.host, c.port)}, auth: clickhouse.auth{ database: c.db, username: c.user, password: c.password, }, settings: clickhouse.settings{ "max_execution_time": 60, }, dialtimeout: 5 * time.second, compression: &clickhouse.compression{ method: clickhouse.compressionbrotli, level: 5, }, // 必须添加协议方式 protocol: clickhouse.http, }) } func (c *clickhouse) conndsn() { conn, err := sql.open("clickhouse", fmt.sprintf("http://%s:%d/%s?username=%s&password=%s", c.host, c.port, c.db, c.user, c.password)) if err != nil { log.printf("connect to the server failed, %s.\n", err.error()) return } c.connection = conn }
参考官网的实例,实现两种连接方式,关闭方法就直接把sql.db和sql.rows都关闭就可以了:
func (c *clickhouse) close() { c.connection.close() c.rows.close() }
发起查询
查询使用query方法进行:
func (c *clickhouse) select(query string) { rows, err := c.connection.query(query) if err != nil { log.printf("query select failed, %s.\n", err.error()) return } c.rows = rows }
查询的结果我保存到rows里,方便后面的解析
结果解析
比较麻烦的就是结果的解析了,用过database/sql
库的哥们都知道,这个库只提供了基础的一些接口,查询出来一般用scan去获取数据,用法类似这样:
问题就在于,scan要指定和sql查询出来一样多的变量,对于我们这个小工具来说,sql是不一定的,所以查询出来的字段数量肯定yes不定的,如何动态处理这个问题,肯定是不能直接写一个结构体解决的,先看我的代码:
func (c *clickhouse) show() { cols, err := c.rows.columns() if err != nil { log.printf("failed to get table columns, %s.\n", err.error()) return } // 一行数据,使用any是为了避开数据类型的问题 var rows = make([]any, len(cols)) // 存实际的值,是byte数组,长度以列的数量为准 var values = make([][]byte, len(cols)) for i := 0; i < len(cols); i++ { rows[i] = &values[i] } // 打印表头 fmt.println(strings.join(cols, ",")) for c.rows.next() { if err = c.rows.scan(rows...); err != nil { fmt.println(err) return } var vstring []string for _, v := range values { vstring = append(vstring, string(v)) } // 逐行打印出来 fmt.println(strings.join(vstring, ",")) } }
大概思路是这样:
- scan需要传入每个用来绑定单行数据值的变量,所以values是实际存储数据的byte数组,然后把数组的每个元素的地址再存入到rows数组中;
- 现在可以用rows[index]这样的方式来访问values中的值了,把rows直接作为入参传入到scan,在每次循环中,把values的值转成逗号分割的字符串,直接打印
结果验证
ok,现在逻辑完成了,我们运行测试一下,
go run main.go -host hostname -password paswword -query "select * from clusters" -db system -mode dsn
只查询2个字段,2行数据:
结语
完成,然后把工具放到生产环境一测试,查询都正常,这下开发哥们要继续查他的程序问题了
以上为个人经验,希望能给大家一个参考,也希望大家多多支持代码网。
发表评论