前言
近段时间业务在一个局点测试clickhouse,用java写的代码在环境上一直连接不上clickhouse服务,报错信息也比较奇怪,no client available,研发查了一段时间没查出来,让运维这边继续查:

运维同学查了各种监听配置,防火墙这些,都没什么问题,但是没有明确证据能够提供证明通过http方式能访问到数据库,时间拖得比较久,项目上就急了,让尽快找到问题,所以就用go写了个小工具拉到集群上试试看8123这个端口到底能不能正常提供服务。
正文
先安装必要的库,clickhouse官方提供了2个版本的库,v1和v2,v1版本已经明确不会继续更新了,所以用新不用旧哈,可以用官方库的方式或者用dsn的方式,这个我下面一起说,安装库的命令:

go get github.com/clickhouse/clickhouse-go/v2
构造结构体
编写结构体,存放基本信息:
type clickhouse struct {
host string // 服务端主机
port int // 端口
db string // 数据库
user string // 用户名
password string // 密码
connection *sql.db // 建立连接后存放连接
rows *sql.rows // 运行sql后的结果存放
}
connection主要是用来建立连接后把相关信息存放,这样方便继续调用其他的方法,因为我的主要目的是测试数据库能否连通和运行sql,所以这里rows用来存放测试的select语句的结果。
参数读取
这块没什么好说的,连接的参数直接从命令行读取,用flag包就好:
var (
host = flag.string("host", "localhost", "clickhouse host")
port = flag.int("port", 8123, "clickhouse port")
user = flag.string("user", "default", "clichouse user")
pass = flag.string("password", "", "clickhouse password")
db = flag.string("db", "default", "clickhouse database")
query = flag.string("query", "show tables", "query you will run")
mode = flag.string("mode", "driver", "driver or dsn")
)
前面几个参数不用解释,主要是query和mode,query是要运行的sql语句,我们默认就认为跑的是select语句,然后是mode,允许选择模式,用户可以使用driver或者dsn两种模式进行连接,我写了两个不同的方法,其实也可以在一个connect方法里做判断,看个人习惯;
建立连接
接下来我们建立数据库连接:
//
func (c *clickhouse) conn() {
c.connection = clickhouse.opendb(&clickhouse.options{
addr: []string{fmt.sprintf("%s:%d", c.host, c.port)},
auth: clickhouse.auth{
database: c.db,
username: c.user,
password: c.password,
},
settings: clickhouse.settings{
"max_execution_time": 60,
},
dialtimeout: 5 * time.second,
compression: &clickhouse.compression{
method: clickhouse.compressionbrotli,
level: 5,
},
// 必须添加协议方式
protocol: clickhouse.http,
})
}
func (c *clickhouse) conndsn() {
conn, err := sql.open("clickhouse", fmt.sprintf("http://%s:%d/%s?username=%s&password=%s", c.host, c.port, c.db, c.user, c.password))
if err != nil {
log.printf("connect to the server failed, %s.\n", err.error())
return
}
c.connection = conn
}
参考官网的实例,实现两种连接方式,关闭方法就直接把sql.db和sql.rows都关闭就可以了:
func (c *clickhouse) close() {
c.connection.close()
c.rows.close()
}
发起查询
查询使用query方法进行:
func (c *clickhouse) select(query string) {
rows, err := c.connection.query(query)
if err != nil {
log.printf("query select failed, %s.\n", err.error())
return
}
c.rows = rows
}
查询的结果我保存到rows里,方便后面的解析
结果解析
比较麻烦的就是结果的解析了,用过database/sql库的哥们都知道,这个库只提供了基础的一些接口,查询出来一般用scan去获取数据,用法类似这样:

问题就在于,scan要指定和sql查询出来一样多的变量,对于我们这个小工具来说,sql是不一定的,所以查询出来的字段数量肯定yes不定的,如何动态处理这个问题,肯定是不能直接写一个结构体解决的,先看我的代码:
func (c *clickhouse) show() {
cols, err := c.rows.columns()
if err != nil {
log.printf("failed to get table columns, %s.\n", err.error())
return
}
// 一行数据,使用any是为了避开数据类型的问题
var rows = make([]any, len(cols))
// 存实际的值,是byte数组,长度以列的数量为准
var values = make([][]byte, len(cols))
for i := 0; i < len(cols); i++ {
rows[i] = &values[i]
}
// 打印表头
fmt.println(strings.join(cols, ","))
for c.rows.next() {
if err = c.rows.scan(rows...); err != nil {
fmt.println(err)
return
}
var vstring []string
for _, v := range values {
vstring = append(vstring, string(v))
}
// 逐行打印出来
fmt.println(strings.join(vstring, ","))
}
}
大概思路是这样:
- scan需要传入每个用来绑定单行数据值的变量,所以values是实际存储数据的byte数组,然后把数组的每个元素的地址再存入到rows数组中;
- 现在可以用rows[index]这样的方式来访问values中的值了,把rows直接作为入参传入到scan,在每次循环中,把values的值转成逗号分割的字符串,直接打印
结果验证
ok,现在逻辑完成了,我们运行测试一下,
go run main.go -host hostname -password paswword -query "select * from clusters" -db system -mode dsn

只查询2个字段,2行数据:

结语
完成,然后把工具放到生产环境一测试,查询都正常,这下开发哥们要继续查他的程序问题了
以上为个人经验,希望能给大家一个参考,也希望大家多多支持代码网。
发表评论