Home

Awesome

Benchmark

新测试项目 rpcxio/rpcx-benchmark, 提供了限流和共享rpc client的方式的测试场景。

测试环境

测试代码client是通过protobuf编解码和server通讯的。 请求发送给server, server解码、更新两个字段、编码再发送给client,所以整个测试会包含客户端的编解码和服务器端的编解码。 消息的内容大约为581 byte, 在传输的过程中会增加少许的头信息,所以完整的消息大小在600字节左右。

测试用的proto文件如下:

syntax = "proto2";

package main;

option optimize_for = SPEED;


message BenchmarkMessage {
  required string field1 = 1;
  optional string field9 = 9;
  optional string field18 = 18;
  optional bool field80 = 80 [default=false];
  optional bool field81 = 81 [default=true];
  required int32 field2 = 2;
  required int32 field3 = 3;
  optional int32 field280 = 280;
  optional int32 field6 = 6 [default=0];
  optional int64 field22 = 22;
  optional string field4 = 4;
  repeated fixed64 field5 = 5;
  optional bool field59 = 59 [default=false];
  optional string field7 = 7;
  optional int32 field16 = 16;
  optional int32 field130 = 130 [default=0];
  optional bool field12 = 12 [default=true];
  optional bool field17 = 17 [default=true];
  optional bool field13 = 13 [default=true];
  optional bool field14 = 14 [default=true];
  optional int32 field104 = 104 [default=0];
  optional int32 field100 = 100 [default=0];
  optional int32 field101 = 101 [default=0];
  optional string field102 = 102;
  optional string field103 = 103;
  optional int32 field29 = 29 [default=0];
  optional bool field30 = 30 [default=false];
  optional int32 field60 = 60 [default=-1];
  optional int32 field271 = 271 [default=-1];
  optional int32 field272 = 272 [default=-1];
  optional int32 field150 = 150;
  optional int32 field23 = 23 [default=0];
  optional bool field24 = 24 [default=false];
  optional int32 field25 = 25 [default=0];
  optional bool field78 = 78;
  optional int32 field67 = 67 [default=0];
  optional int32 field68 = 68;
  optional int32 field128 = 128 [default=0];
  optional string field129 = 129 [default="xxxxxxxxxxxxxxxxxxxxx"];
  optional int32 field131 = 131 [default=0];
}

测试的并发client是 100, 1000,2000 and 5000。总请求数一百万。

测试结果

一个服务器和一个客户端,在同一台机器上

并发client平均值(ms)中位数(ms)最大值(ms)最小值(ms)吞吐率(TPS)
10000170164338
50021400181126
100043560186219
2000971050182815
500025222000178858

可以看出平均值和中位数值相差不大,说明没有太多的离谱的延迟。

随着并发数的增大,服务器延迟也越长,这是正常的。

客户端在一台机器上,服务器在另外一台机器上

如果我们把客户端和服务器端的程序放在两台独立机器上,这两台机器的配置和上面的测试相同。测试结果如下:

并发client平均值(ms)中位数(ms)最大值(ms)最小值(ms)吞吐率(TPS)
10011200127975
5005143500136407
100010232330155255
200017297350159438
5000442127880161917

因为与实际的网络传输,所以吞吐量没有上面的使用loopback的结果好,但是吞吐量已经不错了,接近每秒10万个事务处理。

客户端在一台机器上,两个服务器在另外两台机器上

如果部署成集群的模式,一个客户端,两个服务器端,测试结果如下:

并发client平均值(ms)中位数(ms)最大值(ms)最小值(ms)吞吐率(TPS)
10000410128932
500322730150285
1000556210150152
20001072880159974
500023126290155279

以下的代码是测试rpcx使用的序列化框架的性能。

[root@localhost rpcx]# go test -bench . -test.benchmem
PASS
BenchmarkNetRPC_gob-16            100000             18742 ns/op             321 B/op          9 allocs/op
BenchmarkNetRPC_jsonrpc-16        100000             21360 ns/op            1170 B/op         31 allocs/op
BenchmarkNetRPC_msgp-16           100000             18617 ns/op             776 B/op         35 allocs/op
BenchmarkRPCX_gob-16              100000             18718 ns/op             320 B/op          9 allocs/op
BenchmarkRPCX_json-16             100000             21238 ns/op            1170 B/op         31 allocs/op
BenchmarkRPCX_msgp-16             100000             18635 ns/op             776 B/op         35 allocs/op
BenchmarkRPCX_gencodec-16         100000             18454 ns/op            4485 B/op         17 allocs/op
BenchmarkRPCX_protobuf-16         100000             17234 ns/op             733 B/op         13 allocs/op

和gRPC比较

gRPC 是Google开发的一个RPC框架,支持多种编程语言。

我对gRPC和rpcx进行了相同的测试,得到了相应的测试结果。结果显示rpcx的性能要远远好于gRPC。 gRPC的优势之一就是随着并发数的增大,吞吐率比较稳定,而rpcx随着并发数的增加性能有所下降,但总体吞吐率还是要高于gRPC的。

rpcx的测试结果如上,下面是gRPC的测试结果。

一个服务器和一个客户端,在同一台机器上

并发client平均值(ms)中位数(ms)最大值(ms)最小值(ms)吞吐率(TPS)
1000020055561
5007659062593
10001412103065329
20002824163067033
50007164380063803

客户端在一台机器上,服务器在另外一台机器上

并发client平均值(ms)中位数(ms)最大值(ms)最小值(ms)吞吐率(TPS)
1001021068250
500513059078486
10001016274079980
20001919736058129
500043214224044724

客户端在一台机器上,两个服务器在另外两台机器上

并发client平均值(ms)中位数(ms)最大值(ms)最小值(ms)吞吐率(TPS)
1001019088082
500411461090334
1000916315062305
20001719736044487
500038125087033198

!! Latest Benchmark !!

updated: 2019-03-02

TPS:吞吐率 mean: 单个请求平均耗时 max: 单个请求的最大耗时 min: 单个请求的最小耗时 p99: 99%的请求单个耗时

并发数 256

tarsgo client启动命令: CONC=256 TOTAL=1000000 ./mclient --config=benchmark.conf

TPSmeanmaxminp99
tarsgo429855ms600ms0ms36ms
rpcx1221662ms31ms0ms18ms
grpc1306421ms16ms0ms9ms

并发数 512

tarsgo client启动命令: CONC=512 TOTAL=1000000 ./mclient --config=benchmark.conf

TPSmeanmaxminp99
tarsgo3948512ms591ms0ms507ms
rpcx1421773ms63ms0ms28ms
grpc1230994ms46ms0ms16ms

并发数 1024

tarsgo client启动命令: CONC=1024 TOTAL=1000000 ./mclient --config=benchmark.conf

TPSmeanmaxminp99
tarsgo4094424ms809m0ms612ms
rpcx1344396ms79ms0ms49ms
grpc1156078ms115ms0ms33ms