Skip to content

Performance

winlin edited this page Jan 1, 2014 · 22 revisions

性能测试指南

对比SRS和高性能nginx-rtmp的Performance,SRS为单进程,nginx-rtmp支持多进程,为了对比nginx-rtmp也只开启一个进程。

提供详细的性能测试的过程,可以为其他性能测试做出参数,譬如测试nginx-rtmp的多进程,和srs的forward对比之类。

硬件环境

本次对比所用到的硬件环境,使用虚拟机,客户端和服务器都运行于一台机器,避开网络瓶颈。

  • 硬件: 虚拟机
  • 系统: CentOS 6.0 x86_64 Linux 2.6.32-71.el6.x86_64
  • CPU: 3 Intel(R) Core(TM) i7-3520M CPU @ 2.90GHz
  • 内存: 2007MB

OS设置

超过1024的连接数测试需要打开linux的限制。且必须以root登录和执行。

  • 设置连接数:ulimit -HSn 10240
  • 查看连接数:
[root@dev6 ~]# ulimit -n
10240
  • 注意:启动服务器前必须确保连接数限制打开。

NGINX-RTMP

NGINX-RTMP使用的版本信息,以及编译参数。

  • NGINX: nginx-1.5.7.tar.gz
  • NGINX-RTMP: nginx-rtmp-module-1.0.4.tar.gz
  • 下载页面,包含编译脚本:下载nginx-rtmp
  • 编译参数:
./configure --prefix=`pwd`/../_release \
--add-module=`pwd`/../nginx-rtmp-module-1.0.4 \
--with-http_ssl_module && make && make install
  • 配置nginx:_release/conf/nginx.conf
user  root;
worker_processes  1;
events {
    worker_connections  10240;
}
rtmp{
    server{
        listen 19350;
        application live{
            live on;
        }
    }
}
  • 确保连接数没有限制:
[root@dev6 nginx-rtmp]# ulimit -n
10240
  • 启动命令:./_release/sbin/nginx
  • 确保nginx启动成功:
[root@dev6 nginx-rtmp]# netstat -anp|grep 19350
tcp        0      0 0.0.0.0:19350               0.0.0.0:*                   LISTEN      6486/nginx

SRS

SRS接受RTMP流,并转发给nginx-rtmp做为对比。

SRS的版本和编译参数。

  • SRS: SRS 0.9
  • 编译参数:./configure && make
  • 配置SRS:conf/srs.conf
listen              1935;
max_connections     10240;
vhost __defaultVhost__ {
    gop_cache       on;
    forward         127.0.0.1:19350;
}
  • 确保连接数没有限制:
[root@dev6 trunk]# ulimit -n
10240
  • 启动命令:nohup ./objs/srs -c conf/srs.conf >/dev/null 2>&1 &
  • 确保srs启动成功:
[root@dev6 trunk]# netstat -anp|grep "1935 "
tcp        0      0 0.0.0.0:1935                0.0.0.0:*                   LISTEN      6583/srs

推流和观看

使用ffmpeg推送SRS的实例流到SRS,SRS转发给nginx-rtmp,可以通过vlc/srs-players观看。

推送RTMP流到服务器和观看。

  • 启动FFMPEG循环推流:
for((;;)); do \
    ./objs/ffmpeg/bin/ffmpeg \
        -re -i doc/source.200kbps.768x320.flv \
        -acodec copy -vcodec copy \
        -f flv -y rtmp://127.0.0.1:1935/live/livestream; \
    sleep 1; 
done
  • 查看服务器的地址:192.168.2.101
[root@dev6 nginx-rtmp]# ifconfig eth0
eth0      Link encap:Ethernet  HWaddr 08:00:27:8A:EC:94  
          inet addr:192.168.2.101  Bcast:192.168.2.255  Mask:255.255.255.0
  • SRS的流地址:rtmp://192.168.2.101:1935/live/livestream
  • 通过srs-players播放SRS流:播放SRS的流
  • nginx-rtmp的流地址:rtmp://192.168.2.101:19350/live/livestream
  • 通过srs-players播放nginx-rtmp流:播放nginx-rtmp的流

客户端

使用linux工具模拟RTMP客户端访问,参考:st-load

st_rtmp_load为RTMP流负载测试工具,单个进程可以模拟1000至3000个客户端。为了避免过高负载,一个进程模拟800个客户端。

  • 编译:./configure && make
  • 启动参数:./objs/st_rtmp_load -c 800 -r <rtmp_url>

开始负载测试前

测试前,记录SRS和nginx-rtmp的各项资源使用指标,用作对比。

  • top命令:
srs_pid=`ps aux|grep srs|grep conf|awk '{print $2}'`; \
nginx_pid=`ps aux|grep nginx|grep worker|awk '{print $2}'`; \
load_pids=`ps aux|grep objs|grep st_rtmp_load|awk '{ORS=",";print $2}'`; \
top -p $load_pids$srs_pid,$nginx_pid
  • 查看连接数命令:
srs_connections=`netstat -anp|grep srs|grep ESTABLISHED|wc -l`; \
nginx_connections=`netstat -anp|grep nginx|grep ESTABLISHED|wc -l`; \
echo "srs_connections: $srs_connections"; \
echo "nginx_connections: $nginx_connections";
  • 查看服务器消耗带宽,其中,单位是bytes,需要乘以8换算成网络用的bits,设置dstat为30秒钟统计一次,数据更准:
[root@dev6 nginx-rtmp]# dstat -N lo 30
----total-cpu-usage---- -dsk/total- -net/lo- ---paging-- ---system--
usr sys idl wai hiq siq| read  writ| recv  send|  in   out | int   csw 
  0   0  96   0   0   3|   0     0 |1860B   58k|   0     0 |2996   465 
  0   1  96   0   0   3|   0     0 |1800B   56k|   0     0 |2989   463 
  0   0  97   0   0   2|   0     0 |1500B   46k|   0     0 |2979   461 
  • 数据见下表:
Server CPU占用率 内存 连接数 期望带宽 实际带宽 st-load 客户端延迟
SRS 1.0% 3MB 3 不适用 不适用 不适用 0.8秒
nginx-rtmp 0.7% 8MB 2 不适用 不适用 不适用 0.8秒

期望带宽:譬如测试码率为200kbps时,若模拟1000个并发,应该是1000*200kbps=200Mbps带宽。

实际带宽:指服务器实际的吞吐率,服务器性能下降时(譬如性能瓶颈),可能达不到期望的带宽,会导致客户端拿不到足够的数据,也就是卡顿的现象。

客户端延迟:粗略计算即为客户端的缓冲区长度,假设服务器端的缓冲区可以忽略不计。一般RTMP直播播放器的缓冲区设置为0.8秒,由于网络原因,或者服务器性能问题,数据未能及时发送到客户端,就会造成客户端卡(缓冲区空),网络好时将队列中的数据全部给客户端(缓冲区变大)。

st-load:指模拟500客户端的st-load的平均CPU。一般模拟1000个客户端没有问题,若模拟1000个,则CPU简单除以2。

其中,“不适用”是指还未开始测试带宽,所以未记录数据。

其中,srs的三个连接是:

  • FFMPEG推流连接。
  • Forward给nginx RTMP流的一个连接。
  • 观看连接:播放地址

其中,nginx-rtmp的两个连接是:

  • SRS forward RTMP的一个连接。
  • 观看连接:播放地址

测试SRS服务器

开始启动st-load模拟客户端并发测试SRS的性能。

  • 启动500客户端:
./objs/st_rtmp_load -c 500 -r rtmp://127.0.0.1:1935/live/livestream >/dev/null &
  • 客户端开始播放30秒以上,并记录数据:
Server CPU占用率 内存 连接数 期望带宽 实际带宽 st-load 客户端延迟
SRS 9.0% 8MB 503 100Mbps 112Mbps 12.6% 0.8秒
* 再启动一个模拟500个连接的st-load,共1000个连接。 * 客户端开始播放30秒以上,并记录数据:
Server CPU占用率 内存 连接数 期望带宽 实际带宽 st-load 客户端延迟
SRS 23.6% 13MB 1003 200Mbps 239Mbps 16.6% 0.8秒
* 再启动一个模拟500个连接的st-load,共1500个连接。 * 客户端开始播放30秒以上,并记录数据:
Server CPU占用率 内存 连接数 期望带宽 实际带宽 st-load 客户端延迟
SRS 38.6% 20MB 1503 300Mbps 360Mbps 17% 0.8秒
* 再启动一个模拟500个连接的st-load,共2000个连接。 * 客户端开始播放30秒以上,并记录数据:
Server CPU占用率 内存 连接数 期望带宽 实际带宽 st-load 客户端延迟
SRS 65.2% 34MB 2003 400Mbps 480Mbps 22% 0.8秒
* 再启动一个模拟500个连接的st-load,共2500个连接。 * 客户端开始播放30秒以上,并记录数据:
Server CPU占用率 内存 连接数 期望带宽 实际带宽 st-load 客户端延迟
SRS 72.9% 38MB 2503 500Mbps 613Mbps 24% 0.8秒

由于虚拟机能力的限制,只能测试到2500并发。

测试nginx-rtmp服务器

开始启动st-load模拟客户端并发测试SRS的性能。

  • 启动500客户端:
./objs/st_rtmp_load -c 500 -r rtmp://127.0.0.1:19350/live/livestream >/dev/null &
  • 客户端开始播放30秒以上,并记录数据:
Server CPU占用率 内存 连接数 期望带宽 实际带宽 st-load 客户端延迟
nginx-rtmp 8.3% 13MB 502 100Mbps 120Mbps 16.3% 0.8秒
* 再启动一个模拟500个连接的st-load,共1000个连接。 * 客户端开始播放30秒以上,并记录数据:
Server CPU占用率 内存 连接数 期望带宽 实际带宽 st-load 客户端延迟
nginx-rtmp 27.3% 19MB 1002 200Mbps 240Mbps 30% 0.8秒
* 再启动一个模拟500个连接的st-load,共1500个连接。 * 客户端开始播放30秒以上,并记录数据:
Server CPU占用率 内存 连接数 期望带宽 实际带宽 st-load 客户端延迟
nginx-rtmp 42.3% 25MB 1502 300Mbps 400Mbps 31% 0.8秒
* 再启动一个模拟500个连接的st-load,共2000个连接。 * 客户端开始播放30秒以上,并记录数据:
Server CPU占用率 内存 连接数 期望带宽 实际带宽 st-load 客户端延迟
nginx-rtmp 48.9% 31MB 2002 400Mbps 520Mbps 33% 0.8秒
* 再启动一个模拟500个连接的st-load,共2500个连接。 * 客户端开始播放30秒以上,并记录数据:
Server CPU占用率 内存 连接数 期望带宽 实际带宽 st-load 客户端延迟
nginx-rtmp 74.2% 37MB 2502 500Mbps 580Mbps 35% 0.8秒

由于虚拟机能力的限制,只能测试到2500并发。

性能对比

SRS和nginx-rtmp的数据对比如下:

Server CPU占用率 内存 连接数 期望带宽 实际带宽 st-load 客户端延迟
nginx-rtmp 8.3% 13MB 502 100Mbps 120Mbps 16.3% 0.8秒
SRS 9.0% 8MB 503 100Mbps 112Mbps 12.6% 0.8秒
nginx-rtmp 27.3% 19MB 1002 200Mbps 240Mbps 30% 0.8秒
SRS 23.6% 13MB 1003 200Mbps 239Mbps 16.6% 0.8秒
nginx-rtmp 42.3% 25MB 1502 300Mbps 400Mbps 31% 0.8秒
SRS 38.6% 20MB 1503 300Mbps 360Mbps 17% 0.8秒
nginx-rtmp 48.9% 31MB 2002 400Mbps 520Mbps 33% 0.8秒
SRS 65.2% 34MB 2003 400Mbps 480Mbps 22% 0.8秒
nginx-rtmp 74.2% 37MB 2502 500Mbps 580Mbps 35% 0.8秒
SRS 72.9% 38MB 2503 500Mbps 613Mbps 24% 0.8秒

Welcome to SRS wiki!

SRS 5.0 wiki

Please select your language:

SRS 4.0 wiki

Please select your language:

SRS 3.0 wiki

Please select your language:

SRS 2.0 wiki

Please select your language:

SRS 1.0 wiki

Please select your language:

Clone this wiki locally