M

MaaStatus

MaaS Benchmark

加载中...

概览

指标排行

地区时延

RTT 通过 GET /models 测量,反映请求位置到厂商接入点的网络延迟,与模型无关。

相对时延排行

以最快线路为基准

时延明细

厂商请求位置RTT

基础性能

1K 输入,streaming,关闭推理

厂商-模型请求发起区域TTFT ↕TPOT ↕TPS ↕
指标说明 RTT网络往返延迟,通过 GET /models 测量。反映请求位置到厂商接入点的网络质量,数值越低越好。 TTFTTime To First Token,从请求发出到收到首个输出内容的时间。反映用户等待模型开始回答的体验,数值越低越好。 TPOTTime Per Output Token,每个输出 token 的平均生成耗时。数值越低说明输出越快。 TPSTokens Per Second,每秒输出 token 数。反映模型的输出吞吐能力,数值越高越好。