平均意见评分（MOS）：语音质量的衡量标准

by Nadeem Unuth

在语音和视频通信中，质量通常决定了这种体验是好还是坏。除了我们听到的定性描述之外，还有一种表达语音和视频质量的数字方法，比如'相当好'或'非常差'。它被称为平均意见评分（MOS）。 MOS给出了在传输之后接收的媒体的感知质量的数字指示，并最终使用编解码器进行压缩。

MOS表示一个数字，从1到5,1是最差的，5是最好的。 MOS是相当主观的，因为它是基于人们在测试过程中被人们察觉到的数字而形成的。但是，有一些软件应用程序可以在网络上测量MOS，如下所示。

平均意见分数值

以整数计算，这些数字很容易评分。

5 - 完美。像面对面的对话或无线电接收。
4 - 一般。缺陷可以被感知，但声音仍然清晰。这（据说）是手机的范围。
3 - 讨厌。
2 - 非常讨厌。几乎不可能沟通。
1 - 不可能沟通

这些值不需要是整数。某些阈值和限值通常以该MOS频谱的十进制值表示。例如，4.0到4.5的值被称为长话质量并且导致完全满意。这是PSTN的正常价值，许多VoIP服务都以此为目标，往往取得成功。低于3.5的值被许多用户认为是不可接受的。

MOS测试如何进行？

有一定数量的人坐下来听音乐。他们每个人都给出了从1到5之间的评分。然后计算算术平均值（平均值），给出平均意见评分。在进行MOS测试时，ITU-T建议使用某些短语。他们是：

你将必须非常安静。
没有什么可以看到的。
他们崇拜木偶像。
我想跟督察一分钟。
他需要钱吗？

影响平均意见评分的因素

MOS可以简单地用于比较VoIP服务和提供商。但更重要的是，它们被用于评估编解码器的工作，它压缩音频和视频以节省带宽利用率，但质量下降一定程度。然后在特定环境下为编解码器进行MOS测试。

然而，如文章中提到的那样，影响音频和视频传输质量的某些其他因素。这些因素不应被计入MOS值，所以当确定MOS用于某个编解码器，服务或网络时，重要的是所有其他因素对于高质量都是有利的，因为假定MOS值在理想条件下获得。

软件自动平均意见评分测试

由于手动/人体MOS测试在很多方面都相当主观且效率不高，因此现在有许多软件工具可以在VoIP部署中执行自动MOS测试。虽然他们缺乏人情味，但这些测试的好处在于他们考虑了所有可能影响语音质量的网络依赖条件。一些例子是AppareNet Voice，Brix VoIP测量套件，NetAlly，PsyVoIP和VQmon / EP。

平均意见分数值

MOS测试如何进行？

影响平均意见评分的因素

软件自动平均意见评分测试

Alike posts

See Newest

Sapid posts