
NVIDIA的H100加速卡在AI爆炸后很受欢迎,超过25万元的价格仍然供不应求。它的性能也非常夸张。在最新的人工智能测试中,基于GPT-3的大语言模型训练任务记录已经刷新到11分钟。
MLCommons在机器学习和人工智能领域开放产业联盟发布了最新的MLPerf基准评估,包括8项负载测试。基于GPT-3开源模型的LLM语言模型测试了平台的人工智能性能。
NVIDIA平台参与测试从896个Intel到8462Y 处理器由3584个H100加速卡组成,是所有平台中唯一完成所有测试并刷新记录的平台。
H100平台在基于GPT-3的关键大语言模型训练任务中只需要10.94分钟,可以比较Intel平台,从96到8380处理器和96个Habana Gaudi2 在人工智能芯片构建的系统中,同样的测试时间为311.94分钟。
H100平台的性能几乎是Intel平台的30倍。当然,这两个平台的规模差异很大,但只有768张H100加速卡,训练时间只有45.6分钟,仍远远超过Intel平台的人工智能芯片。