封面新闻记者 孟梅 易弋力
三级片9月25日,在2024百度云智大会上,百度智能云晓示将百舸AI异构计算平台全面升级至4.0版块。升级后的百舸,围绕落地大模子全旅程的算力需求,在集群创建、修复践诺、模子检修、模子推理四大方面,为企业提供“多、快、稳、省”的AI基础次第。
为了处分算力资源穷乏的问题,百舸4.0对“多芯混训”时候进行了重心升级,已毕了在万卡限制集群上95%的多芯羼杂检修遵循,达到业务最起先水平。
在集群部署时候,升级后的百舸八成已毕用具层面的秒级部署,将万卡集群启动准备时候从数周最快缩减至1小时,极地面擢升部署成果,镌汰业务上线周期。
针对大模子检修经由中故障频发的问题,百舸4.0全面升级了故障检测技巧和自动容错机制,不错有用贬低故障发生频次,大幅减少集群故障处置时候,在万卡集群上已毕了跳跃99.5%的有用检修时长。
在模子推理上,最热切的是速率和资本。当今长文本推理徐徐成为主流,百舸4.0合座上作念了推理速率和资本优化探花 黑丝,长文本推理成果擢升了1倍以上。