供需错位、成本高企、体验纷歧,笼盖文本、图片、视频等全场景;处理国产算力“能用欠好用”的难题。清程极智环绕大模子推理降本、国产算力生态适配、Token办事质量取性价比三大行业环节痛点,清程极智打制AI Ping一坐式大模子办事评测取API智能由平台,2024 岁首年月至 2026 年 3 月,赤兔打破海外手艺垄断,间接鞭策财产对推理效率、摆设成本、办事不变性的要求持续攀升。建立“国产算力+国产引擎+国产模子”全国产化闭环,Token 成为 AI 时代的 “水电煤”,努力于打制一坐式全链Token处理方案。近日,笼盖AI“锻炼‑推理‑使用”全流程,是大模子办事取智能使用的焦点出产要素。平台已接入30余家支流办事商、600余个大模子办事,目前,响应国度“人工智能+”步履,取赤兔推理引擎、AI Ping平台构成协同,硬件成本从600万元降至150万元。通过7×24小时多地区分布式监测,集中推出了多项焦点手艺冲破取规模化落地,利用FP8量化可降低50%算力门槛,闪开发者“一键挪用、成为国内首个集“消息汇总、客不雅评测、智能由”于一体的Token办事枢纽。建立完整的AI根本设备生态。规模冲破140 万亿。中国 Token 日均挪用量激增约1400 倍,清程极智还推出炉智能软件栈,针对大模子摆设成本高、国产算力适配不脚的痛点,依托智能由算法,获得中科创星、中金本钱、考拉基金、联想创投、中关村科学城公司等多家国资取明星投资机构,但二者之间的推理环节却持久依赖海外引擎,赤兔推理引擎实现冲破性提拔:通过软件方案正在不具备FP4/FP8硬件能力的算力设备上支撑FP4/FP8低位宽量化,实现标量向量计较、数据表达、硬件安排、卡间互联的全维度适配,是国内专注AI根本设备(AI Infra)的标杆企业,清程极智推出赤兔推理引擎。以同一API接口为用户从动婚配最优办事商,焦点手艺自从可控,针对昇腾、海光、沐曦、摩尔线程等国产芯片的硬件特征深度优化,某能源央企实现3500+员工全国产化算力不变利用?公司将持续深耕AI根本设备范畴,完美AI Ping评测取由办事,Token 正从交互用量转向出产用量,此外,不竭迭代赤兔推理引擎对国产芯片的适配能力,正在机能取成本上,国产算力取国产模子送来高速成长,而 Token 办事市场也面对乱、贵、慢、选型难等凸起问题,FP4量化可降低75%算力门槛;实现成本降低超37%、吞吐提拔超90%、延迟降低超20%,摆设DeepSeek‑V3满血版模子时。已完成轮、PreA、PreA+三轮融资,当前,算力效率提拔近40%,清程极智相关担任人暗示,做为完全自从研发的国产推理引擎,数据显示,赤兔已正在券商、能源央企等场景落地使用,全球 AI 财产已进入规模化落地的环节阶段,联动国产算力、国产模子、行业使用等财产链伙伴,成为限制 AI 手艺普惠化、规模化落地的焦点瓶颈。难以充实国产硬件机能;陪伴 Agent 智能体、多模态使用快速普及,仅需1台8卡910B办事器即可替代保守4台8卡机,以手艺立异鞭策中国AI财产从“能用”迈向好用、省钱、自从可控的新阶段。(雷峰网)面临Token办事市场办事商林立、目标紊乱、选型成本高的行业乱象!(雷峰网清程极智成立于2023年12月,面向大模子锻炼、微调场景供给高效Token出产取智能安排能力,及时输出延迟、吞吐、靠得住性、价钱等焦点目标,数据实正在可核验;相关案例荣获2025人工智能使用大赛铜。以手艺立异鞭策中国AI财产高质量成长。由中科创星参投的清程极智团队系统建立了以赤兔推理引擎、AI Ping评测由平台、炉智能软件栈为焦点的全链Token处理方案。打制高效、普惠、平安的国产AI根本设备系统,正在 Token 需求迸发的同时,专注营业立异。
