首页> 招标查询> 招标详情
AI训练服务器(HITBX-2025000067)采购公告
信息来源: ******[查看]
|地区:黑龙江
|类型:采购公告
基本信息
信息类型:采购公告
区域:黑龙江
源发布时间:2025-08-21
项目名称:******[查看]
项目编号:******[查看]
招标单位:******[查看]
*符合收录标准*
正文附件下载

项目名称:   AI训练服务器   项目编号:   HITBX-******67

公告开始日期:   2025-08-21 09:11:24   公告截止日期:   2025-08-26 10:00:00

采购单位:******大学   付款方式:   款到付货

签约时间要求:   成交后3个工作日内到货时间要求:   签约后7个工作日内

预算总价:   ¥498600.00

收货地址:   科创大厦K1301

采购清单

采购商品:   AI训练服务器   采购数量:   1   计量单位:   台   所属分类:   服务器

预算单价:   ¥498600.00

技术参数及配置要求:   采用Intel CPU,配置两颗Intel Xeon Sapphire Rapids8558处理器,主频≥2.1GHz,单处理器最高拥有48个内核及96线程,L3 Cache≥260MB配置16根64GB ECC DDR5 5600MT/s RDIMM内存,内存槽位最大支持32个配置2块960GB SSD硬盘;支持 2*M.2 SATA或NVME SSD,尺寸2280/22110;支持硬RAID1,支持热插拔配置2块7.68TB NVMeSSD硬盘,9块16TB SATA硬盘;硬盘扩展能力: 最多可配置12个3.5英寸SAS/SATA硬盘本次配置不少于8块异构计算加速卡,单卡显存≥48GB,支持FP16/BF16/INT8运算,FP32峰值性能59.8 TFLOPS,CUDA核心:11776个,RT Core:92个光线追踪核心RAID/12Gb/s/3108/SAS/8643/RAID 0,1,5,6,10,50,60,JBODRAID级别/1G1个4*GE网卡,2个10GE网卡(含光模块)前置2 个USB3.0 接口,前置1 个UID 指示灯/按钮 ,前置1 个OCP 网卡以太网接口指示灯 ,前置1 个Health 指示灯 ,前置1 个开机/待机按钮和系统电源指示灯 前置1 个VGA 接口(选配) ,前置1 个RJ45 BMC 专用管理接口(选配) ,前置1 个Type-C 专用管理接口(选配) 后置1 个VGA 接口 ,后置1 个RJ45 BMC 专用管理接口 ,后置1 个Type-C 专用管理接口 ,后置2 个USB3.0 接口 ,后置1 个UID 指示灯/按钮 内置 1 个USB2.0 接口可选配OCP3.0 网卡,支持1 个OCP3.0 网卡集成BMC管理芯片AST2600,支持IPMI2.0、Redfish、SOL、KVM、虚拟媒介等功能配置4个2600W白金电源,支持N+N冗余支持6个热插拔对旋风扇,支持N+1冗余常用服务器操作系统计算平台软件技术参数:平台总体要求:提供拥有软件著作权的商业版本管理软件,不接受开源产品。提供本次项目所有节点授权,以及原有节点授权,兼容原有计算管理平台,提供厂商授权承诺函在国内设有研发机构,能根据用户的需求或使用习惯进行定制化开发。提供产品应用于大规模CPU集群(单一系统节点数>150台)和GPU集群(单一系统内GPU数量>400块)生产环境的成功案例及用户证明。所有管理软件必须基于B/S架构。支持通过主流WEB浏览器管理和使用平台资源。平台架构和系统支持:同时支持两类资源虚拟化技术,包括虚拟机虚拟化和容器虚拟化技术。支持各种常见的操作系统发行版(Windows各版本、Linux各版本)并提供部署模板。支持x86、ARM等架构服务器,支持多种国产CPU如海光、鲲鹏等,支持NVIDIA GPU、FPGA、Acsend NPU, DCU, MLU 等多种计算加速设备,支持异构服务器混合部署,支持Infiniband和ROCE RDMA网络,支持至少3个硬件厂家存储设备,以上硬件资源均有项目案例。平台系统管理要求:通过界面统一管理平台用户,支持与外部LDAP服务器或Windows AD域控集成,支持与现有统一身份认证系统对接。在使用平台的上的容器环境、HPC集群环境、Hadoop集群环境和AI训练集群环境时,环境登录用户自动对接到统一身份认证,一套用户全环境使用。提供不少于三种角色,包括系统管理员、群组管理员和普通用户;支持群组管理员和普通用户创建群组并邀请其他用户加入(提供截图证明材料)。支持对用户的资源使用量进行限额,便于管理员合理分配集群资源,可以修改每个用户或用户组的最大可用CPU核数、GPU个数、内存使用量、存储空间、实例数等(提供截图证明材料)。支持管理员对应用运行时所需环境的配置修改,参数包含所属资源池、CPU、内存、GPU、块存储等信息(提供截图证明材料)。支持设置用户虚拟机实例、容器实例的使用周期,到期自动回收资源并提前自动通知用户。支持到期前手动延长使用周期。支持应用的可见性权限设置,配置用户能访问的应用。支持不同的资源池配置不同的应用策略,应用策略包括实例关闭资源自动释放和实例关闭资源不释放等。支持回收站功能。实例释放后自动进入回收站中,可通过回收站对实例进行恢复或彻底删除。平台支持通过WEB页面对GUI类应用进行访问和操作,支持远程桌面交互、字符界面交互、网页界面在线交互式编程等模式。平台数据管理要求:平台提供数据集统一管理的功能,数据绑定用户,不与节点绑定。提供同一用户的不同计算实例之间的数据共享功能,提供不同计算实例中的程序可以同时对用户数据目录进行读写访问的功能。平台提供用户目录,项目目录,共享群组目录等数据管理的功能,在项目组中,用户可以通过共享目录进行数据共享,也可以在项目组中有自己私有的数据目录。(提供截图证明材料)平台提供通过浏览器上传计算配置文件和下载计算结果以及断点续传等功能,支持用户本地挂载平台数据目录,实现用户本地、平台和实例环境的数据同步,支持用户本地是Windows操作的数据挂载。(提供截图证明材料)台容器场景功能要求:平台支持多套环境资源之间灵活调度,不需要重启物理机器,即可实现HPC集群的资源调度到AI集群中进行使用,支持多套HPC集群共存,如x86 HPC集群,ARM HPC集群等,支持普通用户在平台上创建自己项目组内的私有HPC集群,HPC集群的性能多节点并行Linpack值与物理机的比相差1%以内。(提供证明材料)容器中支持普通用户以虚拟超级用户权限对系统修改,进行系统更新操作或安装软件。支持以透传的方式实现容器对物理GPU的访问,支持单机单卡和单机多卡的单容器环境,支持多机多卡容器化分布式GPU训练集群。支持基于ARM架构的容器场景。支持GPU共享,支持在1块GPU卡上,同时运行多个GPU容器环境,分配GPU可以按照0.1块、0.2块分配。支持通过软件仓库一键创建完整独立的容器环境,包括桌面可视化环境、Slurm集群环境、Torque集群环境、hadoop环境、Jupyter在线web交互环境等。(提供截图证明材料)。平台虚拟化场景功能要求:支持以透传的方式实现虚拟机对物理GPU的访问,并设置每台虚拟机可使用的GPU数,在该环境内,用户有root权限,可自行安装和配置环境。支持基于ARM架构的虚拟化场景。支持通过网页界面生成和恢复虚拟机快照;支持windows系统的远程桌面可视化操作,以及对系统实现硬盘扩容等功能。(提供截图证明材料)支持通过软件仓库一键创建完整独立的虚拟化环境,包括完整的linux操作系统环境、Windows桌面环境等。(提供截图证明材料)平台集群场景功能要求:支持主流的HPC作业调度软件,支持至少2种调度器并存。系统支持同时运行和管理多个容器虚拟集群环境,每个集群可采用独立的调度器,虚拟集群之间互相隔离,不受影响。支持普通用户手动调整自己的容器虚拟集群的规模。支持通过作业模板方式在Web页面提交作业;支持用户创建个人作业模板;支持管理员创建全局作业模板。支持查看每个作业的运行资源使用情况。支持同一用户在不同独立集群中进行任务提交,并可以查看自己提交的任务在不同集群中的状态。支持多数据中心集群资源统一管理,支持直接对接公有云和超算中心资源。平台大数据场景功能要求:支持通过Web可视化的形式管理Hadoop组件,支持在线直接安装、管理和运维Hadoop集群。支持HDFS、Spark、MapReduce、Hive、Pig、Hbase、Zookeepr、Sqoop和Hcatalog等的集中管理。支持Hadoop集群的多角色用户管理,角色包括普通用户、服务运维员、服务管理员、集群运维员、集群管理员等。支持大数据的集群监控,支持监控CPU、内存、节点状态、HDFS状态等信息,并通过可视化的形式展示出来。支持大数据的告警功能,支持WEB、Port、Metric、Aggregate 和 Script等类型,支持自定义报警信息,支持OK 、Warning、Critical、Unknown、None等多种报警状态,支持配置报警的检测时间间隔、类型、以及阈值等。平台资源统计功能要求:平台提供集群运行情况监控功能,包含集群数量、集群应用软件类型、正在运行的用户等,支持统计应用镜像的使用数量。支持分别根据CPU、GPU、内存等资源采用不同的费率标准进行分类计费,支持在系统管理中设置默认权值。(提供截图证明材料)。支持不同的节点、不同的资源池设定不同的费用,可以单独配置每一个硬件资源的费用。(提供截图证明材料)。支持用户充值和透支额度设置,支持项目透支额度设置,支持用户转账自己剩余点数到任意一个自己的项目中,在项目中的其他用户可以使用该项目的点数进行扣费,支持对项目中用户使用点数查看和设定限额。(提供截图证明材料)。支持对个人资源使用和团队资源使用计费;支持对团队中个人使用费用的统计(提供截图证明材料)。支持对从不同维度(CPU资源、GPU资源、用户、应用等)对平台的历史数据进行自定义查询、过滤和可视化展示。知识库和用户论坛功能要求:在平台上提供知识库和用户论坛功能,论坛用户与平台用户对接,无需单独注册即可直接使用。知识库可以发布平台的资源信息、平台功能操作指南和应用软件使用指南等,方便普通用户使用。论坛提供多类型版块,包括公告、入门、系统、存储、网络、监控、调度、应用、数据、性能和开发等,在不同的版块可以发布属于该版块类型的帖子。支持管理员审核用户发帖内容,审核通过后方可正常发布,也同时支持免审核发帖。支持帖子发布者在回复的帖子中选择最佳答案和删除帖子,支持论坛内主题和内容搜索。每个用户都有自己的主页,查看发布的主题,回复的内容,上次的信息等。软件环境要求:应用商店,管理员可一键安装各种HPC和AI应用。GNU C/C++/F77/F90编译器、Java、Intel C/C++/Fortran编译器Intel MKL、BLAS、LAPACK、FFTW等数学库并行编程消息库如Intel MPI、OpenMPI等预置常见的操作系统镜像和常用开源计算应用镜像。支持容器化数据分析工具,支持Python, Anaconda, R等,并支持用户自定义软件包安装。支持容器化大数据处理框架,如Cloudera CDH等。支持容器化GPU多机多卡分布式训练框架,包括Tensorflow,Pytorch等,支持分布式训练框架与作业调度系统集成。在线运维:完成对高性能计算集群远程在线监控、异常告警通知等工作。在线运维服务监控采购方高性能集群服务器、网络等相关资源状态信息,如发现异常信息、故障信息,则将此类信息第一时间通知用户方,并采取相关措施。客户提供的商业软件的安装及调度集成客户所需开源软件的安装、编译及优化应用软件作业模板的定制及优化应用软件的容器模板制作应用软件的虚拟机模板制作平台应用商店内软件的升级和更新系统GPU驱动/CUDA版本的持续更新和升级平台内部组件的持续升级平台新版本功能更新的持续安装平台硬件环境的运维监控系统报警、平台故障的实施处理平台资源使用情况的监控及使用报告调度策略的持续优化和调整用户配额和QOS的持续优化用户微信群进行实时问题解答和使用帮助

售后服务:   电 话 支 持 :7x24 小时;质 保 期 :3年; 服务时限:报修 后 12 小时;商品承诺: 原厂全新未拆封 正品;提供培训方案;

附件下载:附件下载

查看信息来源网站
快照:2025-08-21
收藏
免责声明

【1】凡本网注明来源:"今日招标网"的所有文字、图片和音视频稿件,版权均属于今日招标网,转载请必须注明机今日招标网,违反者本网将追究相关法律责任。

【2】本网转载并注明自其它来源的作品,是本着为读者传递更多信息之目的,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品来源,并自负版权等法律责任。

【3】如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系。

招标文件下载 x
绑定手机号码
10秒快速绑定,找项目快人一步
公司名称:*
姓名:*
关键词:
手机号:*
验证码:* 发送验证码 已发送(60s)
评标专家会员
商机会员
企业大数据会员

切换到支付宝支付

抱歉,您当前会员等级权限不够!

此功能只对更高等级会员开放,立即提升会员等级!享受更多权益及功能

立即提升会员等级