Www.cgw.sdu.edu.cn



采购人要求(用户填写)投标人响应(投标人填写)配置序号配置名称详细技术参数要求数量数量应答技术规格指标技术指标偏离情况备注1服务器集群1、国际知名品牌设备,非OEM产品,具有自主知识产权。2、2路2U机架式服务器,处理器配置不低于2*Intel Xeon E5-2630 V4, 不低于2.2GHz 10核配置内存不低于256GB, 内存类型为ECC DDR4 2400 RDIMM内存,内存插槽数≥16个插槽,最大容量1TB;支持SDDC、双设备数据更正DDDC、内存镜像内存冗余位校验ECC校验,内存热备技术。3.不少于1块1000GB-SATA 6Gb/s-7.2K通用硬盘,不少于1块400GB-SATA固态硬盘,支持热插拔SAS/SATA/SSD硬盘,最大支持≥8块2.5寸硬盘扩展(或最大支持≥4块3.5寸硬盘扩展);配置独立RAID卡,支持RAID 0/1/10/1E,PCI-E I/O插槽总数≥3个,支持PCIe 3.0 x16。4.千兆接口≥2个;支持板载10GE或GE灵活配置5.满配冗余热插拔电源,并提供配套的电源连接线6.满配冗余风扇,支持单风扇失效,风扇支持热插拔7、★支持NetEP板卡,用于支持设备的虚实结合,完成真实的安全硬件、虚拟平台综合数据分析实验,板卡能虚拟出网卡、路由器、交换机等实验设备,可编程交换机、路由器,可重构为SDN全虚拟化功能,通过socket编程对NetEP进行管理(投标现场需提供NetEP板卡展示)。 8、提供服务器机柜:高度:2000mm(42U),宽度:600mm,深度:1000mm,材质:冷轧钢材质。42服务器集群交换机1、交换容量≥590Gbps,包转发率≥190Mpps;2、10/100/1000Base-T以太网端口≥48个,千兆SFP≥4个 ;3、为了提高设备可靠性,支持模块化可插拔双电源;4、支持1个扩展插槽,可扩展支持业务插卡;5、支持64K MAC地址容量,支持4K个VLAN,支持Guest VLAN、Voice VLAN,支持MUX VLAN功能或类似技术,支持STP(IEEE 802.1d),RSTP(IEEE 802.1w)和MSTP(IEEE 802.1s)协议;6、路由表≥16000,支持静态路由、RIP、RIPng、OSPF、OSPFv3、BGP、BGP4+、ISIS、ISISv6,支持基于源IPv6地址、目的IPv6地址、四层端口、协议类型等ACL;7、三层组播组数≥2048,支持VLAN内组播转发和组播多VLAN复制;支持基于端口的组播流量统计;支持IGMP v1/v2/v3、PIM-SM、PIM-DM、PIM-SSM;8、支持防止DOS、ARP攻击功能、ICMP防攻击;支持IP、MAC、端口、VLAN的组合绑定;支持黑洞MAC地址;支持CPU保护功能。9、支持堆叠,主机堆叠数不小于9台;10、支持纵向虚拟化,作为纵向子节点零配置即插即用,纵向虚拟化的子节点交换机支持堆叠;11、支持SNMPv1/v2/v3;支持网管系统、支持WEB网管特性;支持零配置部署;13大数据实验平台-计算管理系统模块1) 服务器管理功能:实现服务器批量部署、安装和管理功能。可任意增加实验。 2) ▲基于Aneka技术的系统底层针对不同编程模型(例如任务、线程、MapReduce)提供可扩展应用编程接口(API),用于不断发展分布式应用并将新的技术整合到云应用中,同时平台还支持不同的云部署方案。(需要现场演示)3)必须提供不同于IaaS 平台上的Aneka系统,成为一个可在多种云平台上进行云应用开发、部署和管理的综合平台。(需要现场演示)4) 系统规模,服务器可通过简单网络连接达到增加实验资源的效果。5) 可选远程管理升级功能,可定位主要部件运行状态,预判断和分析功能。 6) 故障定位:标配前置故障诊断模块,可实现对CPU/内存/硬盘/网卡/风扇/温度/电源等关键部件的故障诊断,带预测功能,可选配向管理节点推送故障信息。7)操作系统:实验环境支持所有linux内核系统,包括不限于SUSE,RedHat,ubuntu,CentOS;支持windowsXP至windows10(包括)系列的所有windows系统;操作系统必须支持Aneka的运行环境。8)计算管理模块系统基于IaaS的云实验环境。实验环境能够对每个独立的实验环境进行内存,硬盘,cpu等硬件资源的管控。内存资源必须有边界限定和灵活的管理方式。9)可以监控整个云计算平台的运行状况,包括可用资源和已用资源、作业的排队状况、正常和异常的作业运行状况,并提供干预功能,及时释放异常占用资源和终止异常作业。10)支持大数据查询及分析功能,如聚集查询、连接查询、选择操作、嵌套查询、Llke查询等功能。11)提供的实验系统必须支持以下大数据环境:Aneka、HDFS、HBase、YARN、Pig、Hive、Mahout、Spark、JDBC、Cloudera Manager。12)计算管理模块系统提供与云计算平台能够对接的软件服务,如Aneka智能资源调度服务、分布式存储服务、统计建模服务(R语言,SPSS,matlab等),主流人工智能平台(如tensorflow在linux和windows的运行环境),同时支持主流软件服务在云平台直接部署。13) 计算管理模块系统为整个系统提供管理,是大数据实验教学和科研平台的核心,支持大数据系列所有云实验系统和环境完整虚拟化功能; 14)实验环境支持访问NetEP开发环境。14大数据实验平台--实验管理系统模块1)管理系统采用B/S结构,支持角色权限自由分配,默认为超级管员。拥有高级权限的用户可以采用C/S的方式访问实验环境,实验环境可以挂起,保存,制作成批量镜像。2)系统包括课程选课开课管理、课程公告管理、实训设置、实训内容管理、pdf课件在线阅读、虚拟机管理、云计算集群管理功能,课程表排课功能。 3)支持实验环境的资源保护,包括实验资源的自动回收,自动重置,实验资源内容保护,环境现场维护,资源保护等。 4)支持教学与科研两种环境,两种环境都可支持全系统,自由网络机群配置。教学环境可支持资源保护。科研环境提供长期稳定,基于IaaS强虚拟化的实验环境。5)管理内容从只可以浏览平台,到系统级全平台管理权限,都可自由选择; 6)系统包括班级管理、实训设置、实训内容管理、实验报告管理、虚拟机管理、云计算集群管理功能。要求可支持不少于600个用户并发在线教学,不少于60个虚拟机同时并发在线实验实训。同一用户可以启动任意节点数的机群。7) 平台必须保证用户数量的自由增加,通过计算资源的增加,理论可无线扩展用户数量。且厂家提供的计算资源可做到即插即用,无需其他配置。8)实验环境提供多种网络访问方式,必须支持以下几种:网络层级上平级于当前外置物理设备,可直接使用公网地址或局域网内规划的网络IP进行访问;构建独立的虚拟局域网,可通过虚拟三层路由与物理网络通信,也可以与外部网络隔绝;每个虚拟主机可做端口映射,逻辑上拥有虚拟子网地址与外部用局域网IP地址。9)支持虚拟机细粒度安全规则设置,规则必须基于物理设备系统层面控制,不能使用虚拟机内部的网络规则。控制粒度虚满足以下内容:控制范围可精确到每个虚拟机;控制内容上应保证支持传输层内容的控制;支持流量方向的选择。10) 平台支持感应设备的接入,支持获取感应设备获取的大数据源。11)要求支持USB穿透,用户可直接通过个人终端设备接入USB介质连接至虚拟机。(需要现场演示)12) ▲要求实验环境的内核有针对平台安全策略的防火墙功能,可为用户提供指定目标IP的内核安全策略定制。(需要现场演示)15大数据实验平台--教师管理系统模块1) 课程内容支持增加标签,且标签具有直接的课程归并作用。2) 课程文档支持html解析,通过接口调用,课程文档可支持动态建模效果和其他通过引用的多样性课程文档形式。3)支持课程模板的创建,课程模板内容至少包括:视频,文档,实验环境,笔记,提问等内容。课程内容支持增加标签,且标签具有直接的课程归并作用。(需要现场演示)4) 要求教学视频内容单个文件大小至少保证可支持5GB(包含),视频播放可控制起始结束位置。5) 要求考试功能自动并入课程成绩,成绩的等级分类可自由调控。6)必须支持多语言的切换,切换模式必须为配置文件控制,不能使用单独网页展现其他语种网页,需要展示语言配置文件。7) 支持多种虚拟机格式,至少支持QCOW2,raw,VMDK格式。8)支持可指定虚拟机模板在计算资源上的缓存销毁时间。(需要现场演示)9) 硬件虚拟化程序,虚拟机超受限制可自由更改。16大数据实验平台--智能调度系统模块1) ★大数据实验系统底层基于全球领先的google采用的Aneka并行云技术(必须提供Aneka技术50人用户商用使用许可证明文件)。2) 自动实现轻量级,图形化易于搭建的云平台,高性能任务分发资源调度系统和大数据处理技术; 3) 平台的应用开发可以实现接口化、模块化、自动化的管理;4) 平台搭建和应用开发编程拥有继承性,简易型。傻瓜式部署,快速上手大大降低了用户应用开发的难度和开销;5)支持可在异构计算平台上部署的可扩展云中间件8)实验部署必须完美结合教学与应用的需求。可支持云概念的具象化学习,必须基于全球领先的Aneka大数据云和并行大数据处理的开发学习,异构的网络部署环境可调用网络中所有的资源,轻松构建可用于真实大数据处理计算任务的实验室9) ▲基于全球领先的Aneka云实时调度技术,可实现实验环境秒级启动,动态分发计算任务,可视化资源状态查询。(需要现场演示)10)大数据教学内容的主要实验不但提供配套的实验环境和实验步骤,此外必须提供对应视频操作和音/视频讲解,多种教学手段同时进行,学生看、听、学、做多角度进行。(需要现场演示)11) 自由可扩展实验环境。可定制符合实际使用场景的实验环境,实验场景节点自由部署(理论节点数值无上限),节点系统环境,硬件配置动态可调整。12) 实验环境默认使用完毕自动收回,智能管理平台资源。对于个性化的定制实验内容即可随堂销毁,也可动态保存,保存状态不占用资源。真正做到从网络到系统完全自由化设计,根据用户需求可构建出HDFS存储资源,大数据计算机群,做到学生实验终端等比物理实验室性能更强的虚拟实验室。13)实验中镜像系统必须丰富全面,支持动态调整、可动态搭建多节点轻量级大数据环境,操作系统至少支持winXP到win10之间所有windows系列;ubuntu12.0以后的全系列、Centos6之后的全系列、kali-anma-wh、BT5-R3-Gnome-gnome等。(需要现场演示)14)要求不少于600个用户并发在线教学,不少于60个虚拟机同时并发在线实验实训。17大数据实验平台—基础课程资源包基础课程资源包包含:计算机系统实验课程,存储实验课程,网络实验课程,编程实验课程; 1、计算机系统实验课程 1)分布式 2)嵌入式系统 3)操作系统调度 4)IO设备及其分类 5)熟悉实验环境 6)操作系统的引导 7)系统调用 8)进程运行轨迹的跟踪与统计 9)基于内核栈切换的进程切换. 2、Linux系统课程 1)Linux安装 2)Linux 忘记密码解决方法 3)Linux 远程登录 4)Linux文件基本属性 5)Linux 文件与目录管理 6)Linux 用户和用户组管理 7)Linux 磁盘管理 8)linux yum 命令 9)VMware的三种网络连接模式 10)VMware的三种网络连接模式 11)开关网卡及查看网络设备信息 3、存储实验课程: 1)计算机系统的硬件结构 2)存储器 3)输入输出设备 4)中央处理器 5)指令系统 6)CPU的结构和功能 7)控制单元的功能 8)控制单元的设计; Access课程、 MySQL课程、SQL Server实验课程、Oracle数据库安全1):查询连接数据库的用户2)查询用户会话正在执行的操作3)查询用户状态和锁定用户4)配置连接数据库的信任IP5)配置账号登录失败锁定策略6)数据文件权限检查和修改7)限制sys用户远程登录8)修改监听器端口9)exp导出备份10)imp导入备份11)imp恢复误删除的表4、网络实验课程:计算机网络基础1)数据通信与物理层2)局域网技术3)广域网技术4)网络层5)传输层6)应用层7)利用模拟器进行网络构建;TCPIP协议分析1)协议分析-arp协议解码详情2)协议分析-dhcp协议解码详情3)协议分析-icmp协议解码详情4)协议分析-ip协议解码详解5)协议分析-tcp协议解码详情6)协议分析-EMAIL电子邮件应用分析7)协议分析-ftp文件传输应用分析;CCNA交换机路由器实验;5、编程实验课程Java基础教程1)Java 类与对象2)Java 封装3)Java 继承4)Java 多态5)Java 基本语法6)Java 控制语句7)Java的数组;Java基础教程1)Java 运算符2)java 字符流3)java 字节流4)java.lang 包5)java.util 包6)字符串与包装类7)文件操作与随机访问文件8)泛型9)Java 集合框架;Java基础教程1)制作 GUI 界面2)Java 版图形界面计算器3)Java 实现记事本4)Java 实现微信红包分配算法;JSP教程1)环境搭建2)page指令3)include指令标签4)JSP内置对象application 5)JSP内置对象Request 6)JSP内置对象Response 7)JSP内置对象8)JSP内置对象session; PHP教程1)在Windows下安装并使用PHPStudy集成程序包2)PHP的数据类型3)PHP的表达式与函数4)PHP的条件控制语句5)PHP的循环控制语句6)PHP字符串操作7)PHP正则表达式8)PHP正则表达式9)PHP数组10)PHP表单基础11)表单综合应用12)获取时间和日期18大数据实验平台--专业课程资源包专业课程资源包包含:Python实验课程,shell实验课程,R课程,编译实验课程,Android实验课程,Hadoop实验课程,大数据导论实验课程,Scala语言实验课程,Spark实验课程,数据可视化实验课程;1)、Python入门基础1.Python环境配置2.字符串3.Python列表操作4.生成器和迭代器格式5.Python函数与高阶函数6.文件7.进程与线程8.数据库编程9.利用Python进行数据分析; Python安全编程1.python安全编程第一课2.python安全编程第二课3.python安全编程第三课4.python安全编程第四课5.python安全编程第五课6.python安全编程第六课7.python安全编程第七课8.python安全编程第八课;Python爬虫1.Python爬虫基础1.1Python爬虫基础1.2Python爬虫-正则表达式1.3Python爬虫Re模块1.4Python爬虫Beatifulsoup库1.5Python爬虫-长沙二手房信息爬虫源代码2.Python爬虫案例2.1.爬取电影名称和ID2.2.获取票房概括表格信息2.3.获取电影得分并计算平均值以柱状图显示2.4.爬取豆瓣top250电影名称2.5.爬取豆瓣top250电影信息(基于beatifulsoup);2)、Shell教程1 shell变量2 shell传递参数3 Shell 数组4 Shell 基本运算符5 Shell echo命令6 Shell printf命令7 Shell test 命令8 Shell 流程控制9 Shell 函数10 Shell 输入输出重定向;3)、R教程1.R语言基本原理与概念:1-1在windows下安装R 1-2对象的产生、排列与删除2.R语言数据操作2-1对象2-2在文件中读写数据2-3存储数据2-4生成数据2-5对象的创建2-6对象类型的转换与运算符2-7对象的访问--数值与名称2-8函数与运算3.R语言绘图3-1R绘图的概况及绘图管理3-2绘图函数及低级绘图命令3-3一个绘图实例3-4grid和lattice包4.R语言统计分析:4-1R统计分析之分析方差的一个简单例子4-2公式与泛型函数4-3包4-4循环和向量化4-5用R写程序;4)、编译程序设计原理1 语法处理器2 语法制导翻译器3 词法分析4 语法分析-自上而下分析5 语法制导的翻译6 中间代码的生成7 运行时刻环境8 代码生成9 指令集并行;编译原理1 绪论2 高级语言及其语法描述3 词法分析4 语法分析-自上而下分析5 语法分析-自下而上分析6 属性文法和语法制导翻译7 语义分析和中间代码产生8 符号表9 运行时存储空间组织10 优化11 目标代码生成12 并行编译基础;数据结构 1几种链表类型2 线性表3 队列4 栈5 树6 二叉树7 串8 串的模式和匹配算法9 查找10 排序11 算法和算法分析;socket编程入门1常用的socket函数和数据结构2 Raw socket基础原理3 ARP协议原理4 TCP、UDP通信实例详解;5)、Hadoop基础1.hadoop体系结构2.Hadoop伪分布式搭建3.分布式文件系统HDFS 4.HDFS特性与体系结构5.分布式文件系统HDFS 6.HDFS Shell命令7.Mapreduce分布式计算框架 8.MapReduce原理与架构 9.使用Eclipse编译运行MapReduce程序10.Hadoop分布式集群搭建;Hadoop高级课程1.HDFS特性2.HDFS-API接口3.Mapreduce应用开发4.Hadoop的配置API接口5.MapReduce管理配置6.MapReduce程序结构分析7.MapReduce运行机制8.Hadoop任务流程分析9.MapReduce输入格式10.MapReduce输出格式11.Mapreduce高级特性计数器12.排序-自定义partition 13.大数据导论14.大数据平台架构与业务15.数据获取 16.如何获取数据17.流处理技术18.批处理技术19.基本概念与MPP DB技术20.MapReduce框架21.Spark架构和原理22.BSP框架23.批处理关键技术24.机器学习与数据挖掘25.机器学习概览26.深度学习27.大数据资源管理28.资源管理的基本概念29.Hadoop领域的资源调度框架30.资源分配算法31.数据中心统一资源调度32.多租户技术33.基于应用描述的智能调度34.Apache Mesos架构和原理35.大数据存储36.存储硬件的发展37.存储关键指标38.RAID技术39.存储接口40.存储加速技术41.大数据云化42.应用上云43.大数据上云;7)、Hadoop生态系统1. Hive数据仓库2.Hive架构3.Hive配置与操作4.Hive优化5.Hbase列式数据库6.Hbase架构7.Hbase部署与操作8.Hbase API编程9.Hbase优化10.Pig数据处理框架11.Pig简介12.Pig架构13.Pig安装配置14.Pig Latin详解15.Zookeeper分布式协调服务16.Zookeeper简介17.Zookeeper架构18.Zookeeper配置及应用19.Sqoop数据转移20.sqoop配置及使用;8)、Scala语言1.Scala安装2.Scala控制结构3.Scala数据结构4.Scala类5.Scala对象6.Scala继承7.Scala特质8.Scala模式匹配9.Scala函数式编程;9)、Spark基础1.spark的设计与运行原理2.Spark运行架构3.RDD的设计与运行原理4.Spark的部署模式5.Spark的安装和使用6. Spark应用程序:WordCount 7.IntelliJ IDEA编写Spark应用程序(scala+maven) 8.IntelliJ IDEA编写Spark应用程序(scala+sbt)9.使用Eclipse编写Spark应用程序(scala+maven) 10.使用Eclipse编写Spark应用程序(scala+sbt) 11.spark编程基础12.RDD编程13.键值对RDD15.共享变量14.读写HBase数据15.DataFrame的创建16.从RDD转换得到DataFrame 17.读写Parquet 18.通过jdbc连接数据库19.连接Hive 读写数据20.DStream 操作21.文件流22.套接字流23.RDD队列流24.Kafka32.Flume 25.转换操作26.输出操作27.spark graphX图计算28.Spark Graphx图操作29.Spark Graphx算法实例;10)、数据可视化实验课程D3.js数据可视化课程:1、添加元素2、数据绑定3、使用数据4、用层画条形图5、生成测试数据6、SVG初探7、使用D3绘制SVG 8、D3的数据类型9、更自由的条形图10、散点图11、比例尺12、坐标轴13、有路径的文字14、SVG基本图形绘制;Echarts数据可视化课程:1、Echarts实验指导书2、Echarts树形图3、Echarts线状图4、Echarts组件的一些使用实现5、Echarts k线图6、Echarts饼状图7、Echarts地图8、Echarts雷达图9、Echarts仪表图10、Echarts散点图11、Echarts盒线图12、Echarts热力图13、Echarts平衡坐标系;matplot可视化课程:1、matplot简介2、matplotlib图例、标题和标签3、matplotlib条形图、直方图和散点图4、matplotlib堆叠图5、matplotlib饼图;Matlab可视化课程:1、运用Matlab绘制二维图2、运用Matlab绘制三维图3、三维图形的精细处理。(需要现场演示)19大数据实验平台—专业课进阶课程资源包模块1)按大数据专业技能提供课程内容:设计上从浅至深各年级学生皆可使用。针对专业上拥有普适性,计算机相关专业,统计应用相关专业以及应用科学专业拥有不同的学习路线和课程内容。2) Tensorflow机器学习基础课程:1.Tensorflow入门2.Tensorflow基本使用3.Tensorflow-张量4.Tensorflow-会话5.Tensorflow-变量6.Tensorflow-fetch和feed 7.Tensorflow神经网络8.Tensorflow实现神经网络9.Tensorflow深层神经网络10.Tensorflow深度学习与深层神经网络11.Tensorflow损失函数定义12.Tensorflow神经网络优化算法13.Tensorflow神经网络进一步优化;(需要现场演示)3)Tensorflow机器学习进阶课程:1、Tensorflow构造线性回归模型2、Tensorflow的mnist课程3、Tensorflow完成逻辑回归4、Tensorflow训练神经网络5、Tensorflow线性回归算法实践6、Tensorflow逻辑回归算法实践7、梯度下降算法实践8、案例实战Python实现逻辑9、案例实战Python实现梯度10、决策树算法实践10、决策树SKIearn11、集成算法实践12、随机森林算法实践12、贝叶斯算法实践13、LDA主题模型算法实践14、Python文本分析之gettingstart 15、Python文本分析之tokenize 16、Python文本分析之词行归一17、Python文本分析之TextClassification 18、Python文本分析之情感分析19、支持向量机算法分析 20、SVM调参实例。(需要现场演示)4)机器学习常用算法课程:1.机器学习简介2.回归算法3.线性回归4.逻辑回归5.分类算法6.贝叶斯分类7.决策树与随机森林8.SVM支持向量机9.聚类算法10.k-means聚类;(需要现场演示)5)大数据分析与决策部分课程必须包含人工智能的处理方法,且支持python,spark的实现方式,包含tensorflow平台的分析方法;6) Spark机器学习课程:1.Spark MLlib简介2.机器学习工作流3.构建一个机器学习工作流4.特征抽取TF-IDF 5.Word2Vec 6.CountVectorizer7.标签和索引的转化8.卡方选择器9.逻辑斯蒂回归10.决策树分类器11.聚类算法12.KMeans聚类算法13.高斯混合模型(GMM)聚类算法14.协同过滤算法15.模型选择和超参数调整;(需要现场演示)7) Python类进阶实验包括:python爬虫1.Python爬虫基础2.正则表达式3.Re模块4.Beatifulsoup库5.长沙二手房信息爬取6.python爬虫实战7.爬取电影名称和ID8.获取票房概括表格信息9.获取电影得分并计算平均值以柱状图显示10.爬取豆瓣top250电影名称11.爬取豆瓣top250电影信息(基于beatifulsoup);python数据处理1.读入数据并删除空值2.更换index索引3.依据索引排序4.获取特定票房电影5.获取特定电影所有信息6.绘制散点图7.统计票房数据平均值8.将日期转换为周次9.按周统计每周每个票房的影片总和并输出保存10.数据可视化(需要现场演示)8)基于全球领先的Aneka云环境的教学内容,包括云的介绍,云的使用,Aneka环境的搭建,维护操作,以及通用化大数据编程及如何移植到Aneka的相关课程。(需要现场演示)9)针对数据的统计分析的相关语言,工具学习使用及真实案例分析。包括R语言,SPSS,SAS,matlab,excel等内容。(R语言)1.在windows下安装R 2.对象的产生、排列与删除3.在线帮助4.R语言数据操作对象5.在文件中读写数据6.存储数据7.生成数据8.对象的创建9.对象类型的转换与运算符10.对象的访问--数值与名称11.函数与运算12.R语言绘图13.R绘图的概况及绘图管理14.绘图函数及低级绘图命令15.一个绘图实例16.grid 和 lattice包17.R语言统计分析18.R统计分析之分析方差的一个简单例子19.公式与泛型函数20.包21.循环和向量化22.用R写程序10) Internet互联网在线抓取电影网站信息;用5种方法从不同角度分析与抓取,9种方法对数据清洗整理和计算表达。(需要现场演示)11)根据行业真实数据的基于CMMI流程化的综合大数据案例:基于python,MapReduce,Spark等对真实的数据源进行抓取,清洗,筛选,分析等一些列大数据处理内容;案例中配套有针对大数据运维、数据分析和数据挖掘等课程结合统计学进行数据分析决策的大型综合案例,1.基于空气质量检测数据的环境气象综合案例;2.基于雨量数据的数据统计与挖掘。3.工业类分析居民电力使用状况4.金融类:预测贷款风险,银行个人信用贷款风险预测 5.电子政务类:济南租房,长沙二手房房价数据分析及预测 6.医疗类乳房组织数据分析与预测7.交通类交通死亡数据分析与可视化8.信息安全类用户流量数据统计分析数据分析9.基于人工智能图像数据和语音数据的分析和可视化 10.基于海量图像识别的综合案例11.基于全国环境气象,空气质量检测数据的综合案例 12.基于社会生态数据的综合案例;基于人口密度数据的综合案例 13.基于电子商务数据的综合案例;基于浏览数据的综合案例 14.基于土地利用和植被类型数据的综合案例15..基于人体健康数据的大数据综合案例 16.基于全国水文地质数据的综合案例;基于水文站点的综合案例 17.基于社会经济数据的综合案例,基于人口密度数据的综合案例18.基于行政区域划分数据和乡镇界限数据的大数据案例19.基于生物信息的精准医疗综合案例20.电影大数据的爬取清洗分析和可视化案例21. 环境气象类案例:基于空气质量检测数据的综合案例,基于降雨量数据的气象综合案例22、生物信息类:面向海量生物信息数据的多序列比对。12) 除了平台本身的教学内容,平台还支持定制个性化教学实验,自由设计实验环境。使用者可以根据自身需求和实际应用场景对教学内容作出相应的调整,实验环境可在原有基础上修改增加也可完全自主定制。多媒体教学内容,如音频,视频等也可自由定制。13)要求必须包含综合大数据导论课程,导论内容不能只有理论概念,需要配套具有展现大数据生命周期的实验内容和配套讲解视频,讲解视频不少于6小时。14)大数据可视化教学内容必须提供可将现有实验内容及常见数据格式转换成柱状图、管体图、箱线图、仪表盘、折线图、饼状图、散点图、地图、雷达图等形式。(需要现场演示)15)大数据分析与决策部分课程必须包含人工智能的处理方法,且支持python,spark的实现方式,包含tensorflow平台的分析方法,tensorflow必须包含windows和linux的构建方式。(需要现场演示)110大数据科研平台-计算管理系统模块1、计算管理系统模块提供大数据科研内容的主要科研实验不但提供配套的科研实验环境和科研实验步骤,自由可扩展科研实验环境。2、可定制符合实际使用场景的科研实验环境,科研实验场景节点自由部署,节点系统环境,硬件配置动态可调整。3、科研实验环境默认使用完毕自动收回,智能管理平台资源。对于个性化的定制科研实验内容即可随堂销毁,也可动态保存,保存状态不占用资源。4、可真正做到从网络到系统完全自由化设计,根据使用者的需求可构建出HDFS存储资源,大数据计算机群111大数据科研平台实验管理系统1、管理系统采用B/S结构,支持角色权限自由分配,默认为超级管员。2、按需分配角色如:专业负责人管理员、科研项目管理员、项目组管理员等角色支持完全的动态角色管理,每种角色权限范围可随客户需求现场修改。3、管理内容从只可以浏览平台,到系统级全平台管理权限,都可自由选择和定制;系统包括科研小组管理、实训设置、科研内容管理、科研报告管理、虚拟机管理、云计算集群管理功能。(提供30种以上不同权限、不同角色用户)112大数据科研平台-运算环境系统模块1、提供Aneka运算环境,大数据科研内容的主要实验不但提供配套的实验环境和实验步骤,此外必须提供对应视频操作和音/视频讲解,多种学习手段同时进行,学生看、听、学、做多角度进行。2、大数据实验系统底层基于全球领先的google采用的Aneka并行云技术。自动实现轻量级,图形化易于搭建的云平台,高性能任务分发资源调度系统和大数据处理技术;3、平台的应用开发可以实现接口化、模块化、自动化的管理;4、平台搭建和应用开发编程拥有继承性,简易型。傻瓜式部署,快速上手大大降低了用户应用开发的难度和开销;5、支持可在异构计算平台上部署的可扩展云中间件6、基于Aneka云的大数据实验平台针对不同编程模型(例如任务、线程、MapReduce)提供可扩展应用编程接口(API),用于不断发展分布式应用并将新的技术整合到云应用中,同时平台还支持不同的云部署方案7、必须提供不同于IaaS 平台上的Aneka 管理软件,成为一个可在多种云平台上进行云应用开发、部署和管理的综合平台。113大数据科研平台-案例库资源包模块1、大数据实验平台案例库:根据交通、制造业、物联网真实的案例,和实际数据进行综合大数据分析。2、基于python,MapReduce,Spark等对真实的数据源进行抓取,清洗,筛选,分析等一些列大数据处理内容;3、案例中配套有针对数据挖掘和数据融合课程结合统计学进行数据分析决策的大型综合案例。114大数据科研平台-平台资源库模块平台资源库模块包含:1、Hadoop平台相关HDFS、MapReduce的课程。包括平台搭建,运维,基础使用和利用平台进行mapreduce常见编程的内容。2、包括SPARK机群的搭建,基础操作及所有常见数据分析方法的:Spark集群搭建;SparkRDD lazy实践;Spark读取file,HDFS方法;Spark的map,flatMap,mapPartitions实践;Spark的filter,distinct,Cartesian实践等80多节具有配套实验的课程内容。3、Python实验包包括:Python基本操作、Python列表操作、Python函数和程序包、Numpy数组操作、Matplotlib数据可视化、Pandas数据框操作。4、Aneka类实验包:基于全球领先的Aneka云环境的内容,包括云的介绍,云的使用,Aneka环境的搭建,维护操作。以及通用化大数据编程及如何移植到Aneka的相关课程。5、Scala实验包:从基础到精进,包含典型案例的全套40多节课程(要求现场演示);包括SPARK机群的搭建,基础操作及所有常见数据分析方法的内容:Spark集群搭建;SparkRDD lazy实践;Spark读取file,HDFS方法;Spark的map,flatMap,mapPartitions实践;Spark的filter,distinct,Cartesian实践等80多节具有配套实验的课程内容;6、包括常见数据库类实验,常见数据库的入门基础到高级提升内容。包括ACCESS,MySQL,oracle等课程内容。115大数据科研平台-数据采集中间件系统模块1、提供针对不同类型数据源的数据采集工具,支持结构化数据、非结构化数据流数据、文本日志数据、互联数据局等数据的采集;2、提供采集工具集的管理功能,除平台提供的标准采集工具外,可实现采集工具的添加、删除等操作;3、提供采集工具集的管理功能,除平台提供的标准采集工具外,可实现采集工具的添加、删除等操作;4、提供采集策略管理,能根据采集工具及数据源类型,定制采集方式,采集频率等;5、提供至少包含面向日志数据采集的flume采集工具,能满足包括syslog、legacy、netcat、自定义等日志数据的采集,并支持多级Flume嵌套模式;6、提供至少包含面向结构化数据的优化采集工具Sqoop工具,不仅支持原有Sqoop的功能并且单独集成了从HDFS向 ES传输数据,并且支持SQL。7、提供爬虫组件,采用Hadoop平台作为网页存储并形成可用的系统,采用Elasticsearch作为索引存储;爬虫需采用HBase同步表的机制,使用HBase的数据表同步,采用即算即存,存储到ES中的权重值实时可用;支持分布式多线程,支持优先级队列,支持代理IP,灵活任务配置,支持定时任务,支持节点失败任务转移等特点;116大数据科研平台-数据治理类库模块1、提供数据治理类库,实现数据治理,包括数据缺失、数据重复、数据错误、数据不可用等数据的治理类库;2、针对缺失数据,提供从业务系统中再次导入、手工补入、根据逻辑补值、放弃等治理方法;提供针对同类数据错误,提供自动校验和校正工具3、提供针对重复数据,提供自动去重、手动去除、根据时间和业务逻辑去重等治理类库;4、针对数据不可用,提供按规则适配、关键字匹配、枚举转换等治理类库;5、提供数据质量监控,对数据和采集的数据进行匹配分析,发现不匹配项,使用工具进行转换或治理规则制定;6、提供分布式MYSQL,支持数据库结果合并,支持夸库分布,支持将一张表水平拆分成多份分别放入不同的库来实现表的水平拆分。117大数据科研平台-运行与计算二次开发框架系统模块1、必须包含Hadoop(MapReduce, HDFS, Yarn)、 HBase、Hive、Spark、ElasticSearch、Kafka、Flume、Oozie、Zookeeper、HUE、scala。2、提供大数据环境自动部署功能,基于虚拟化与物理机进行Hadoop自动化部署配置管理,可按需创建hadoop集群以及自动完成节点的部署,同时支持图形管理界面,安装运维界面。3、要求全面兼容Apache Hadoop发行的版本,支持NoSQL、MapReduce、Spark等各种主流的Hadoop框架开源方案。有明确的后期版本演进路线。4、大数据平台支持存储资源分配,即支持给租户分配存储资源,可控制租户在文件系统上可以创建的最大文件数量和使用的最大存储空间,支持计算资源分配,即支持给租户分配计算资源(包括CPU和内存),可配置使用的最大(上限)、最小(预留)系统资源百分比。5、包含有数据动态同步组件,支持传统关系型数据库向 hadoop 的动态数据同步,同步数据延迟不超过5秒。6、大数据平台支持与第三方软件的快速集成,包括但不限于:主流ETL工具、主流数据可视化工具软件、主流元数据管理软件平台。至少支持与Tableau或标准BI对接。7、拥有独立大数据开发类库,支持提供标准开发库,功能涵盖了从爬虫、ETL、自然语言处理(NLP)以及机器学习和神经网络等技术,完成各类大数据和人工智能项目的开发,实现10倍以上的开发效率的提升。8、提供基于大数据的自然语言处理组件,提供分词、词典、命名实体、篇章理解、关键词提取、自动摘要、拼音转换、语义距离以及智能推荐功能,并提供开发接口。118大数据科研平台-搜索引擎系统模块1、支持通过可视化的工具进行异构数据库SQL语句查询,支持HBase/Hive等Hadoop数据库和MySQL/Oracle/SQL Server等关系型数据库的自定义SQL查询。2、支持采用Hadoop分布式存储方式,采用HIVE、HBASE、HDFS三种分布式存储技术对大数据仓库平台中的数据分类存储;3、HBase支持二级索引,能够支持本地以及全局二级索引。4、流处理引擎支持消息驱动的实时计算,支持对接不同的数据源,以毫秒级时延实现数据的聚合、拆分、过滤等处理。5、采用数据分片技术及并行入库的方式保证数据访问的高效率,同时保证数据仓库的无缝扩展及数据的可靠性要求。提供根据数据重要性要求定制存储副本策略的功能;6、提供对数据中心的全量数据、标准化数据、以及模型数据的高效检索功能,在100亿条数据以上的检索响应时间小于1ms;7、主题库需支持分布式集群数据库,满足应用分析访问需求,同时满足高并发访问的要求;119大数据科研平台-计算中间件系统模块1、提供整体数据仓储的管理和检索功能;需支持Impala、Solr等标准数据检索框架、ElasticSearch分布式全文检索框架;2、支持MPP分布式存储和检索;3、提供大数据到ES全文检索引擎的导入导出工具及二次开发接口。4、支持SQL的方式进行全文检索。需要整合对中文搜索的有效支持以及对数据同步技术的支持后的高性能。120大数据科研平台-AI系统模块1、提供算法分布式执行引擎系统,以保证数据计算过程的高效性,保障数据计算时能在计算节点并发运行;2、提供自定义插件功能,管理人员可根据实际情况自定义插件,添加,更新现有算法库算法。3、数据挖掘能力:需提供机器学习算法库Mahout和Spark MLlib,包含聚类分析、分类算法、频度关联分析和推荐系统在内的常用机器学习算法。4、需提供回归分析、关联分析、个性推荐、社交网络、中文分词等机器学习场景的开发框架,便于二次开发。5、提供基于Python实现的贝叶斯、决策树、支持向量机、K邻近值、决策树(ID3)、层次聚类、Kmeans、线性回归、逻辑回归、遗传算法等学习示例代码和数据集,可下载算法源码、操作手册。6、提供一站式产品自助资料库,用户可自助获取系统的相关开发指导文档、调优手册、使用问题FAQ等。7、提供多行业的开放数据集,用于进行机器学习等算法的训练。需包括金融交易类、智能交通的TB级数据集。121大数据科研平台-流数据服务系统模块1、针对实时性要求比较高的数据,提供实时采集、实时计算、实时展示功能。2、至少提供flume做日志管理、采用kaflka做实时流处理,形成消息队列。3、通过kaflka提供实时流运算功能,聚合建模后的数据经spark streaming运算后供前端展示。4、支持流式数据批量处理功能,将流式的实时数据分解到计算节点批量处理。122大数据科研平台-系统性能监控平台模块1、提供元数据管理功能,针对每个原数据进行数据字段、类型、注释、创建时间、大小、存储信息等进行管理。2、提供对大数据平台及库的图形化安全管理及配置等功能。3、提供大数据平台的图形化配置功能,包含服务器管理,数据库节点及服务管理等功能。4、提供库监控功能,对整体数据库平台提供数据节点及基础硬件性能监控。5、提供大数据平台服务进程监控功能,如hive、HDFS、spark等服务进程的监控,保证分布式部署下服务的效率和可靠性。6、提供对大数据计算机存储节点及服务节点的群集的管理功能,如添加、删除等操作。7、提供管理平台系统参数配置功能,可通过可视化管理平台管理和配置底层运行参数。8、提供大数据平台集群和服务的自动化部署和故障诊断功能,并提出解决建议。9、支持邮件告警功能,能根据配置的邮件地址发送告警邮件。支持对集群主机及组件的运行性能监控和管理,包括但不限于Hadoop生态的组件如:HDFS、hive、hbase、hue、impala、mapreduce、Oozie、spark、sqoop、yarn、zookeeper、ES等。123大数据科研平台-系统安全模块1、提供用户名、密码等多认证组合的安全验证方式。2、提供数据多副本冗余存储,网络的多链路冗余技术,保证数据及存储的安全性。3、提供用户管理体系和管理平台,提供多用户的权限及安全管理,以图形化方式对用户的权限及角色进行增删查改等。124远程运维服务远程运维管理平台需要对计算、存储、网络等基础资源以及对运行于基础资源上的数据库、中间件等平台环境进行统一运维。平台具备大规模、分布式管理需求。支持多层级联部署,满足大规模部署的要求。可提供7x24小时、非工作时间和5x8远程支持选项。支持原厂工程师远程运维。主动发现已发故障,并在后台自动生成工单,由专属工程师主动联系客户进行故障处理,客户可跟踪工单处理过程。提供资产报告,必须包括设备硬件信息(可到板卡、电源级别),序列号,合同信息,软件版本信息等。提供例行运维报告,报告包含周期性运维数据总结,发生问题汇总,问题处理情况汇总,告警趋势,日志分类,监控指标越限等信息。信息可审计,并可对网络环境进行安全审查。1、网络设备管理支持自动网络发现能力,能够对主流品牌设备自动发现且自动网络拓扑构建。支持监控主流厂商网络设备性能。2、服务器管理支持对主流品牌的PC Server服务器的硬件监控。支持对各类主流操作系统的监控,包括;Windows、Linux、Unix等监控。3、存储设备管理支持符合SMI-S1.1规范的主流厂家的存储阵列的监控。4、数据库监视支持Oracle、MySQL等各类关系型数据库的监控。支持MongoDB、Cassandra等各类NoSQL的监控。5、中间件监控支持监测各类Web服务中间件监控;支持监测各类缓存中间件监控;支持各类MQ中间件监控。6、集中告警管理平台对各类告警信息进行统一处理,实现对各类告警的接收、标准化、丰富、关联等功能;支持接入第三方告警。故障告警可以与400客服热线对接,由原厂工程师接手处理;支持图形化展现资源的各类告警;支持对根源告警进行确认,并与相关的非根源告警进行合并;支持对告警进行筛选过滤,支持对历史告警进行查询;支持对告警进行抑制、关闭、删除等操作;7、运维自动化需实现运维操作的自动化管理,基于运维操作脚本、资源、作业编排,实现日常运维场景的自动化,支持包括但不限于;批量创建账号,批量赋予账号权限,系统日常巡检、应用软件安装、备份清理、合规检查等自动化运维场景。8、运维流程平台支持灵活动态的web在线工单流程建模,可根据实际管理环境和管理需要自由、灵活的定义和调整工单模型。平台支持事件管理、问题管理、变更管理等工单系统,可通过工单流程状态图了解到整体流转情况。工单系统可以根据故障告警自动创建;9、资源管理需实现对被管理资源的配置信息生命周期管理,包括配置模型管理、配置维护,形成配置管理库,提供统一、可信的配置数据应用支撑。配置管理库支持多种配置项的发现和收集手段,包括;人工录入和批量导入、配置自动发现等。10、运维可视化管理系统提供数据可视化展示模块,内置业务拨测展示视图、运营商租用链路质量分析视图、主干链路趋势图、主干链路带宽趋势图等。系统提供数据展示可视化设计器,可通过拖拽进行展示视图的设计,支持;拆线图、饼图、拓扑关系图、饼图、漏斗图、雷达图、仪表盘、地图等展示元素。视图支持部件自由摆放、叠加和层级设置,支持背景图、背景色、透明度的调整,支持全屏预览,即可查看设计的窗口展示效果。系统同时支持基于第三方数据源的展示,支持数据库、文件数据源、RESTAPI等方式,可用于展示各类客户化的数据展示视图。11、提供7×24远程监控和故障响应,5×8远程解决故障,每周打印一份《运维报告》送到采购人所在地。125空调3匹变频冷暖;带电辅加热。柜式226综合布线1.多功能控制台:推拉式多功能控制台,材质:选用1.0-1.2mm厚武钢优质冷轧钢板。表面经酸洗、磷化防腐防锈后静电喷塑处理、喷后均匀,光洁度好,塑面经久耐用。控制端:支持台式电脑、笔记本电脑、数字展示台。2.服务器机柜等安放到指定的服务器机房,机柜安装到位,机房和服务器设备能正常使用。3.需提供1台教学用触摸显示器,满足上课触控记录功能,可视角度:≥178度(上下、左右),最佳显示分辨率:≥1920*1080,尺寸≥23.8寸,平均亮度≥500cd/m2,需要支持D-Sub(VGA),HDMI,Displayport4.采用交钥匙工程,中标公司应该保证:所有设备上架并安装到位,机柜安装固定完毕;终端设备正常连接机柜,所有设备能正常使用,并做招标要求的设备整体功能测试;服务器机柜等安放到指定机房,机柜安装到位,机房和服务器设备能正常使用。127展示屏幕1、屏幕尺寸:对角线55英寸 LED直下式背光2、可视角度:≥178度(上下、左右) 对比度:≥3500:1 亮度:≥500cd/m2 最佳显示分辨率:≥1920*1080 ;响应时间:≤ 8ms 显示单元拼缝:≤3.5mm(双边拼缝)3、具备多种信号输入接口:HDMI、VGA、DVI、BNC、RJ45,USB、红外接口,并(选配)实现VGA、DVI、BNC、RJ45(4种)接口环入环出; 4、可实现HDBaseT网络传送为基础的标准;5、液晶显示单元为金属外壳,内部元器件安装在可燃等级为V-0的PCB上。6、液晶显示单元符合在正常的工作条件下,连续工作168h,不应出现电、机械或操作系统的故障。7、要求液晶显示单元维护时具有模块化硬件设计,在不需要取下屏体的同时,进行维护,1人即可完成更换、维护; 8、要求液晶显示单元具备数字降噪、自动显示格式匹配、手动白平衡调节等功能。 9、产品标配(专利)壁挂调节器,在拼接安装时,其水平和垂直托架能够精确定位相邻的显示模块,让对装卸、安装、调节和维护变得更加简单。10、拼接屏、拼接软件、壁挂调节器、模块化安装支架必须是同一品牌。11.包含两块教学辅助白板,可供上课记录用。12. 实训室内涵建设:有关于大数据的有关展板。6块1mX1.2m展示文化板。4商用使用许可证明文件★投标人所投标产品按招标要求提供对应商用使用许可证明文件软件著作权投标人所投软件产品需具有真实、有效的软件著作权(必须提供有效证书复印件并加盖投标人和原厂商公章)。 ................
................

In order to avoid copyright disputes, this page is only a partial summary.

Google Online Preview   Download