2020年12月26日-27日,由东南大学、奥工科技联合主办的东南大学大数据计算中心2020年度用户培训在东南大学九龙湖校区纪忠楼y214教室成功举办。本次培训为期两天,旨在提升用户在超算平台和云平台上的实践操作能力,集中解决用户在使用过程中遇到的共性问题,增强用户对机器学习和深度学习的认知,使得用户熟练掌握人工智能相关工具链和使用技巧,进一步提升用户对HPC 和人工智能平台(GPU)的使用效率。 奥工科技资深工程师郏光奇,奥工科技资深工程师迟飞,ZStack云计算解决方案专家高苏,纽约州立大学博士钱广锐四位有着丰富实践经验的培训讲师给大家带来了精彩的培训。全校有来自交通学院,土木学院,计算机科学与工程学院,建筑学院,能源与环境等多个学院300多位师生通过线上&线下的形式参加了此次培训。 东南大学大数据计算中心东方教授致开场辞。他首先介绍了大数据计算中心的建设背景及发展现状,希望通过本次培训活动,让全校师生能够增进对高性能计算、云计算以及人工智能等技术的了解,并能够掌握东南大学大数据计算中心的资源使用方式。同时表示后续中心将会为大家提供更加高效的服务,以更好地支撑各院系的科学计算需求。
第一天上午由奥工科技的郏光奇工程师介绍了HPC集群整体环境。先是整体介绍了大数据计算中心可提供的资源,然后具体阐述了资源申请,堡垒机的使用,集群软件安装,环境变量配置,最后着重针对用户在使用过程中遇到的问题给出了解决方案。
第一天下午首先是由奥工科技的迟飞工程师进行了HPC并行加速方面的培训。先是介绍了并行的基本概念、多进程与多线程的关系、工作流程、具体调试中的优化参数,最后通过代码实操对相关知识点进行具体说明和指导。现场有多名学生对此非常感兴趣,培训结束之后与迟飞工程师针地细节进行热烈的讨论。
接下来Zstack的高苏工程师主要介绍了私有云平台的使用。重点介绍了用户如何创建、管理与使用云虚拟主机。通过申请虚拟机资源,可以支持用户的异构操作系统应用或交互式应用的需求。 第二天的培训则是由钱广锐博士带来的为期一天的人工智能平台培训。钱博士有着非常丰富的人工智能实践经验,本次的培训内容包含了相当多的知识点和实操演示。其中上午重点对机器学习展开培训,先从软件的安装及相应的库开始介绍,然后从非监督学习和数据降维的方法,监督学习的算法原理和应用进行了阐述,同时介绍了非常实用的工具链,最后是系统介绍了机器学习的分类预测,具体演示在中心平台上如何运行。交通学院的一位老师特地赶来,并与钱博展开了热烈的讨论。 下午则是侧重于深度学习的培训。从神经网络的基本概念,深度学习系统,GPU硬件,以及常用的深度学习框架,和实用的标签工具,图像分类和目标检测等方面进行了深度的培训,最后以在大数据中心共享服务平台上进行模型训练操作演示结束了本次培训。
为期两天的培训活动,线上直播会议室一度爆满,线下与专家讲师近距离接触的现场同学们踊跃发言!东南大学同学们在专业培训讲师的指导下系统梳理了集群使用办法,了解大数据中心资源及使用情况,学习了AI、高性能计算和云计算等相关学科,收获满满! 大数据中心将在今后的服务工作中继续组织相关用户培训活动,让广大师生能够更好地了解中心,也能够更加高效的使用中心的计算存储服务以支持各院系的科学计算应用,为推进我校双一流建设做出积极贡献。 延伸阅读:东南大学大数据计算中心是我校科研信息服务的战略性共享支撑平台,于2017年7月正式成立。通过构建功能齐全、开放高效、体系完备的大数据中心,面向全校相关学科提供科学计算服务,为我校“双一流”建设提供一流的支撑条件。同时依托平台开展相关领域的学术研究、人才培养并面向社会积极开展校企合作及社会服务,努力打造集产、学、研一体化的全国一流的大数据公共科研服务平台。目前中心拥有硬件设施包括IBM、HPE以及浪潮,华为等品牌共501个计算节点,系统CPU理论峰值浮点计算能力达到每秒366.5万亿次(共9776核),GPU峰值计算能力为每秒1107.4万亿次(142块NVIDIA V100 GPU卡),存储能力裸容量近5PB。平台整体性能达到国内高校相关领域领先水平。目前中心主要承载了诺贝尔物理学奖获得者丁肇中教授牵头的AMS实验的数据处理任务以及全校多个院系(物理学院、化学院、计算机学院、机械学院、能环学院、电子学院、交通学院)的科学计算应用,累计服务时间超过1.4亿CPU小时,服务用户数超过200人。
|