按照《安徽省教育厅关于进一步规范大学生学科和技能竞赛管理的意见》(皖教秘高〔2020〕67号)要求,由大赛组委会提交的《2023年安徽省大学生大数据与人工智能应用大赛赛项规程》,经安徽省大学生创新创业教育办公室审定通过,现将赛项规程予以公布。大赛组委会要严格按照规程开展各项竞赛组织工作。请各高校按照规程要求,积极组织符合条件的学生参赛。
安徽省大学生创新创业教育办公室
2023年7月7日
2023年安徽省大数据与人工智能应用竞赛
赛项规程
一、竞赛名称
项目名称:安徽省大数据与人工智能应用竞赛
英文名称:AnhuiBigDataandArtificialIntelligenceApplicationCompetition
赛项组别:本科组、高职组
二、竞赛组织机构
主办单位:安徽省教育厅
承办单位:合肥工业大学、合肥学院、安徽工业经济职业技术学院、合肥幼儿师范高等专科学校
技术支持:羚羊工业互联网平台
(一)组织委员会
主任委员:
储常连安徽省教育厅副厅长
执行主任委员:
丁立健合肥工业大学副校长
副主任委员:
高原安徽省教育厅高教处副处长(主持工作)
刘仁金安徽工业经济职业技术学院校长
余桂东合肥幼儿师范高等专科学校校长
委员:
朱永国安徽省教育厅高教处副处长
李军鹏合肥工业大学本科生院副院长、创新创业教育处处长
胡学钢教育部大学计算机类专业教学指导委员会委员、安徽省高等学校计算机教育研究会理事长、合肥工业大学教授
佘东安徽工业经济职业技术学院教务处处长
夏道明合肥幼儿师范高等专科学校教务处处长
黄建国合肥幼儿师范高等专科学校信息技术中心主任
夏娜合肥工业大学计算机与信息学院/人工智能学院副院长
薛峰合肥工业大学软件学院副院长
(二)专家委员会
王浩教育部大学计算机课程教学指导委员会委员、合肥工业大学教授
朴松昊哈尔滨工业大学教授
韩江洪合肥工业大学教授
岳丽华中国科学技术大学教授
郑利平合肥工业大学教授
张润梅安徽建筑大学教授
孟浩安徽农业大学教授
钟秋波宁波工程学院教授
高先和合肥学院教授
(三)仲裁委员会
主任:
孙怡宁中科院合肥物质科学研究院研究员
关柯中国科学院合肥物质科学研究院文献情报与期刊中心副主任(主持工作)
郑召丽合肥工业大学纪委办公室副主任
(四)秘书处
秘书长:
秘书处办公室设在合肥工业大学计算机与信息学院。
三、竞赛目的
四、竞赛内容
(一)竞赛内容
本次竞赛设大数据赛道和人工智能赛道两个赛道。
(二)竞赛方案
(1)大数据赛道
(2)人工智能赛道
五、竞赛方式
本次大赛中,所有赛道均需通过各学校校赛选拔以后才能报名参赛。
六、竞赛流程
(一)大数据赛道
2023年9月:通过比赛官网报名参加网络赛;
2023年10月21-22日在合肥幼儿师范高等专科学校进行现场赛。如遇其他原因需要调整的,将另行发文通知。
(二)人工智能赛道
2023年10月21-22日在安徽工业经济职业技术学院进行现场赛。如遇其他原因需要调整的,将另行发文通知。
七、竞赛赛题
本赛道分为本科软件组、高职软件组和创意组。
(1)本科软件组竞赛内容分为大数据平台部署与参数优化、大数据预处理、大数据分析、大数据可视化以及综合应用,具体包括:
大数据平台部署与参数优化:参赛选手根据题目要求完成大数据平台的部署,包括但不限于Hadoop、HDFS、HBase、Hive、Spark、Zookeeper、echart、Flink、Flume、Storm等,并能够根据要求对部署的平台参数进行调整以及测试平台可用性,对多个平台进行联调、联测,实现数据在不同的平台中进行流转。
大数据预处理:参赛选手根据题目要求对给定的数据(数据可能不完整、不一致、重复、含噪音等)进行预处理,使得数据准确、完整、一致、可用,并能够对数据格式进行转换。
大数据分析:参赛选手根据题目要求在已搭建好的大数据平台上进行数据的分析。
大数据可视化:参赛选手根据题目要求对给定数据进行可视化展示,并能对可视化结果进行解释说明。
综合应用:对给定的数据集,参赛选手综合应用大数据预处理、大数据分析与挖掘等技术,求解一个给定的问题。
(2)高职软件组竞赛内容分为大数据平台搭建与运维、大数据分析、大数据处理及可视化、综合应用,具体包括:
大数据分析:参赛选手根据题目要求在已搭建好的大数据平台上使用大数据工具实现数据联合调用与分析。
综合应用:对给定的数据集,参赛选手综合应用大数据预处理、大数据分析与挖掘等技术,根据题目要求进行求解或编写数据分析方法文档和数据分析结果文档。
(3)创意组竞赛内容要求参赛作品须围绕大数据与人工智能核心技术,探索有具体落地场景的技术应用创意方案,如大数据与人工智能技术在工业、农业、医疗、文化、教育、金融、交通、公共安全、日常生活、公益等行业领域的应用探索。
本赛道分为本科软件组、高职软件组和硬件组。
(1)本科软件组竞赛内容分为人工智能基础环境搭建部署、样本数据预处理、传统机器学习算法设计及应用、深度学习算法设计及应用、人工智能技术综合应用,具体包括:
样本数据预处理:对给定的样本数据(图片、文本或者数值数据),检测和去除数据集中的噪声数据、重复数据和无关数据,处理遗漏数据,去除空白数据域,标准化、归一化、二元化数据以及特征提取等处理。
传统机器学习算法设计及应用:典型传统机器学习算法的设计应用。包含但不限于逻辑回归、支持向量机、决策树、Kmeans等,根据题目或场景,通过选用机器学习算法利用Sklearn或者其它机器学习框架训练模型,实现分类、聚类算法并解决问题。
(2)高职软件组竞赛内容分为人工智能基础环境搭建部署、数据集加载及预处理、模型构建及训练、模型加载及预测、综合分析,具体包括:
数据集加载及预处理:利用PyTorch完成指定数据集的加载,对给定的样本数据进行预处理,如检测和去除重复数据等。
模型构建及训练:对于传统机器学习算法及深度学习算法的构建及训练。包含但不限于逻辑回归、Kmeans、神经网络等,根据题目或场景,通过对指定机器学习算法进行调参,解决分类或聚类问题。
综合分析:文档协作能力、总结分析能力。
(3)硬件组竞赛内容分为国产AI边缘计算平台开发环境的使用、离线数据AI算法处理、在线数据AI算法处理、AI交互以及综合分析,具体包括:
离线数据AI算法处理:对视频、文本或语音等离线数据,利用指定算法或模型按要求进行处理并展示。考核功能包括视频中图像处理、物体检测识别、文本分类、中文分词、语音唤醒等。
在线数据AI算法处理:利用摄像头、麦克风等外设获得实时视频、语音等数据,利用指定算法或模型按要求进行处理并展示。考核功能包括视觉测量、语音识别等。
AI交互:利用摄像头、麦克风等外设获得实时视频、语音等数据,按照要求实现特定功能的人机交互。
八、竞赛规则
每一赛道,同一教师指导的队伍总数不得超过4支,其中作为第一指导老师不得超过2支。学生参与比赛可以无指导教师。
(1)报名资格和要求
比赛以队为参赛基础,每支参赛队由1-3名参赛学生(队员)和1-2名指导教师(也可无指导教师)组成。参赛学校可另设领队1名(可由指导教师兼任)。领队和教练必须是参赛学校的在职教师,本科组参赛队员必须是当年度参赛学校的在读本科生、研究生,高职组参赛队员必须是当年度参赛学校的专科生。参赛队员是否符合本规则关于学历的规定,由竞赛组委会负责解释,由此产生的任何疑问应提交仲裁委员会审议。
所有参赛队伍由各高校选拔上报,大赛不接受个人报名。各参赛队在网上注册以后,每所学校指定1名领队负责报名(每所学校指定1名教师进行认证),由参赛学校领队对比赛队伍进行审核,参赛学校领队对报名资料的真实性和参赛指导老师、学生排序负责,同时提交学校教务部门或创新创业教育管理机构等部门的意见(需签章)到组委会。
所有参赛人员、指导教师、领队须签署大赛承诺书(详见附件1)。
(2)赛前准备
赛前开展比赛规则研讨,并对比赛规则进行进一步解读。各参赛队伍师生依据比赛规则和要求进行比赛准备。
(3)比赛期间
软件组:
参赛队必须在指定的位置就坐和操作指定的计算机。
参赛队员可以携带诸如书、手册、程序清单等参考资料。
参赛队员不能携带任何可用计算机处理的软件或数据(不允许任何私人携带的U盘、磁盘或计算器)。
创意组:
初赛作品评审选用网评的方式进行。网评专家组由安徽省或省外大数据与人工智能方面专家组成,并由系统自动分配作品。
决赛采取现场答辩的形式,答辩将分成几个组同时进行,分组方案由组委会制定,但组委会不决定各组答辩顺序,各组的答辩顺序将在抽签仪式中抽签决定。决赛现场评审专家由组委会从评审专家组中选取,并交由大赛监督组确认。
根据答辩需要,允许答辩队伍通过计算机、手机、实物等方式辅助展示作品。答辩现场在答辩过程中对外封闭,请待答辩的队伍等秘书通知再进入现场。
以下情况将视为违规,竞赛组织委员会有权取消参赛队伍的参赛资格:
②作品参加过其他省级及以上比赛并获奖;
③作品涉嫌抄袭,侵犯他人知识产权等;
④作品涉及不健康、淫秽、色情或毁谤第三方等内容;
⑤参赛期间发现或被举报认定存在其他违法、违规行为。
(4)成绩公布
竞赛结束后,由竞赛评测专家(由专家组遴选,组委会认定)进行评测,最终成绩将在大赛官网进行公示。公示无异议后,上报安徽省大学生创新创业教育办公室,并在安徽省高教网再次进行公示。待公示期满后,由安徽省教育厅发文公布获奖名单。
所有参赛队伍由各高校选拔上报,大赛不接受个人报名。各参赛队在网上注册以后,每所学校指定一名领队负责报名(每所学校指定1名教师进行认证),由参赛学校领队对比赛队伍进行审核,参赛学校领队对报名资料的真实性和参赛指导老师、学生排序负责,同时提交学校教务部门或创新创业教育管理机构等部门的意见(需签章)到组委会。
九、竞赛地点和环境
本赛道地点定于合肥幼儿师范高等专科学校。
参赛队员根据竞赛要求,使用指定的竞赛用电脑和竞赛平台,竞赛用电脑由竞赛组委会统一提供。
操作系统:CentOS
编程语言:Python、Java
Python语言开发环境采用PyCharm,Java语言开发环境采用Eclipse。
各参赛队伍自行考虑是否携带展示设备并在比赛前在展示参观区域完成调试,在整个比赛期间提供给与会人员的演示支持。同时整个竞赛现场分为PPT演讲区和比赛准备区。
本赛道地点定于安徽工业经济职业技术学院。
硬件组:
参赛队员根据竞赛要求,使用指定的竞赛用电脑和竞赛平台(或自带),竞赛用电脑由竞赛组委会统一提供。
硬件平台:国产AI边缘计算平台
操作系统:国产操作系统
编程语言:Python3、C++
注:比赛现场提供PC一台,仅用于上传要求提供的比赛过程及结果资料。
十、成绩评定
本科软件组评分标准如下:
竞赛内容
竞赛考核要求
成绩占比
大数据
平台部署
根据要求完成大数据平台的部署,并能够对部署的平台参数进行调整以及测试平台的可用性,对多个平台进行联调、联测,实现数据在不同的平台中进行流转。
15%
大数据预处理
对给定的数据(数据可能不完整、不一致、重复、含噪音等)进行预处理,使得数据准确、完整、一致、可用,并能够对数据格式进行转换。
30%
大数据分析
在已搭建好的大数据平台上进行数据分析。
20%
大数据可视化
对给定数据进行可视化展示,并能对可视化结果进行解释说明。
综合题
对给定的数据集,参赛选手综合应用大数据预处理、大数据分析与挖掘等技术,求解一个给定的问题。
高职软件组评分标准如下:
大数据平台
搭建与运维
编程
对比赛数据进行爬取、去重、清洗和统计(对提供样本目标进行爬取、去重、清洗和统计);对提供的样本数据进行排序、二次排序、平均值、分类统计计数、join联接、倒排索引等基本算法分析,并完成其他要求的统计分析;从基础数据开始自行设计完成一个完整的项目分析过程。
数据可视化
根据环境提供的通用Python图形库、Echarts库、d3.js库、BI工具等实现如下内容:利用提供平台对数据进行静态分析得到相应的分析结果,并进行数据呈现的解释。
将比赛中要求的分析部分,按照合理的方式对方法、流程和结果进行适当的分析。
10%
创意组评分标准如下:
评价内容
说明
选题定位
⑴创意与独创性
⑵落地转化可行性
社会价值
⑴用户需求贴合度
⑵效率提升的明确表现
⑶市场价值及推广性
技术能力
⑴技术综合能力
⑵任务处理效果
现场答辩
根据现场表现情况打分
(二)人工智能现场赛
人工智能基础环境搭建部署
样本数据
预处理
对给定的样本数据(图片、文本或者数值数据),检测和去除数据集中的噪声数据、重复数据和无关数据,处理遗漏数据,去除空白数据域,标准化、归一化、二元化数据以及特征提取等处理。
传统机器学习算法设计
及应用
典型传统机器学习算法的设计应用。包含但不限于逻辑回归、支持向量机、决策树、Kmeans等,根据题目或场景,选用机器学习算法利用Sklearn或者其它机器学习框架训练模型,实现分类、聚类算法并解决问题。
深度学习算法设计及应用
人工智能技术综合应用
数据集加载及预处理
利用PyTorch完成指定数据集的加载,对给定样本数据进行预处理,如检测和去除重复数据等。
模型构建及训练
对于传统机器学习算法及深度学习算法的构建及训练。包含但不限于逻辑回归、Kmeans、神经网络等,根据题目或场景,通过对指定机器学习算法进行调参,解决分类或聚类问题。
模型加载及预测
综合分析
文档协作能力、总结分析能力。
硬件组评分标准如下:
国产AI边缘计算平台开发环境的使用
离线数据AI算法处理
对视频、文本或语音等离线数据,利用指定传统图像处理、传统机器学习或深度学习算法/模型按要求进行处理并展示。考核功能包括图片/视频中图像处理、物体检测识别,文本分类、中文分词、语音唤醒等。
在线数据AI算法处理
利用摄像头、麦克风等外设获得实时视频、语音等数据,利用指定传统图像处理、传统机器学习或深度学习算法/模型按要求进行处理并展示。考核功能包括视觉测量、语音识别等。
AI交互
利用摄像头、麦克风等外设获得实时视频、语音等数据,按照要求实现特定功能的人机交互。
十一、奖项设定
按大数据赛道—本科软件组、大数据赛道—高职软件组、大数据赛道—创意组、人工智能赛道—本科软件组、人工智能赛道—高职软件组和人工智能赛道—硬件组分别设置奖项,均以最终入围决赛团队数为基数,按参赛队成绩排序,分别设置一等奖(不超过基数10%)、二等奖(不超过基数20%)、三等奖(不超过基数30%)。为鼓励参赛学校对本项竞赛工作的贡献,组委会将评选优秀组织奖(不超过参赛高校数的20%),评选办法另行通知。
十二、赛项安全
赛事安全是技能竞赛一切工作顺利开展的先决条件,是赛事筹备和运行工作必须考虑的核心问题。大赛秘书处采取切实有效措施,保证大赛期间参赛师生、专家评委、工作人员的人身安全。
(1)比赛环境
大赛秘书处在赛前组织专人对会评现场、交通保障进行考察,并对安全工作提出明确要求,排除安全隐患。
大赛秘书处提供保证突发公共事件应急预案实施的条件,严格控制与参赛无关的易燃易爆以及各类危险品进入会评现场。
(2)生活条件
比赛期间,大赛秘书处保障参赛师生、专家评委及工作人员的饮食卫生安全。
(3)应急处理
(4)处罚措施
参赛队伍有干扰比赛的行为,经赛场工作人员提示,警告无效的,可取消其继续比赛的资格,并禁止参加下一年度的安徽省大数据与人工智能应用竞赛。
因参赛队伍原因造成恶劣影响的,取消其获奖资格。
赛事工作人员违规的,按照相应的制度追究责任。
(5)疫情防控
落实新型冠状病毒感染实施“乙类乙管”后疫情防控要求,参赛人员要遵守基本行为准则,保持社交距离、咳嗽礼仪、清洁消毒等良好卫生习惯。
十三、竞赛须知
(1)参赛队伍、参赛指导教师、领队须知
各参赛队需凭参赛证件进入比赛现场;各参赛队在现场注册时需要提交学校教务部门或院系以上单位的推荐意见(需签章);参赛学校领队对报名资料的真实性和参赛指导老师、学生排序负责。
(2)参赛选手须知
(3)工作人员和志愿者须知
必须服从组委会统一指挥,认真履行职责,做好比赛服务工作;要按照分工准时到岗,尽职尽责做好分内各项工作,保证大赛顺利进行;检查、核准证件,非参赛选手不准进入赛场。同时,要协调好领队、指导教师休息及食宿;比赛出现技术问题(包括设备、器材)时,应及时与比赛负责人联系,及时处理;如遇突发事件,及时向组委会报告,同时做好疏导工作,避免重大事故发生,确保大赛圆满成功;要认真组织好参赛选手的赛前准备工作,遇到重大问题及时与组委会联系,协商解决办法。