第三届泰迪杯技能赛赛后分享总结
今天泰迪杯官方公布了第三届泰迪杯技能赛的获奖状况,个人小组A题得到了二等奖,B题得到了一等奖。做为第一次参加这个比赛的小白,仍是感到比较幸运的。下面就来复盘一下此次的比赛和分享一下作题经历。python
对本次竞赛的一些见解
经过此次的比赛,我感受参赛方主要考察的是你们利用各类工具解决问题的能力,毕竟一道题目的时间限制为12个小时,你们没必要把问题太过复杂化,感受本身用Excel解决这个问题更顺手就用Excel,用python画图简单就用python,主要是能在规定时间内获得一个较好的答案,不管哪一步均可以作的比较简单,包括最后的提交报告,虽然是很是重要的一环,可是不用写的过于复杂,主要是表达清晰,能够看作是一个很简化的数学建模论文。
泰迪杯技能赛分为A,B两道题目。由于竞赛的颁奖是按照报名人数的比例颁奖,因此建议参赛的同窗也最好把两道题都作了,这样获奖几率会大不少。
今年的A题难度明显要高于B题,咱们组在作A题的时候也遇到了不少的困难,尤为是任务3须要用到一些特定的算法,因为种种缘由,到晚上7点(8点截止)咱们也没有获得一个比较好的结果,因为对时间的把控失误,最后剩给咱们写报告和整理支撑材料的时间只剩下了40分钟。着急提交了论文以后以为获奖无望,因而咱们毅然决定在次日继续作B题。最后很幸运两道题目均有获奖。
算法
B题复盘
因为当时作A题的时候草草结尾,时间过去一个多月,不少记忆和比赛资料也都丢失了,这里就只能给你们复盘一下B题。
B题的背景是当下世界最关心的话题:新冠疫情。简单分析题目以后解题重点就尤其突出:处理数据、可视化。
固然这也正是这类比赛的考察重点。大多数这类比赛的前期数据处理都较为复杂,此次竞赛的A题也是如此,可是此次的B题不同,队友利用pandas对数据进行清洗查看后,发现数据并没有异常,惟有在“A 市涉疫场所”表中出现一行重复数据,猜想是由于在同一天的同一地点报告了两例病例,故 视为正常数据。所以,咱们直接着手对数据进行分析和处理。任务1.1-1.3偏向于一个定解问题,利用python中的group by函数能够进行处理,其中任务1.3须要对该日住院人数进行定义,而后将问题的结果作成表格展现在报告中。
任务1.4有一个须要注意的点在于:第六天具备传播性且未被收治的感染者,应为第七天和八天被通报的确诊者,第十天具备传播性且未被收治的感染者,应为第十一天和十二天被通报的确诊者。只要理解了这个点,剩下的就很简单了,把对应的确诊者的坐标找到,而后做图画出,这里做图仍是尽可能以简洁美观为要点。下面展现第十天疫情传播风险区域图:
到这里任务1就圆满解决了,你们能够看出任务1的解决是相对简单的,我认为任务1要点就是完成度要高,结果展现清晰,分析合理。
对于任务2,这里就不得不提到竞赛方提供的一个能够用于可视化大屏制做的BI平台。咱们小组的任务2就是在第一题处理的数据基础上,彻底依赖于BI平台制做的可视化大屏。(竞赛方的意思是可使用任何软件工具,可是他都已经提供了这么一个平台,我大胆猜想固然是用这个比较好)
制做可视化大屏的基本框架是来源于赛前培训的汽车销售大屏。内容方面是参考丁香医生的表达内容。
相关的分析也就是彻底照着可视化大屏的内容,有什么说什么。
任务3就相对比较开放,须要对疫情发展阶段进行划分,为了对世界不一样地区在不一样阶段的标志参数的特色进行分析,咱们定义了新冠疫情标志性参数:
后面的工做就是根据这些指标,进行数据的处理,数据的可视化,而后根据可视化结果进行简单分析。下面是在Jupyter Notebook 上作的图:
框架
关于报告写做
报告的写做必定是很重要的一点,由于不管你过程作的多好,评委也只能看到你提交的报告,因此真正决定你获奖高低的必定是最后报告中体现的内容。
报告必定要从比赛一开始就着手去写,和数学建模比赛同样,能够有一个同窗专门负责记录整理你们的思路和撰写报告,报告不须要太复杂,我认为报告必定是在能完整表达出本身的结果和内容的基础上,以清晰简洁为重。下面是咱们组报告的目录:
问题重述、任务假设、任务解决三点足矣表达清楚整个解题流程和思想。
最重要的部分可能就在于数据可视化,俗话说一图胜千文,其实咱们组的可视化部分也不是特别精美,还有不少值得改进的地方,你们在写报告的时候多多插入能表达结果或思考内容的表格、可视化图片或是流程图,对于整个报告的质量提高仍是会有很大帮助的。
函数
我的心得与题外话
我的认为这个比赛有好的地方:某种程度上比数学建模的强度更大,由于要在12个小时内完成全部工做,但它的题目仍是相对简单的,获奖比例也较高,相信各位不管是新手仍是大佬,只要作好准备,和队友努力做战两天,应该仍是能够得到好成绩,固然最主要的是能够获得锻炼。
很差的地方也有:主办方提供的数据不必定符合常理;竞赛官网常常拉闸,连续三届比赛提交题目的时候官网都很卡,主办方也所以一再延长提交时间,你们要对突发状况多点耐心;提供的建模平台和BI平台bug也有不少,咱们组的A题就是由于建模平台给搞砸了,但B题又由于BI平台而出彩,但不管怎样,若是想获奖,你们仍是多多去学习一下赛前培训。
不出意外的话,会有看到这篇文章的小伙伴会来找我要原始报告看看,其实我已经把报告中大部分展现的内容在B题复盘中展现了,并且这个竞赛的报告相对简单,你们仍是要突出本身的元素。这里就提早狠心拒绝了。
距离比赛结束也有一个月了,可能博客中有的地方表达不清晰或者有错误,欢迎指正。最后祝你们下次比赛取得理想成绩!
工具