赛题解读 | 清洁能源之电力+移动数据指导充电桩点位算法赛
作者: 贵阳大数据交易所 编辑: 蔺弦弦 时间:2023-02-23 10:30:13
近日,由贵阳大数据交易所主办,贵州电网有限责任公司协办的“数据场景应用创新大赛”—条数据赛道“清洁能源之电力+移动数据指导充电桩点位算法赛”解读及答疑活动在线上成功举办。贵州电网有限责任公司数据运营管理助责朱昌会对赛题进行了详细解读,并围绕参赛选手及团队提出的问题进行了答疑解惑。(详情视频点击这里~)
—赛题解读—
结合应用实际,探索能源应用解决方案
在全球能源危机和环境危机严重的背景下,我国政府积极推进新能源汽车的应用与发展。当前,电动汽车已成为发展前景广阔的绿色交通工具之一,充电桩作为电动汽车的能量补给装置,可安装于公共建筑和居民小区的停车场或充电站内,为各种符合充电连接标准的电动汽车充电,是发展电动汽车的重要配套充电基础设施。
去年8月,贵州电网有限责任公司与贵阳大数据交易所共同打造的全国首个电力大数据专区,结合电量、电价、电费三个维度,共搭建了覆盖4大类28个权威电力数据产品的产品体系。其中,电力大数据专区上架的“充电桩装载情况”产品反映出贵阳区域内充电桩利用率低、运营成本高、车桩比较低等现状。
作为大赛协办方,贵州电网有限责任公司致力于有效解决充电桩实际应用问题,积极参与本次大赛条数据赛道“清洁能源之电力+移动数据指导充电桩点位算法赛”设计。
在赛题设置上,大赛公布了贵阳市近期部分城区的充电桩区域分布、耗电量等基础数据,展示区域内充电桩的基本使用情况,贵州电网有限责任公司联合移动公司提供了近五个月充电桩周边的人流量等辅助数据,为大赛的参与者提供赛务保障。
深挖数据价值,提升高效出行服务品质
鼓励参赛选手们各尽其能,大力挖掘其它外部数据,采用人工智能等先进技术手段进行模型构建,精准预测充电桩的用电需求分布,为搭建适度超前、布局均衡、智能高效的充电基础设施体系提供高价值参考。
本次大赛以赛为媒、以赛聚才、以赛促用,汇聚全国数据领域的智慧和创新力量,充分挖掘数据创新优秀人才,共同为广大电动汽车车主提供更加便捷、高效的出行服务,这也是南方电网公司一贯秉承的“人民电业为人民”的企业宗旨。
此次大赛的获奖团队将获得万元奖金及培训认证、数据服务等各类优质权益奖励,还有机会获得包括产业政策扶持、高价值数据资源使用权益以及创投基金的投资机会,获奖作品将在2023年5月举办的国际大数据产业博览会上进行全方位展示。
目前,大赛组委会正面向全国科研院所、高校、企业征集招募参赛团队,共同探索数据场景的创新应用,激活数据要素潜能。
爽爽的贵阳欢迎您的到来,期待您的加入!
—答疑环节—
Q:训练集数据范围扩大、需预测结果月份缩减为两个月,预测月份减少是否会影响最终评分公平性?
A:训练集数量增加可以更有利于参赛队伍的模型的训练,通常更多的数据会得到更好的数据分析模型,对最终的比赛结果是有益的。关于预测月份减少,不会影响最终的评审,评审标准是:对每个地点2个月的耗电量,使用均方误差MSE作为评价指标,对全部地点的均方误差求和作为赛题总指标;误差越低,排名越高。评价指标判别结果与真实结果的偏离程度,模型是否预测精准。
Q:人流量指标的含义是什么?
A:首先是以网格为区域进行划分,在每个网格中都有相应的运营商基站,每个手机到基站覆盖范围内,都可以被基站接收到,因此基于网格中基站数据,并在此基础上做一定去重处理后可以得到人流数据。更详细的内容,选手们可以了解“通讯行程卡”,他们之间的统计逻辑是相类似的。
Q:人流量指标为什么只有七月份之后的,七月份以前的没有?
A:由于国家相关部门对于移动公司的相关要求,运营商不允许存储的数据时间超过六个月,所以我们在规定的范围之内提供的数据最长周期只有六个月。
Q:新增加的数据有个“网格”表,其中四个loc的地址分别表示什么?新的数据是对应网格id变了,其他没变吗?
A:网格表中四个loc表示的是网格四个角点的WGS-84经纬度坐标,是对应每个网格的具体地理位置。新的数据提供了174个网格的模拟电量和人流量数据,相比之前一批数据只有62个网格,大量扩充了训练数据,有益于赛题解答。在第二批数据中,由于范围扩大,所以网格标号也相应变化,并且网格划分的时候考虑了地形,是疏密有别的,所以从编号上看,与第一批数据相比,同一个编号的网格不是对应的同一个位置,自然耗电量和人流量数据也有一定变化。但是对赛题解答思路没有影响,给出的仍是各个网格对应的耗电量和人流量数据,只是在数据月份数量上有一定调整,需要各位选手对模型做出相应改变。
Q:新增的网格id,有没有方向性指导,比如求面积,还是根据位置看相关性?
A:考虑到为各个参赛队伍寻找补充数据提供便利,新增的网格id对应提供了四个角点的WGS-84经纬度坐标,通过地理辅助信息,各位选手可以充分挖掘其他数据参与模型构建,得到更为精准的预测数据。
Q:补充额外数据有什么建议?
A:选手们可以充分发挥能力,寻找额外数据资源来丰富模型构建。选手们可以关注贵阳大数据交易所在专题数据中上线的“政府数据开放专区”寻找数据资源,专区中免费开放了“交通运输”“气象服务”“地理空间”等数据,选手们可以充分发挥智慧,充分考虑该专区数据能够为赛题解答带来的有益贡献。
Q:移动人流量与使用新能源汽车的用户有关联吗?
A:移动数据人流量和充电桩数据有关联,人流量数据直接反映了时段内区域范围中有多少人停留过,人流量越大的区域潜在的用电需求更大。
Q:贵阳大数据交易所官网的电力数据专区里面的数据都需要申请面议价格,里面的数据可以给参赛选手开放吗?
A:本次赛题主要聚焦在充电桩点位,我们已经根据赛题需求提供了对应区域的模拟耗电量数据。而在贵阳大数据交易所官网上线的电力数据专区,目的在于与各方共建数据应用场景,其中协商交易的数据来源于真实数据,需满足国家数据安全管控要求及公司内部数据管控要求,且专区中设计产品也与本次赛题关联性较小,因此电力数据专区数据暂时不在这次大赛中提供。
Q:容量的具体业务含义指什么?计量单位是什么?
A:用电容量指的是区域用到的最大电功率,目前提供的容量是在真实用电数据基础上以一定规则变化包装之后的用户预留用电容量总和。计量单位为千伏安,千伏安是电力学里面比较常见的单位。
Q:预测电量消耗的实际意义在哪里?
A:预测电力消耗的意义,从赛题角度来看,我们希望能够甄选出有能力的选手,在解决充电桩利用率低、运营成本高,车桩比较低等实际问题上提供有效解决思路,为广大电动汽车车主提供更加便捷、高效的出行服务贡献力量。另一方面,在比赛之后,会遴选出一批优秀算法及优质队伍,这些队伍将有机会获得包括产业政策扶持、高价值数据资源使用权益以及创投基金的投资机会。
Q:电动汽车充电受温度影响这么大,数据是实际数据吗?能知道车在南方还是北方吗?
A:提供的数据是具有代表性的,数据只是在真实用电数据基础上以一定规则变化后得到的模拟数据,贵州属于南方,目前我们提供的数据是贵阳区域的数据。
Q:请问分数高就排名高吗?
A:现在评判标准是误差越小排名越高,在打榜截止之后,会把现在的排名分数变换成0到50分形成初赛分值,如果排名较高,初赛分值也会较高,初赛分值加决赛答辩路演分值,最终得出总分值。