新型冠状病毒(COVID-19)感染的肺炎疫情牵动着全国人民的心,全国同舟共济、众志成城,打响了一场没有硝烟的疫情阻击战。习近平指出:要鼓励运用大数据、人工智能、云计算等数字技术,在疫情监测分析、病毒溯源、防控救治、资源调配等方面更好发挥支撑作用。为了帮助政府掌握真实社会舆论情况,科学高效地做好防控宣传和舆情引导工作,本赛题针对疫情相关话题开展网民情绪识别的任务。
1.任务主题:疫情期间网民情绪识别
2.主办单位:北京市经济和信息化局、中国计算机学会大数据专家委员会
3.承办单位:北京市大数据中心
中科大智慧城市研究院(芜湖)
北京市政交通一卡通有限公司
数联众创
4.战略合作:北京智源人工智能研究院
5.协办单位:中国科学院计算技术研究所
中国中文信息学会信息检索专业委员会
中国图象图形学学会可视化与可视分析专委会
百度地图
美团
百度人工智能开发平台
中关村科技软件
九次方大数据信息集团有限公司
中科天玑
6.参赛报名、评测提交及结果发布平台:
DataFountain (https://www.datafountain.cn/competitions/423?CCIR2020)
1.任务:给定微博ID和微博内容,设计算法对微博内容进行情绪识别,判断微博内容是积极的、消极的还是中性的。
2.数据简介:数据集依据与“新冠肺炎”相关的230个主题关键词进行数据采集,抓取了2020年1月1日—2020年2月20日期间共计100万条微博数据,并对其中10万条数据进行人工标注,标注分为三类,分别为:1(积极),0(中性)和-1(消极)。
3.提交要求:参赛者以csv文件格式,提交模型结果到DataFountain竞赛平台,平台进行在线评分,实时排名。目前平台仅支持单文件提交,即所有提交内容需要放在一个文件中。
4.提交示例:每支队伍需在提交最终结果截止时间之前,提交评测集的最终结果。最终结果文件命名为“队伍名称-final.csv”,编码采用UTF8统一编码,格式形如:
测试数据id 情感极性
09568 1
37361 0
....
5.评测标准:本赛题采用Macro-F1值进行评价。详细评分算法如下:
其中,TP是真样例,FP是假样例,FN是假样例,通过以上公式得到该类F1值,将每一类F1值求平均,即得到Macro-F1值。
报名参赛地址:https://www.datafountain.cn/competitions/423?CCIR2020
第一阶段:
• 2月22日:发布大赛预先方案,发布赛题,开放预先报名;
• 2月28日:发布数据,开放评测;
• 2月23日-4月10日:算法赛道第一阶段A榜评测,可持续报名;
• 4月12日:算法赛道第一阶段B榜评测;
• 2月23日-4月12日:方案赛道第一阶段,可持续提交方案作品;
• 4月11日:截止报名、组队;
• 4月13日-4月22日:晋级资格审核;
第二阶段:
• 4月下旬:封闭赛事,使用内部数据进一步研究;
• 4月下旬:答辩评审、颁奖;
注意:赛程将根据大赛实际组织情况调整。
• 大赛奖项:每道赛题评选一等奖、二等奖、三等奖各一名;
• 奖金奖品:每道赛题一等奖价值1.5万元奖金/奖品,二等奖价值1万元奖金/奖品,三等奖价值5千元奖金/奖品(税前);
• 合作机会:获奖团队有机会与大赛各组织单位进一步合作,促进方案落地应用。