欢迎各位代表参加CCIR2020!

测评活动  CCIR 2020评测:疫情期间网民情绪识别

一、背景简介

新型冠状病毒(COVID-19)感染的肺炎疫情牵动着全国人民的心,全国同舟共济、众志成城,打响了一场没有硝烟的疫情阻击战。习近平指出:要鼓励运用大数据、人工智能、云计算等数字技术,在疫情监测分析、病毒溯源、防控救治、资源调配等方面更好发挥支撑作用。为了帮助政府掌握真实社会舆论情况,科学高效地做好防控宣传和舆情引导工作,本赛题针对疫情相关话题开展网民情绪识别的任务。

1.任务主题:疫情期间网民情绪识别

2.主办单位:北京市经济和信息化局、中国计算机学会大数据专家委员会

3.承办单位:北京市大数据中心
        中科大智慧城市研究院(芜湖)
        北京市政交通一卡通有限公司
        数联众创

4.战略合作:北京智源人工智能研究院

5.协办单位:中国科学院计算技术研究所
        中国中文信息学会信息检索专业委员会
        中国图象图形学学会可视化与可视分析专委会
        百度地图
        美团
        百度人工智能开发平台
        中关村科技软件
        九次方大数据信息集团有限公司
        中科天玑

6.参赛报名、评测提交及结果发布平台:

DataFountain (https://www.datafountain.cn/competitions/423?CCIR2020)

二、任务描述

1.任务:给定微博ID和微博内容,设计算法对微博内容进行情绪识别,判断微博内容是积极的、消极的还是中性的。

2.数据简介:数据集依据与“新冠肺炎”相关的230个主题关键词进行数据采集,抓取了2020年1月1日—2020年2月20日期间共计100万条微博数据,并对其中10万条数据进行人工标注,标注分为三类,分别为:1(积极),0(中性)和-1(消极)。

3.提交要求:参赛者以csv文件格式,提交模型结果到DataFountain竞赛平台,平台进行在线评分,实时排名。目前平台仅支持单文件提交,即所有提交内容需要放在一个文件中。

4.提交示例:每支队伍需在提交最终结果截止时间之前,提交评测集的最终结果。最终结果文件命名为“队伍名称-final.csv”,编码采用UTF8统一编码,格式形如:

测试数据id   情感极性

09568   1

37361   0

....

5.评测标准:本赛题采用Macro-F1值进行评价。详细评分算法如下:

  其中,TP是真样例,FP是假样例,FN是假样例,通过以上公式得到该类F1值,将每一类F1值求平均,即得到Macro-F1值。

三、时间轴

报名参赛地址:https://www.datafountain.cn/competitions/423?CCIR2020

第一阶段:

  •  2月22日:发布大赛预先方案,发布赛题,开放预先报名;

  •  2月28日:发布数据,开放评测;

  •  2月23日-4月10日:算法赛道第一阶段A榜评测,可持续报名;

  •  4月12日:算法赛道第一阶段B榜评测;

  •  2月23日-4月12日:方案赛道第一阶段,可持续提交方案作品;

  •  4月11日:截止报名、组队;

  •  4月13日-4月22日:晋级资格审核;

第二阶段:

  •  4月下旬:封闭赛事,使用内部数据进一步研究;

  •  4月下旬:答辩评审、颁奖;

注意:赛程将根据大赛实际组织情况调整。

四、奖励

• 大赛奖项:每道赛题评选一等奖、二等奖、三等奖各一名;

• 奖金奖品:每道赛题一等奖价值1.5万元奖金/奖品,二等奖价值1万元奖金/奖品,三等奖价值5千元奖金/奖品(税前);

• 合作机会:获奖团队有机会与大赛各组织单位进一步合作,促进方案落地应用。

    版权所有:@2020 西安电子科技大学 计算机科学与技术学院 西安市大数据与视觉智能重点实验室