全国信息检索学术会议 CCIR2020 测评活动

欢迎各位代表参加CCIR2020！

测评活动　　CCIR 2020评测：疫情期间网民情绪识别

一、背景简介

新型冠状病毒（COVID-19）感染的肺炎疫情牵动着全国人民的心，全国同舟共济、众志成城，打响了一场没有硝烟的疫情阻击战。习近平指出：要鼓励运用大数据、人工智能、云计算等数字技术，在疫情监测分析、病毒溯源、防控救治、资源调配等方面更好发挥支撑作用。为了帮助政府掌握真实社会舆论情况，科学高效地做好防控宣传和舆情引导工作，本赛题针对疫情相关话题开展网民情绪识别的任务。

1.任务主题：疫情期间网民情绪识别

2.主办单位：北京市经济和信息化局、中国计算机学会大数据专家委员会

3.承办单位：北京市大数据中心
　　　　　　　　中科大智慧城市研究院（芜湖）
　　　　　　　　北京市政交通一卡通有限公司
　　　　　　　　数联众创

4.战略合作：北京智源人工智能研究院

5.协办单位：中国科学院计算技术研究所
　　　　　　　　中国中文信息学会信息检索专业委员会
　　　　　　　　中国图象图形学学会可视化与可视分析专委会
　　　　　　　　百度地图
　　　　　　　　美团
　　　　　　　　百度人工智能开发平台
　　　　　　　　中关村科技软件
　　　　　　　　九次方大数据信息集团有限公司
　　　　　　　　中科天玑

6.参赛报名、评测提交及结果发布平台：

DataFountain (https://www.datafountain.cn/competitions/423?CCIR2020)

二、任务描述

1.任务：给定微博ID和微博内容，设计算法对微博内容进行情绪识别，判断微博内容是积极的、消极的还是中性的。

2.数据简介：数据集依据与“新冠肺炎”相关的230个主题关键词进行数据采集，抓取了2020年1月1日—2020年2月20日期间共计100万条微博数据，并对其中10万条数据进行人工标注，标注分为三类，分别为：1（积极），0（中性）和-1（消极）。

3.提交要求：参赛者以csv文件格式，提交模型结果到DataFountain竞赛平台，平台进行在线评分，实时排名。目前平台仅支持单文件提交，即所有提交内容需要放在一个文件中。

4.提交示例：每支队伍需在提交最终结果截止时间之前，提交评测集的最终结果。最终结果文件命名为“队伍名称-final.csv”，编码采用UTF8统一编码，格式形如：

测试数据id 情感极性

09568 1

37361 0

....

5.评测标准：本赛题采用Macro-F1值进行评价。详细评分算法如下：

　　其中，TP是真样例，FP是假样例，FN是假样例，通过以上公式得到该类F1值，将每一类F1值求平均，即得到Macro-F1值。

三、时间轴

报名参赛地址：https://www.datafountain.cn/competitions/423?CCIR2020

第一阶段：

　　•　　2月22日：发布大赛预先方案，发布赛题，开放预先报名；

　　•　　2月28日：发布数据，开放评测；

　　•　　2月23日-4月10日：算法赛道第一阶段A榜评测，可持续报名；

　　•　　4月12日：算法赛道第一阶段B榜评测；

　　•　　2月23日-4月12日：方案赛道第一阶段，可持续提交方案作品；

　　•　　4月11日：截止报名、组队；

　　•　　4月13日-4月22日：晋级资格审核；

第二阶段：

　　•　　4月下旬：封闭赛事，使用内部数据进一步研究；

　　•　　4月下旬：答辩评审、颁奖；

注意：赛程将根据大赛实际组织情况调整。

四、奖励

• 大赛奖项：每道赛题评选一等奖、二等奖、三等奖各一名；

• 奖金奖品：每道赛题一等奖价值1.5万元奖金/奖品，二等奖价值1万元奖金/奖品，三等奖价值5千元奖金/奖品（税前）；

• 合作机会：获奖团队有机会与大赛各组织单位进一步合作，促进方案落地应用。

主办单位

中国计算机学会

中国中文信息学会

承办单位

协办单位

西安电子科技大学计算机科学与技术学院
西安电子科技大学经济与管理学院
西安市大数据与视觉智能重点实验室
陕西省电子学会
陕西省计算机学会
ACM西安
CCF西安分部

赞助单位

版权所有：@2020 西安电子科技大学计算机科学与技术学院西安市大数据与视觉智能重点实验室