数据分析的最佳实践,南京江北新区创新活力数据分析大赛等你来战

50%的税收、60%的GDP、70%的技术创新和80%的就业——中小企业是扩大就业、改善民生、促进创业创新的重要力量。

但2020年伊始,新冠肺炎疫情风暴席卷中国,各行业实体经济均亦受到强烈的冲击,特别是中小型创新企业,面临着更为严重的生存危机。在疫情背景下,他们自身质量、抗风险能力以及可持续发展能力如何?如何高质量发展?

为了在宏观上建立一套科学而完善的评价体系,南京江北新区管理委员会决定以公司活力指数算法云端征集大赛为载体,通过多元数据的收集清洗,结合舆情治理分析,从而希望获得一套精准有效的“活力指数"模型算法,来发现企业社会贡献与可持续发展价值。

南京江北新区管委员主办的“创新活力数据分析大赛”开赛,正式向全国的数据分析科学家敞开大门,征集一套精准有效的“活力指数"模型算法和数据分析结果,来发现企业社会贡献与可持续发展价值。

赛题亮点

1.首次采用罕见的创投类高质量数据

2.赛事奖金高,获奖名额多、机会大

3.与专业评委大咖近距离接触,结交领域大牛

4.赛事全程培训交流机制,不断提升自我

赛题设置

本赛题须运用数据分析与挖掘,结合数据中含有的特征,测算行业与地区“创新创业活力”。赛题分为以下三个方向:

1、江苏及南京江北新区金融科技领域创业活力指数的分析与评定

2、江苏及南京江北新区生物医药领域创业活力指数的分析与评定

3、江苏及南京江北新区集成电路领域创业活力指数的分析与评定

数据来源:投中网、企查查、上海交易所信息中心、深圳交易所信息中心、南京大学、南京审计大学、数据宝、Wind、董事会、铅笔道、鲸准、36kr、虎嗅、江苏省数据经济商会、南京大学巴菲特价值研究中心。

课题描述:江北新区两题主要考察窄范围内数据分析与挖掘的能力,江苏地区两题主要考察宽范围内数据分析与挖掘的能力。赛题提供江苏地区所有的金融科技与生物医药领域的投融资信息,涉及公司的工商信息,主创人员信息等。参赛选手需要结合创投行业知识,深入分析时间或空间范围内创新创业活力的数据表达以及可能的影响因子。分析手段不限,可通过对比,相关性分析,设计实验等等方式探究创新创业活力相关的主题。最终将所有数据研究成果整理成为一份以 K-Lab notebook 形式呈现的分析报告,报告中包含分析过程与分析结果,以及相关的可视化图表。除所提供数据外,鼓励选手通过其他方式补充数据进行支撑分析。是否对于数据进行充分利用也将是赛题考察的重要环节。

相关单位

主办单位:

南京江北新区管理委员会

承办单位:

南京扬子国资投资集团江北新区中央商务区建设管理办公室

协办单位:

南京数字金融产业研究院有限公司

南京扬子江投资基金管理有限公司

南京江北新区中心区发展有限公司

赛信(南京江北新区)金融科技服务有限公司

上海和今信息科技有限公司(和鲸科技)

本次比赛全程基于和鲸在线数据分析平台K-Lab进行,提供统一集成的云计算环境,不仅将代码内容、Notebook和数据集进行一体化管理,更能让团队中成员无缝参与协作,免去装包之类的繁琐准备工作。和鲸K-Lab具有基于Jupyter Notebook的可视化界面和代码片段功能,对探索式数据分析十分友好,可以直接插入图片、文字和可运行的代码内容,成果展示清晰直观,有效提高数据分析效率。

报名链接:创新活力数据分析大赛​