比赛-以企业为服务目标的政策大数据应用
2021-01-11 本文已影响0人
致Great
报名链接:https://www.kesci.com/home/competition/5fcef670807ccb002cb62113
赛题&数据
赛题题目
以企业为服务目标的政策大数据应用
赛题背景
对于小型企业来说,掌握政策动向,对于政策积极响应,并且结合政策的落实调整战略有助于企业自身拓展业务,增加营收。对于大型企业来说,政策的掌握不光能够为企业创收,并且有助于大型企业承担其应有的社会责任。企业对于政策的响应和反馈也有利于政策风向调整,使得政府效率提升,更好地服务大众。因此借助数字化的手段分析和管理政策是一个有意义的研究方向。
赛题任务
本次任务提供重庆地区的政策信息,参赛者需要合理运用文本处理技术与自然语言处理技术,对于提供的信息进行分析。通过分析政策文本,总结政策趋势,结合企业相关的信息,讨论包括但不限于如下问题:
- 重庆地方企业政策趋势及其特点
- 疫情下的企业与政策特点
- 量化评价政策在协助企业发展方面的效用
- 在政策影响下的地方企业活力特点
探究此类问题鼓励参赛队伍深入了解地方政策特点与地方经济与企业特点,获取其他公开政策信息与数据进行综合分析,利用数据做观点支持,对于用政策精益化服务企业提出建设性方案。本次任务原则上鼓励参赛队伍大胆创新,对于政策指导方式建言献策,敢于对政策服务企业相关的数据与信息在相关性和因果性上进行大胆的假设和严谨的探究与论证。
赛题数据
- 重庆地区网页政策文本
- 其他地区政策文本
- 企业工商信息
数据使用
- 本赛题提供的数据将会以数据集的形式分发到比赛平台中
- 数据提供方授权参赛人员使用提供的数据进行指定比赛的模型训练工作,参赛人员不得将数据用于任何商业用途
- 数据集位置:报名后,在数字重庆平台的页面右上角 工作台 > 数据源 > 他人共享 > 政策板块数据,点击文件一栏显示有相关数据集;
- 数据使用方式:
- 项目添加:在数字重庆平台的页面右上角 工作台 > 右上角 加号 > 创建项目 > 添加数据源 > 他人共享 > 选择政策板块数据添加 > 创建
- 数据源添加:政策板块数据页面右上角 创建项目 > 创建
- 工作台 ModelWhale使用:请参考用户手册
数据说明
- 重庆地区网页政策文本
- 数据为 utf-8 格式的 CSV 文本文件
- 政策内容均为带有 CSS 式样的 HTML 内容,参赛者需自行提取有用的文本信息,并进行数据清洗。
- 字段说明表
字段名 | 数据类型 | 说明 |
---|---|---|
id | int(11) | id 列 |
title | varchar(180) | 标题 |
srcName | varchar(255) | 来源名称 |
srcUrl | varchar(255) | 来源Url |
policyFileType | varchar(120) | 政策类别。1,申报通知;2,项目征集;3,公示名录;4,政策解读;5,政府文件 |
issuedNumber | varchar(120) | 发文字号 |
writtenDepartment | varchar(255) | 发文机构 |
publishDepartment | int(11) | 机构类别。1,政府,2,科技,3,经信委,4,发改,5,财税,6,商务,7,农业,8,市场监管,9,金融,10,国资,11,工商联,12,人社,13,其他 |
level | int(11) | 适用级别。1,国家,2,省市 |
policyPublishDate | varchar(120) | 发文日期 |
executionStartDate | varchar(120) | 实施开始日期 |
executionEndDate | varchar(120) | 实施结束日期 |
onlineStartDate | varchar(120) | 网上截止开始日期 |
onlineEndDate | varchar(120) | 网上截止结束日期 |
applyStartDate | varchar(120) | 纸质材料开始日期 |
applyEndDate | varchar(120) | 纸质材料结束日期 |
tagValues | varchar(120) | 主题标签。1,成果转化;2,资金扶持;3,资格资质;4,人才引育;5,双创投资;6,减税降费;7,资源共享;8,知识产权;9,其他;10,技术创新;11,疫情政策;12,营商环境 |
content | longtext | 政策内容 |
isConfirm | int(1) | 是否人工确认;0 否 1 是 2 不推送 |
isPost | int(4) | 是否已推送;0 否 1 是 2 推送失败 |
updateTime | timestamp | 入库时间 |
country | varchar(240) | 适用地区(国家地区行政编吗) |
supportIndustry | varchar(120) | 所属行业 |
keyWord | varchar(500) | 关键词 |
supportDirection | varchar(120) | 扶持方向 |
accossry | varchar(800) | |
supportProfession | varchar(120) | 所属产业 |
summary | varchar(1500) | 摘要 |
- 其他地区政策文本
- 数据为 utf-8 格式的 json 文本文件
- 包含其他地区的相关政策以及发布的 URL
- json格式说明表
字段名 | 说明 |
---|---|
bbd_url | 链接地址 |
policy_org | 发文机构 |
policy_title | 标题 |
policy_code | 发文字号 |
pubdate | 发布日期 |
substr_title | 标题精华 |
policy_province | 所属省份 |
policy_theme | 政策主题 |
policy_industry | 所属行业 |
- 企业工商信息
- 数据为 utf-8 格式的 json 文本文件
- 包含重庆当地企业的工商信息
- json 格式说明表
字段名 | 说明 |
---|---|
regno_or_creditcode | 注册号/统一社会信用代码 |
credit_code | 统一社会信用代码 |
regno | 注册号 |
company_name | 企业名称 |
company_type | 类型 |
frname | 法定代表人 |
frname_compid | 法定代表人唯一ID |
regcap | 注册资金 |
realcap | 实收资本 |
esdate | 成立日期 |
approval_date | 核准日期 |
opento | 营业期限至 |
address | 注册地址 |
operate_scope | 经营范围 |
regorg | 登记机关 |
enterprise_status | 登记状态 |
parent_firm | 派出企业名称 |
regcapcur | 注册币种 |
operating_period | 经营期限 |
bbd_history_name | 历名名称 |
company_industry | 行业分类 |
regcap_currency | 注册资本_币种 |
realcap_currency | 实收资本_币种 |
company_province | 省份_映射结果 |
company_enterprise_status | 登记状态_映射结果 |
company_companytype | 企业类型代码 |
company_regorg | 登记机关代码 |
ipo_company | 上市公司标识 |
company_county | 企业注册地行政区划代码 |