【数据集】最新上市公司创新信息披露(1991-2023年)
数据简介:与传统词典法不同,本文采用“种子词集+Word2Vec相似词扩充”方法构建描述性创新信息指标。参考相关文献[11,28],对年报多次研读校验得到种子词集。相较于传统词法,Word2Vec神经网络模型可以根据语义信息将词汇转换为多维向量,并通过计算向量的相似度得到相似词。本文采用其中的CBOW(ContinuousBag-of-wordsModel)模型对中文语料进行训练。描述性创新关键词如见下表所示。
在构建描述性创新关键词词集后,本文以年报中描述性创新信息的总词频/年报总词频衡量描述性创新信息披露水平。在此基础上,本文采用当年除目标企业外其余同行企业描述性创新信息披露水平的算术平均数衡量同行描述性创新信息披露水平(Inno_Dis)。
数据来源:人工整理
时间跨度:1991-2023年
数据范围:中国A 股上市公司
包含字段:
证券代码 | 证券简称 |
年份 | 企业创新信息披露 |
样例数据:
下载链接(6W+数据):https://download.csdn.net/download/li514006030/90575884