| 4,208 | 9 | 1934 |
| 下载次数 | 被引频次 | 阅读次数 |
现有文献主要基于专利或研发投入测度企业创新水平进行实证分析,然而专利数量的截断问题和研发投入数据的缺失问题,可能使得实证结果存在系统性偏误。本文基于我国A股上市公司“管理层讨论与分析”(MD&A)文本数据,使用文本分析方法测度上市公司创新活动,克服了对无专利和研发数据缺失企业创新活动进行衡量的难题。结果显示,文本创新指标能够有效反映企业创新水平,与传统创新指标及企业未来经济绩效显著正相关,同时包含传统创新指标未能揭示的额外信息。基于文本分析方法,本文进一步构建了包括绿色、服务、供应链、管理及商业模式5个特定类型的创新指标,并尝试测度企业探索式创新水平,进一步拓展文本创新的应用范畴。本文为全面评估企业创新活动提供了新的研究视角和方法工具,对完善企业创新评价体系具有重要的理论价值和实践意义。
Abstract:Most existing studies measure corporate innovation through patents or R&D investment.However,the truncation of patent data and the absence of R&D investment data may introduce systematic biases into empirical results.This study addresses these issues by using textual data from the Management Discussion and Analysis (MD&A) sections of the China’s A-share listed companies and constructs a novel text-based innovation measure,thereby overcoming the challenges of measuring innovation activities for firms lacking patent and R&D data.The results indicate that the text-based innovation measure can effectively reflect the level of corporate innovation,which is not only positively correlated with traditional innovation indicators and future economic performance,but also contains additional information that traditional innovation indicators fail to reveal.Based on this method,this study also constructs indices for five specific types of innovation:green,service,supply chain,management,and business model.In addition,this study attempts to measure the level of radical innovation to further expand the application of the text-based measure.This study provides a novel research perspective and methodological tool for comprehensively measuring corporate innovation activities,offering both theoretical and practical insights for improving firm innovation evaluation systems.
[1]郭冬梅,王继彬,胡瀚清,等.基于文本的创新测度及对企业绩效的影响研究[J].系统工程理论与实践, 2024, 44(6):1896–1912.
[2]姜付秀,王运通,田园,等.多个大股东与企业融资约束——基于文本分析的经验证据[J].管理世界, 2017, 33(12):61–74.
[3]姜富伟,胡逸驰,黄楠.央行货币政策报告文本信息、宏观经济与股票市场[J].金融研究, 2021, 492(6):95–113.
[4]李成明,周迪,董志勇.资本市场开放推动企业数字化转型了吗?——基于准自然实验和文本分析方法[J].统计研究, 2023, 40(8):96–109.
[5]林乐,谢德仁.分析师荐股更新利用管理层语调吗?——基于业绩说明会的文本分析[J].管理世界, 2017, 33(11):125–145.
[6]沈坤荣,林剑威,傅元海.网络基础设施建设、信息可得性与企业创新边界[J].中国工业经济, 2023(1):57–75.
[7]王靖一,黄益平.金融科技媒体情绪的刻画与对网贷市场的影响[J].经济学(季刊), 2018, 17(4):1623–1650.
[8]吴超鹏,唐菂.知识产权保护执法力度、技术创新与企业绩效——来自中国上市公司的证据[J].经济研究, 2016, 51(11):125–139.
[9]吴非,胡慧芷,林慧妍,等.企业数字化转型与资本市场表现——来自股票流动性的经验证据[J].管理世界, 2021, 37(7):130–144.
[10]谢德仁,林乐.管理层语调能预示公司未来业绩吗?——基于我国上市公司年度业绩说明会的文本分析[J].会计研究, 2015(2):20–27.
[11]姚加权,张锟澎,郭李鹏,等.人工智能如何提升企业生产效率?——基于劳动力技能结构调整的视角[J].管理世界, 2024, 40(2):101–116.
[12]叶初升,孙薇.中国“科技创新困境”再审视:技术创新质量的新视角[J].世界经济, 2023, 46(8):80–107.
[13]张成思,孙宇辰,阮睿.宏观经济感知、货币政策与微观企业投融资行为[J].经济研究, 2021, 56(10):39–55.
[14] Bellstam G, Bhagat S, Cookson J A. A Text-Based Analysis of Corporate Innovation[J]. Management Science, 2021, 67(7):4004–4031.
[15] Byun S K, Oh J-M, Xia H. Incremental vs. Breakthrough Innovation:The Role of Technology Spillovers[J]. Management Science, 2021, 67(3):1779–1802.
[16] Chen Z, Liu Z, Suárez Serrato J C, et al. Notching R&D Investment with Corporate Income Tax Cuts in China[J]. American Economic Review,2021, 111(7):2065–2100.
[17] Durnev A, Mangen C. The Spillover Effects of MD&A Disclosures for Real Investment:The Role of Industry Competition[J]. Journal of Accounting and Economics, 2020, 70(1):101299.
[18] Ellingsen J, Larsen V H, Thorsrud L A. News Media Versus FRED-MD for Macroeconomic Forecasting[J]. Journal of Applied Econometrics,2022, 37(1):63–81.
[19] Gentzkow M, Kelly B, Taddy M. Text as Data[J]. Journal of Economic Literature, 2019, 57(3):535–74.
[20] Hassan T A, Hollander S, Van Lent L, et al. Firm-level Political Risk:Measurement and Effects[J]. The Quarterly Journal of Economics, 2019,134(4):2135–2202.
[21] Hoberg G, Maksimovic V. Redefining Financial Constraints:A Text-based Analysis[J]. The Review of Financial Studies, 2015, 28(5):1312–1352.
[22] Hoberg G, Phillips G. Text-based Network Industries and Endogenous Product Differentiation[J]. Journal of Political Economy, 2016, 124(5):1423–1465.
[23] Lerner J, Seru A. The Use and Misuse of Patent Data:Issues for Finance and Beyond[J]. The Review of Financial Studies, 2022, 35(6):2667–2704.
[24] Li F. The Information Content of Forward-Looking Statements in Corporate Filings—A Na?ve Bayesian Machine Learning Approach[J]. Journal of Accounting Research, 2010, 48(5):1049–1102.
[25] Loughran T, McDonald B. When is a Liability not a Liability? Textual Analysis, Dictionaries, and 10-Ks[J]. The Journal of Finance, 2011, 66(1):35–65.
[26] Loughran T, McDonald B. Measuring Readability in Financial Disclosures[J]. The Journal of Finance, 2014, 69(4):1643–1671.
[27] Mikolov T, Sutskever I, Chen K, et al. Distributed Representations of Words and Phrases and Their Compositionality[J]. Advances in Neural Information Processing Systems, 2013, 26.
[28] Romer P M. Endogenous Technological Change[J]. Journal of Political Economy, 1990, 98(5, Part 2):S71–S102.
[29] Saidi F,?aldokas A. How does Firms’ Innovation Disclosure Affect Their Banking Relationships?[J]. Management Science, 2021, 67(2):742–768.
[30] Schumpeter J A. The Theory of Economic Development[M]. Cambridge, MA:Harvard University Press, 1934.
(1)一方面,专利从申请到授权存在时间差异,因此在数据库涵盖时间的末期都会存在截断问题;另一方面,不同专利价值差异较大,授权人也存在异质性。
(2)本文整理了部分上市公司MD&A文本。因篇幅所限,上市公司年报MD&A文本与创新相关内容以附表1展示,见《统计研究》网站所列附件。下同。
(1)16份文件包括《国家创新驱动发展战略纲要》《国务院关于印发“十三五”国家科技创新规划的通知》《国务院关于促进云计算创新发展培育信息产业新业态的意见》《国务院关于印发“十二五”国家自主创新能力建设规划的通知》《国务院关于创新重点领域投融资机制鼓励社会投资的指导意见》《国务院关于促进加工贸易创新发展的若干意见》《国务院关于大力推进大众创业万众创新若干政策措施的意见》《国务院关于加快构建大众创业万众创新支撑平台的指导意见》《国务院关于印发北京加强全国科技创新中心建设总体方案的通知》《国务院关于印发上海系统推进全面创新改革试验加快建设具有全球影响力科技创新中心方案的通知》《国务院关于强化实施创新驱动发展战略进一步推进大众创业万众创新深入发展的意见》《国务院关于推动创新创业高质量发展打造“双创”升级版的意见》《国务院关于支持自由贸易试验区深化改革创新若干措施的通知》《国务院关于推进国家级经济技术开发区创新提升打造改革开放新高地的意见》《国务院印发关于推进自由贸易试验区贸易投资便利化改革创新若干措施的通知》《国务院关于印发中国落实2030年可持续发展议程创新示范区建设方案的通知》。
(2)因篇幅所限,具体创新术语词表以附表2展示,词云图以附图1展示。
(3)例如,在不添加专业术语词典的情况下,“资产证券化”这一金融术语将被误切分为“资产”和“证券化”两个独立词语。
(4)三大财经词库分别为财经金融词汇大全、财会词汇大全和股票金融词汇。
(5)由于从专利申请到最终授权通常需要较长时间,会导致专利授权数据存在较大滞后性,会存在较为严重的截断问题(Lerner和Seru,2022),考虑到专利技术在申请期就代表了企业发生创新活动,本文采用专利申请数据进行分析。
(1)因篇幅所限,文本创新指标与传统创新指标的拟合关系以附图2展示。
(2)因篇幅所限,有专利申请与无专利申请、有披露和无披露R&D支出数据企业的文本创新分布箱线图以附图3展示。
(3)因篇幅所限,不同分组下的企业文本创新指标的核密度图以附图4展示,文本创新指标的组间差异结果以附表3展示。
(1)企业资产使用企业当年期末总资产的自然对数度量、负债使用企业当年总负债占总资产的比例度量、股权集中度选用企业当年前三大股东持股比例度量、金融资产规模为企业金融资产持有占总资产比例度量、董事会独立性选用企业当年独立董事人数度量。企业所有制为虚拟变量,企业若属于国有企业赋值为1,否则取0。家族企业为虚拟变量,企业若属于家族企业赋值为1,否则取0。
(2)因篇幅所限,各变量定义以及描述性统计以附表4展示。
(1)词与词之间余弦相似度的计算方式如下。一是利用Mikolov等(2013)提出的Word2vec词嵌入(Word Embedding)技术,使用MD&A文本作为原始语料库,利用Skip-gram训练方法将词语映射成低维连续向量空间中的向量,即“词向量”。参考已有文献常用标准,本文选取词向量维度为n=200。二是基于该200维的词向量,计算两个词语之间的余弦相似度(王靖一和黄益平,2018)。根据本文模型的训练结果,“研发”与“创新”两个词的相似度达到0.56,“新技术”与“创新”的相似度为0.60。当然,“创新”与“创新”的相似度为1。因篇幅所限,有关Word2vec算法的具体使用细节见附录1,具体拓展词典额外扩充的创新术语以附表5展示。
(1)借鉴相关文献,本文采用主观赋值对创新术语的创新语义程度进行人工评分。因篇幅所限,具体评分规则及评分情况以附录2及附表6展示。
(2)因篇幅所限,权重计算规则以及含义见附表7,选用不同权重构造文本创新度量对企业绩效影响见附表8~10。
(1)因篇幅所限,具体的不同行业特定类型文本创新特征以附图5展示。
(1)上市公司依据其某类业务的营业收入比重进行行业分类,当企业从事多个不同业务、不能按照上述分类方法确定行业归属的企业,划为综合类行业。
(2)因篇幅所限,探索式创新词典以附表11展示。
基本信息:
DOI:10.19343/j.cnki.11-1302/c.2025.02.006
中图分类号:F832.51;F273.1
引用信息:
[1]谢佳松,樊嘉诚,林建浩.我国上市公司创新活动的测度——基于文本分析的方法[J].统计研究,2025,42(02):70-83.DOI:10.19343/j.cnki.11-1302/c.2025.02.006.
基金信息:
国家自然科学基金面上项目“基于文本大数据的宏观经济实时预测研究”(72073148);国家自然科学基金青年项目“数字经济时代下创新扩散的阻碍因素与突破路径:专利文本测度、隐性壁垒识别与数据驱动机制研究”(72403030);国家自然科学基金青年学生基础研究项目(博士研究生)“媒体叙事对公众预期与经济波动的影响研究——文本数据分析与信息选择建模”(723B2024); 教育部人文社会科学研究青年基金项目“公共数据要素如何赋能企业创新边界拓展:理论框架、测度方法与机制路径研究”(24YJC790199)
2025-03-06
2025-03-06
2025-03-06