1142024年第10期总第61期财务童理光Theory理论
高质量发展视角下乳品企业ESG信息披露研究
基于ESG报告的文本分析
舒惠琪康玉梅
(长江大学经济与管理学院,荆州434023)
摘要:将文本挖掘技术应用于ESG信息披露研究,可以高效、客观地对披露质量进行评估。通过微词云、
ROSTCM6等软件,以高频词分析、语义网络分析、情感分析为切入点,对乳品企业ESG报告进行文本分析,
关键词:文本挖掘;ESG;社会责任;信息披露
0引信Shahi等[]基于监督学习的文本挖掘软件,利用机
器学习方法对文本进行分类,对企业可持续发展报告
2023年12月,中央经济工作会议强调,必须把坚进行自动分析,并将分析结果与实际结果进行对比。
持高质量发展作为新时代的硬道理。高质量发展离不开Liew等[2]通过计算企业社会责任报告的TF-IDF(词频-
披露提出了新要求。企业ESG(环境、社会和公司治对报告进行深入研究。Spijkers[3]建立荷兰公司社会责
吁经济绿色转型的积极响应,有利于满足各方利益相文本挖掘,按比例抽取若干片段,合并调整形成语料
关者的期望与要求,实现“碳中和”的长远愿景。库,计算主观性得分,以此探索企业社会信息披露是否
客观。马文超等[5]利用文本挖掘技术,从个体和上市公
1司群体角度分析了CSR(企业社会责任)报告,认为文
文献回顾
本挖掘技术便利了CSR报告信息获取,为研究建构CSR
断提升。文本挖掘技术是基于文本信息知识发现的过法,从词频、价值词汇编码两个层面对企业社会责任的
程,通过计算机技术,从大量非结构性文本中提取可关键性识别指标进行统计并展开理论验证分析。段钊
用、有价值的信息。由于ESG报告之中文本表述的篇等[7]收集上市公司社会责任报告并进行文本挖掘,提取
幅在不断增加,越来越多国内外学者开始尝试将文本文本特征,对上市公司社会责任信息披露实据性的总
挖掘技术运用到企业社会责任信息披露研究之中。体、结构与分布特征进行了大范围、横纵向与动态分
理论Theory财务童理元2024年第10期总第61期115
析。吴珊和邹梦琪[8]从语调、可读性、报告长度、定量(1)格式转换。利用Python软件中的PDFMiner库,
信息、前瞻性信息5个维度对社会责任文本信息披露质将获取的56份PDF版本的ESG报告转换为TXT格式。
量进行分析。刘艳秋等[9]利用文本挖掘方法,以高频词(2)文