五道口 | 基于AI语言模型测度美国对华政策态度

 
点上方“蓝字”关注CIFER,精彩内容别错过

 

前情提要

 

近日,清华大学五道口金融学院讲席教授、国际金融与经济研究中心 (CIFER) 主任鞠建东与清华大学五道口金融学院国际金融与经济研究中心 (CIFER) 博士后研究员李元琨围绕“量化美国对华政策态度”这一议题,基于文本和视频图像数据,运用AI语言模型和微表情模型等前沿AI模型技术,系统性测度了美国对华政策态度。

 

后续将系列推出基于AI语言模型测度美国对华产业政策,基于AI微表情模型测度美国总统对华态度。本次推送将主要介绍基于AI语言模型的构建美国对华政策态度的主要方法和指标验证结果。

 

 

仅供学术研讨绝无不良引导或倾向,请理性阅读

 

PART 01

 

 

摘 要

 

点击标题 阅读文字

 

 

推送运用AI领域前沿的BERT预训练语言模型和机器学习方法,基于美国对华提案文本,利用议员信息和主题分析技术,构建了美国对华政策态度数据库。数据库指标说明,美国对华政策态度在2016年后持续下降,但是在2022年有所回升;美国对华政策态度存在分化,共和党议员对华政策态度的恶化主导了美国对华态度变差;通过测度美国对其他八国的态度发现,美国近年加强了对盟友的友好关系并缓和了其他对立国家的紧张关系;主题分析发现,中国与美国在经济、基础科学、医疗等领域仍然有合作空间,但是对于文化、技术等领域也要注意美国对华的政策打压。美国近年来正在寻求修复盟友和传统对立国的关系,这与美国对华政策态度的急剧下降形成鲜明对比。

 

中美关系是当今世界最重要和最复杂的双边关系,甚至决定了未来几十年的世界经济走势 (Foreign Affairs, 2022) 。但现有对中美问题方面的文献仍然集中在使用分析事件数据的测算方法 (Caliendo & Parro, 2022;Fajgelbaum & Khandelwal, 2021;阎学通和周方银,2004)  。但现有指数主要针对中美双边重大事件进行分析,并未系统性对中美双边关系进行高频结构性量化。国会作为美国政策决策机构的关键一环,其提案文本对于研究美国对外政策具体较强的研究价值。本数据库将以美国对华提案文本作为研究对象,测度美国对华政策态度。

 

 

 

 

 

PART 02

 

 

数据库指标构建

 

点击标题 阅读文字

 

 

1.1 构建思路

 

 

文章数据库构建思路如图1所示,其中共包括7项步骤

 

(1) 爬虫获取文本数据 (共2958个提案,共3756万词) 。(2) 抓取关于中国 (定位词为“China”或“Chinese”)句子,对句子进行BERT模型情感分析,在提案层面对每句包含“中国”的语句BERT模型得分进行加总。(3) 随机抽取600个提案,人工阅读后打正负向标签,计算发现BERT预训练模型准确率为72.76%。 (4) 再次抓取每个提案对台湾、香港、西藏、新疆的态度,并以此作为特征值,分别利用450个提案标签和Catboost模型进行监督学习,得到经过监督学习矫正后的美国对华政策态度。(5) 得到各提案最终美国对华态度,最终交叉验证预测准确率达86.11%。(6) 根据议员信息,将各提案在时间、党派、主题层面进行加总。 (7)根据人工标记的提案主题,再次对提案文本进行监督学习,明确美国对华提案的主题。

 

 

 
 

使用BERT模型的好处有以下两点:(1) 分析文本大数据,更加全面可信。文章涉及的提案文本共3756万词,正如基辛格所说:“重大的提案往往长达上千页,客气地说,能仔细将其读完一遍的议员真是凤毛麟角” (基辛格,2015) ,而采用BERT模型机器学习可以快速的阅读完涉华提案的每一句话,相比以往的仅仅针对个别涉华提案的分析,本数据库对所有涉华提案逐句进行分析,结果更加全面可信。

 

(2) 相对客观准确。 BERT模型是由GOOGLE研究院基于33亿文本语料研发的预训练语言模型,其可以通过上下文精准判断文章语义。既有文献普遍采用情感词典进行情感分析,相比传统情感词典方法,采用BERT语言模型进行以下几点优势。第一,上下文理解能力更强,传统文本词典方法通常只考虑词汇本身的情感倾向,而没有考虑上下文的影响。而BERT模型通过预训练模型学习到了丰富的上下文信息,可以更好地理解词汇在不同语境下的情感倾向。第二,自适应性更强,传统文本词典方法需要手动构建词汇情感词典,这种方法需要人工成本高,而且难以处理新词、多义词等问题。而BERT模型是基于数据驱动的方法,可以自适应地学习到新的语境和情感词汇。第三,精度更高,相对于传统文本词典方法,BERT模型在情感分析任务中通常具有更高的准确性和泛化能力,尤其是在处理复杂的语言现象、多层次的语义结构和文本噪声方面。

 

 

图1 数据库构建思路图

 

 

 

1.2 模型方法介绍

 

文章主要用到Bert模型和Catboost两种模型。BERT模型是2018年10月由Google AI研究院提出的一种预训练模型。BERT的全称是Bidirectional Encoder Representation from Transformers。BERT在机器阅读理解顶级水平测试SQuAD1.1中表现出惊人的成绩: 全部两个衡量指标上全面超越人类,并且在11种不同NLP测试中创出SOTA表现,包括将GLUE基准推高至80.4% (绝对改进7.6%),MultiNLI准确度达到86.7% (绝对改进5.6%),成为NLP发展史上的里程碑式的模型成就。它是基于33亿文本的语料上预训练语言模型。

 

Catboost模型是一种基于树的集成方法,是一个预测率破多项记录的模型。“Cat”是 categorical的缩写,与其他预测模型相比,CatBoost 的最大优势在于直接处理分类变量,CatBoost的这一特性使其成为文章针对分类问题求解预测的理想选择。其他方法将分类变量转换为数值变量较为不方便,而使用CatBoost只需定义分类参数,然后调整超参数即可处理这些分类特征。

 

 

1.3 模型语句示例

 

 文章尝试使用BERT模型,分别选取美国对华特别正向、比较正向、比较负向和特别负向四种态度的四种语句作为例子,展示BERT模型的结果。

 

(1) BERT模型认定正向态度为1的语句为Whereas since the normalization of bilateral relations between the United States and the People‘s Republic of China in the 1970s, the United States has shown good will to the People’s Republic of China by focusing on expansion of bilateral trade while deferring discussions of repayment of the People’s Republic of China ‘s defaulted national debt.该语句来自H.Con.Res. 110提案文本。

 

(2) BERT模型认定正向态度为0.5的语句为China’s Premier, Wen Jiabao, has committed to rectify this serious imbalance by increasing China’s imports of goods and services from the United States.该语句来自H.Con.Res. 72提案。

 

(3) BERT模型认定为负向态度为-0.5的语句The government of the People's Republic of China refuses to renounce the use of force against Taiwan. 该语句来自H.Con.Res. 462提案。

 

(4) BERT模型人认为负向态度为-1的语句为“Whereas the government of the People's Republic of China covered up the outbreak of the coronavirus disease 2019  (commonly referred to as "Covid-19")  during its early stages, resulting in a global pandemic and more than $2,000,000,000,000 in financial damage to the United States.” 该提案来自H.Con.Res. 110。

 

 

 

 

 

 

PART 03

 

 

数据库结果呈现

 

点击标题 阅读文字

 

 

 

 

依照以上方法,我们首先根据美国对华提案文本测度的政策态度,在年度层面上进行加总,并绘制了美国对华政策态度在年度层面变化图。如图2所示,可以发现,美国对华政策态度在2001年-2002年之间随着中国入世,中美关系逐渐好转,但随着“台独”问题的不断发酵,美国对华态度遭到了较大程度的滑坡。在2005年之后,随着中美双边领导人的沟通加强,美国对华态度逐渐好转。尤其是在2007年美国金融危机之后,两国领导人在货币政策协调、全球经济复苏等一系列问题上达成一致,双边关系开始好转。2010年之后,美国对华态度小幅下降后整体趋于稳定,直到2016年及之后,美国对华态度开始陡然下降,并在2020年和2021年达到最低点。但在 2022年,美国对华态度有所回升。

 

图2 美国对华政策态度年度变化图

数据来源:美国国会提案文本及作者分析

 

 

图3将美国对华政策态度在季度层面进行加总,我们可以观察到美国对华态度的更细致变化。可以发现相比美国年度对华态度的变化,每季度对华态度波动增加,这种波动加大尤其是在2005,2008,2016,2019,2020等选举年份或前后变化较大。这也说明美国国会在选举关键年份对华态度出现了较大幅度的不确定性。

 

图3 美国对华政策态度季度变化图

数据来源:美国国会提案文本及作者分析

 

最后,如图4所示,我们将各提案计算的美国对华态度在日度层面进行加总,可以发现,尤其在美国对华态度出现明显恶化的2005, 2008, 2015, 2019, 2020等年份,美国对华态度在日度层面出现较大幅度波动。与此同时,日度层面的高频数据也揭示了,美国对华态度在越负面时,其分化也越加严重,即使在美国对华态度最差的2020年和2021年,美国也存在着对华中立甚至正面提案。针对这一分化趋势,我们进一步分别从党派和主题两方面对其进一步分析。

 

图4 美国对华政策态度日度变化图

数据来源:美国国会提案文本及作者分析

 

 

 

 

 

 

PART 04

 

 

美国对华政策态度指标验证

 

点击标题 阅读文字

 

双重检验方式

课题组通过两种方法简要验证了美国对华政策态度指标。首先,通过阎学通指数对美国对华政策态度进行验证,如图5所示,美国对华政策态度和阎学通指数呈现同期变动,较好地验证了指标的准确性。第二,现有文献普遍认为双边领导人会晤期间,普遍双边关系会处于较好的状态。文章进一步检验了,是否中美双边领导人会晤期间,美国对华政策态度更加正向。如图6所示,红线为中美双边领导人会晤期间美国对华态度,而灰线为非中美双边领导人会晤期间美国对华态度,可以发现,非会晤期间美国对华政策态度普遍高于会晤期间美国对华政策态度。文章还进一步计算了双边会晤和非双边会晤期间美国对华态度的均值,如图7 所示,双边领导人会晤期间 (With Meeting) 美国对华政策态度显著低于非会晤期间(Without Meeting) 美国对华政策态度。

 

图5 美国对华政策态度和阎学通指数对比

数据来源:美国国会提案文本、阎学通指数及作者分析

 

图6 双边领导人会晤期间和非领导人会晤期间美国对华政策态度对比

数据来源:美国国会提案文本、外交部和作者分析。

 

图7 双边领导人会晤期间和非领导人会晤期间美国对华政策态度对比

数据来源:美国国会提案文本、外交部和作者分析。

 

 

 

 

 

 

 

PART 05

 

 

美国对华政策态度的分化

 

点击标题 阅读文字

 

 

下图8分别测度了美国共和党和民主党对华政策态度的分化,其中虚线绘制了共和党议员提出对华提案的政策态度,以此来代表共和党对华政策态度;实线绘制了民主党议员提出对华提案的政策态度,以此来代表民主党对华政策态度。可以发现,民主党议员对华态度相对较为稳定,共和党议员对华态度相对较为激进,尤其是近年来议员对华态度恶化,也主要集中在共和党对华态度恶化,而民主党对华态度的波动幅度却不大。这一描述性特征打破了既往认为 “两党态度一致反华” 的种种论断。

 

图8 美国对华政策态度分化

 

 

下图9和图10描述了美国对华各个主题的提案态度。文章将所有提案分为文化 (Culture) 、经济(Economics) 、“人权” (Humanity) 、军事 (Military) 、医药 (Medical) 、科学(Science) 、技术 (Technology) 等主题分类。从图9 中可以发现,美国对华在经济类提案态度相对较为温和,在“人权”和文化等主题方面对华态度较为激进。图10中可以发现,美国对华在科学和医药类提案对华较为温和,但在技术类对华提案较为激进。这也说明,中国与美国在经济、基础科学、医疗等领域仍然有合作空间,但是对于文化、技术等领域也要注意美国对华的政策打压。

 

图9 各主题分类下美国对华政策态度

 

图10 各主题分类下美国对华政策态度

 

 

 

 

 

 

PART 06

 

 

美国对其他国家的政策态度

 

点击标题 阅读文字

 

 
 

 

为了探究美国对其他国家的政策态度,与中国的政策态度进行对比,文章还同样采取BERT模型和美国涉及其他国家的提案文本进行分析。文章测度了美国对其他八个国家,其中包括,四个与美关系友好国家 (澳大利亚、日本、英国和韩国) ,四个与美关系紧张国家 (伊朗、古巴、朝鲜和俄罗斯) 。图11列示了美国对四个盟国的态度变化。可以发现,与美国友好国家政策态度大多为正,且指数也能补助到双边关系中的大事件 (比如2019年英国脱欧和北爱尔兰问题上的分歧等) 。图12列示了美国对四个对立国家的态度变化。与美国关系紧张的国家,美国对其政策态度普遍为负,并且也能捕捉到近年来的重大事件发生 (比如2022年俄乌冲突发生后,美国对俄罗斯政策态度急剧下降) 。

 

值得注意的是,尤其是2019年以来,美国近年来对盟友和对立国家的态度均在改善。而图12中的变化图也显示,美国近年来除对俄罗斯之外,对其他传统对立国的态度开始缓解。事实上,近年来美国在缓解其他对立国家的态度也采取了诸多措施。比如2021年,美国总统拜登表示,他愿意恢复与伊朗的外交关系,并解除一些制裁措施,以便恢复伊核协议。又比如,2021年拜登政府也曾表示,他们愿意与朝鲜进行外交谈判,并寻求通过外交途径改善与朝关系。图11和图12说明了美国近年来正在寻求修复盟友和除俄罗斯外传统对立国的关系,这与图1美国对华政策态度的急剧下降形成鲜明对比。

 

 
 

 

 

 

 图11 美国对四个盟友国家的态度变化

 

 

 

图12 美国对四个对立国家的态度变化

 

 

 

 

 

 

 

 

 

PART 07

 

 

结 语

 

点击标题 阅读文字

 

 

 

课题组采用BERT模型和Catboost模型,基于美国对华提案文本,测算了美国对华政策态度。指标发现,美国对华政策态度自2016年及之后,美国总统上台后美国对华态度开始陡然下降,并在2020年和2021年达到最低点,而在2022年期间,美国对华态度有所回升。美国国会在选举关键年份对华态度出现了较大幅度的不确定性。共和党和民主党对华政策态度存在分化,民主党议员对华态度相对较为稳定,共和党议员对华态度相对较为激进,尤其是近年来议员对华态度恶化,也主要集中在共和党对华态度恶化。中国与美国在经济、基础科学、医疗等领域仍然有合作空间,但是对于文化、技术等领域也要注意美国对华的政策打压。美国近年来正在寻求修复盟友和传统对立国的关系,这与美国对华政策态度的急剧下降形成鲜明对比。

 

 

 

 

 

 

 

 
 
 

 作者介绍

 

鞠建东

 
清华大学五道口金融学院讲席教授,中国国际贸易研究会  (CTRG) 主席,清华大学五道口金融学院国际金融与经济研究中心 (CIFER) 主任、绿色金融研究中心 (CGFR) 主任、跨境数字资本研究中心 (IDC) 主任,上海财经大学国际工商管理学院特聘教授;2014-2017年担任上海财经大学国际工商管理学院院长、教授,2009-2015年担任清华大学经济管理学院教授、国际经济研究中心主任,2007-2009年任国际货币基金组织常驻学者,1995-2014年担任美国俄克拉荷马大学 (University of Oklahoma) 经济系助理教授、副教授、终身教授;获南京大学数学学士、清华大学经济学硕士、美国宾夕法尼亚州立大学经济学博士。鞠建东教授的研究领域集中在国际贸易、国际金融和产业组织,在American Economic Review, Journal of International Economics, Journal of Monetary Economics, American Economic Journal等国际一流学术杂志上发表多篇论文,曾获2016年浦山世界经济学优秀论文奖,2020年教育部第八届高等学校科学研究优秀成果奖 (人文社会科学) 著作论文奖经济学类一等奖,2021年被北京市教育委员会认定为“北京高校优秀专业课 (公共课) 主讲教师”,2023年其主讲的《中美贸易争端和全球化重构》课程入选第二批国家级一流本科课程。

 

 

李元琨

 
清华大学五道口金融学院博士后研究员,清华大学五道口金融学院国际金融与经济研究中心 (CIFER) 助理研究员,武汉大学经济学博士。研究方向为贸易政策与技术竞争。曾在World Economy, Economic Analysis and Policy, Pacific-Basin Finance Journal, Emerging Markets Finance and Trade, Journal of  Environmental Management等SCI/SSCI 期刊上发表论文。曾获 2022年联合国贸发会议和全球商务学会最佳论文提名奖 (Top 5 nominees of the 2022 UNCTAD-AIB Award) ,中国社会科学院2021年度优秀对策信息研究类三等奖。先后参与过教育部哲学社科重大攻关项目、国家社科基金项目等课题研究。

 

 
 
 

 

编辑:夏之薇

 
 

清华大学五道口金融学院国际金融与经济研究中心(CIFER):

 

成立于2017年11月,依托于清华大学五道口金融学院,专注于国际金融、国际贸易以及全球治理问题的研究。它以"集聚英才、扎根中国、服务世界;用思想建设新世界"为使命,致力于成为中国和世界最优秀国际经济学者的研究与交流平台,推动国际经济学理论的发展与应用;产出服务国家战略、促进全球发展的研究成果。

 

声明:本平台原创文章未经授权,不得转载;本平台所用图片部分来自网络,图片版权属于原作者。

 
 

阅读原文

了解更多

 

 

 

分享、在看与点赞

总有一个是你想点的~