智源导读:12月10日,Nature Index 发布了其 AI 增刊(Nature Index AI supplement),该刊分别使用了Nature Index(自然指数)数据和规模更大的Dimensions数据库,对全球范围内的人工智能学术研究做了分析和排名。但根据两个数据库的排名,中国的名次变化有点大,前者在美、英、德之后,位居第四;而后者则远超其他国家,雄踞第一。
仔细分析这两种数据排名,我们发现:中国在 AI 方向确实已经处于前沿地位,但我们在将 AI 应用于传统基础学科上仍有欠缺。这种欠缺,除了提示我们应当更加注重基础研究外,或许也告诉我们的 AI 专家们:在传统学科中或许有更多可探索的新天地,而非仅仅局限在 AI 的核心任务上。
简单来说,根据自然指数数据显示,2015年至2019年期间,尽管中国在自然指数论文库中的数量迅速增加(2019年论文数量增长到了2015年的340%),但仍排在美、英、德之后,位居第四。这里可以看到美国的 Share (后文解释含义)要大于2~10名全部总和。
图 1:自然指数的国家排名
然而,根据规模更大的 Dimensions 数据库,AI领先的国家和地区显然不同。中国在2015-2019年间的出版物以 318534的数量雄踞第一,而印度则以91563的数量排名第三。
图2:基于Dimensions Data的国家排名
这种差别的原因在于,自然指数数据分析聚焦在指数所追踪的82本高质量自然科学期刊上发表的AI相关文章的数量,这些期刊主要覆盖化学、物理、生命科学、地球与环境科学等。因此依据自然指数数据的排名,更强调的是 AI 在化学、物理、生命科学、地球与环境科学等方面的应用。
而Dimension相对则更为广泛,包括人工智能相关的各种期刊和会议论文,可追踪到所有领域AI相关文章的发表情况。
两相对比,更突显了:尽管中国的 AI 研究在总体上居于世界第一(以出版物数量来说),但在化、物、生、地等传统学科中的应用却是短板。
01 Dimensions Data 中的中国 AI
使用Dimensions Data,Nature Index AI不仅分析了每个国家的排名,还给出更为详细的研究机构的 AI 100 排名。在这个榜单上,来自中国的研究机构主导了前十强机构。
前 10 名中有 7 家来自中国的高校/科研单位:清华大学(第一)、中国科学院大学(第二)、上海交通大学(第三)、北京航空航天大学(第四)、浙江大学(第五)、哈尔滨工业大学(第六)、电子科技大学(第八)。
而前100强机构中,中国占到 39 家。
名词 | 研究机构 | 国家/地区 | 出版物2015–2019 |
1 | 清华大学 | 中国 | 11,867 |
2 | 中国科学院大学 | 中国 | 8,835 |
3 | 上海交通大学 | 中国 | 8,796 |
4 | 北京航空航天大学 | 中国 | 8,605 |
5 | 浙江大学 | 中国 | 8,337 |
6 | 哈尔滨工业大学 | 中国 | 8,315 |
7 | 南洋理工大学 | 新加坡 | 6,985 |
8 | 电子科技大学 | 中国 | 6,954 |
9 | 斯坦福大学 | 美国 | 6,609 |
10 | 麻省理工学院 | 美国 | 6,314 |
11 | 东南大学 | 中国 | 6,180 |
12 | 东京大学 | 日本 | 6,058 |
13 | 华中科技大学 | 中国 | 6,048 |
14 | 伦敦大学学院 | 英国 | 5,988 |
15 | 武汉大学 | 中国 | 5,797 |
16 | 北京理工大学 | 中国 | 5,641 |
17 | 北京大学 | 中国 | 5,612 |
18 | 哈佛大学 | 美国 | 5,553 |
19 | 密西根大学 | 美国 | 5,464 |
20 | 西安交通大学 | 中国 | 5,364 |
21 | 国防科技大学 | 中国 | 5,361 |
22 | 西安电子科技大学 | 中国 | 5,277 |
23 | 新加坡国立大学 | 新加坡 | 5,269 |
24 | 西北工业大学 | 中国 | 5,261 |
25 | 多伦多大学 | 加拿大 | 5,205 |
26 | 卡内基·梅隆大学 | 美国 | 5,192 |
27 | 佐治亚理工学院 | 美国 | 5,123 |
28 | 北京邮电大学 | 中国 | 5,010 |
29 | 牛津大学 | 英国 | 4,951 |
30 | 伦敦帝国理工学院 | 英国 | 4,915 |
31 | 天津大学 | 中国 | 4,914 |
32 | 安娜大学安娜 | 印度 | 4,838 |
33 | 加州大学伯克利分校 | 美国 | 4,754 |
34 | 慕尼黑工业大学 | 德国 | 4,551 |
35 | 东北大学 | 中国 | 4,436 |
36 | 剑桥大学 | 英国 | 4,423 |
37 | 中国科学技术大学 | 中国 | 4,368 |
38 | 华盛顿大学 | 美国 | 4,359 |
39 | 伊利诺伊大学香槟分校 | 美国 | 4,282 |
40 | 华南理工大学 | 中国 | 4,239 |
41 | 加州大学洛杉矶分校 | 美国 | 4,179 |
42 | 苏黎世联邦理工学院 | 瑞士 | 4,152 |
43 | 大连理工大学 | 中国 | 4,143 |
44 | 同济大学 | 中国 | 4,112 |
45 | 加州大学圣地亚哥分校 | 美国 | 4,083 |
46 | 悉尼新南威尔士大学 | 澳大利亚 | 4,080 |
47 | 中山大学 | 中国 | 4,058 |
48 | 南加州大学 | 美国 | 4,050 |
49 | 约翰·霍普金斯大学 | 美国 | 4,014 |
50 | 悉尼大学 | 澳大利亚 | 3,860 |
另一方面,如果是按照增长速率进行排名的话,中国高校/单位近乎呈现一种霸榜的态势,在前 25 个发展最快的机构中,有 23 个来自中国,而仅有 2 个来自美国:
名次 | 研究机构 | 国家/地区 | 出版物2015 | 出版物2019 | 2015-19年变化 | 变动2015–19(%) |
1 | 中国科学院大学 | 中国 | 653 | 3,236 | 2,583 | 395.6% |
2 | 清华大学 | 中国 | 1,629 | 3,418 | 1,789 | 109.8% |
3 | 电子科技大学 | 中国 | 699 | 2,451 | 1,752 | 250.6% |
4 | 上海交通大学 | 中国 | 1,124 | 2,692 | 1,568 | 139.5% |
5 | 浙江大学 | 中国 | 1,166 | 2,644 | 1,478 | 126.8% |
6 | 东南大学 | 中国 | 711 | 2,099 | 1,388 | 195.2% |
7 | 西北工业大学 | 中国 | 500 | 1,804 | 1,304 | 260.8% |
8 | 哈尔滨工业大学 | 中国 | 1,158 | 2,340 | 1,182 | 102.1% |
9 | 北京航空航天大学 | 中国 | 1,172 | 2,339 | 1,167 | 99.6% |
10 | 北京邮电大学 | 中国 | 500 | 1,660 | 1,160 | 232.0% |
11 | 华中科技大学 | 中国 | 806 | 1,953 | 1,147 | 142.3% |
12 | 北京理工大学 | 中国 | 680 | 1,824 | 1,144 | 168.2% |
13 | 西安电子科技大学 | 中国 | 640 | 1,765 | 1,125 | 175.8% |
14 | 武汉大学 | 中国 | 709 | 1,821 | 1,112 | 156.8% |
15 | 中山大学 | 中国 | 414 | 1,513 | 1,099 | 265.5% |
16 | 天津大学 | 中国 | 568 | 1,621 | 1,053 | 185.4% |
17 | 哈佛大学 | 美国 | 710 | 1,709 | 999 | 140.7% |
18 | 北京大学 | 中国 | 785 | 1,711 | 926 | 118.0% |
19 | 国防科技大学 | 中国 | 655 | 1,578 | 923 | 140.9% |
20 | 中南大学 | 中国 | 314 | 1,219 | 905 | 288.2% |
20 | 斯坦福大学 | 美国 | 943 | 1,848 | 905 | 96.0% |
21 | 中国科学技术大学 | 中国 | 548 | 1,421 | 873 | 159.3% |
22 | 西安交通大学 | 中国 | 720 | 1,591 | 871 | 121.0% |
23 | 重庆大学 | 中国 | 369 | 1,239 | 870 | 235.8% |
24 | 深圳大学 | 中国 | 314 | 1,182 | 868 | 276.4% |
25 | 东北大学 | 中国 | 502 | 1,366 | 864 | 172.1% |
02 自然指数中的中国 AI
正如上文所说,自然指数的数据来源,是 82 本涵盖化学、物理、生命科学、地球与环境科学的高质量自然科学期刊,因此基于它所分析的 AI 现状,主要考虑 AI在这些领域中的应用情况。
首先需要强调一下它的排名计算方式。
1)count:对于一篇论文,如果作者中有一个以上来自中国,那么中国的count数就加 1(所以有两个也是加 1);不管文章有多少作者,都是如此。这也就意味着,同一篇文章可以给多个国家/地区或机构的count数做贡献。
2)share:假如每篇文章的share 数值为 1,那么每个作者将均分这个总额。例如一篇有10人合作者的论文,每个作者的share值将为 0.1,因此作者所隶属的单位或国家的share值便加 0.1。
从前面图 1 中可以看出,美国无论是在count,还是share上都远超中国;甚至 share值大于2-10名的国家之和。
自然指数还排名了前 100 强机构,前20名如下,中国仅有中国科学院入榜:
排名 | 机构 | 国家/地区 | 2015–2019 Share | 2015–2019 Count | 国际文章(%) |
1 | 哈佛大学 | 美国 | 331.08 | 937 | 57.0% |
2 | 斯坦福大学 | 美国 | 257.90 | 629 | 54.4% |
3 | 麻省理工学院(MIT) | 美国 | 209.04 | 620 | 59.4% |
4 | 马克斯·普朗克学会 | 德国 | 167.98 | 628 | 83.0% |
5 | 牛津大学 | 英国(UK) | 132.34 | 495 | 85.3% |
6 | 剑桥大学 | 英国(UK) | 130.68 | 485 | 84.9% |
7 | 中国科学院 | 中国 | 130.00 | 492 | 73.2% |
8 | UCL | 英国(UK) | 129.70 | 415 | 77.1% |
9 | 纽约市的哥伦比亚大学(CU) | 美国 | 127.56 | 386 | 61.9% |
10 | 国立卫生研究院(NIH) | 美国 | 122.69 | 302 | 52.0% |
11 | 纽约大学(NYU) | 美国 | 117.40 | 353 | 67.4% |
12 | 华盛顿大学 | 美国 | 110.68 | 338 | 59.8% |
13 | 普林斯顿大学 | 美国 | 107.92 | 254 | 52.8% |
14 | 加州大学伯克利分校(UC Berkeley) | 美国 | 107.54 | 329 | 54.1% |
15 | 加州大学圣地亚哥分校(UC San Diego) | 美国 | 100.63 | 297 | 59.6% |
16 | 宾夕法尼亚大学 | 美国 | 98.54 | 296 | 59.8% |
17 | 约翰·霍普金斯大学(JHU) | 美国 | 85.80 | 285 | 52.3% |
18 | 耶鲁大学 | 美国 | 83.95 | 273 | 64.5% |
19 | 加州理工学院(Caltech) | 美国 | 83.59 | 205 | 57.1% |
20 | 多伦多大学 | 加拿大 | 83.27 | 290 | 84.5% |
考虑到2015年至2019年的增速,中国也仅有中国科学院和清华大学入榜:
排名 | 机构 | 国家/地区 | 2015–2019 share | 2015–2019 count | 2015-19 count变化 | 2015–19share变化(%) |
1 | 哈佛大学 | 美国 | 89.44 | 273 | 41.68 | 87.3% |
2 | 斯坦福大学 | 美国 | 76.03 | 187 | 39.94 | 110.6% |
3 | 麻省理工学院 | 美国 | 61.77 | 171 | 34.28 | 124.7% |
4 | 加州大学伯克利分校 | 美国 | 35.99 | 101 | 28.57 | 385.1% |
5 | 中国科学院 | 中国 | 40.69 | 173 | 26.69 | 190.7% |
6 | 加州大学圣地亚哥分校 | 美国 | 31.33 | 105 | 21.30 | 212.3% |
7 | 加州大学旧金山分校 | 美国 | 27.17 | 76 | 20.17 | 288.2% |
8 | 耶鲁大学 | 美国 | 28.32 | 78 | 19.41 | 218.1% |
9 | 加州大学洛杉矶分校 | 美国 | 24.19 | 90 | 18.18 | 302.8% |
10 | 马克斯·普朗克学会 | 德国 | 46.71 | 173 | 17.67 | 60.8% |
11 | 宾夕法尼亚大学 | 美国 | 30.33 | 85 | 16.72 | 122.9% |
12 | 剑桥大学 | 英国(UK) | 33.06 | 124 | 16.53 | 100.0% |
13 | 清华大学 | 中国 | 16.73 | 75 | 14.63 | 696.5% |
14 | 瑞士苏黎世联邦理工学院 | 瑞士 | 24.61 | 76 | 14.33 | 139.4% |
15 | 宾夕法尼亚州立大学 | 美国 | 16.63 | 40 | 13.72 | 471.1% |
16 | 伦敦帝国理工学院 | 英国(UK) | 18.13 | 82 | 13.67 | 306.1% |
17 | UCL | 英国(UK) | 35.36 | 108 | 13.49 | 61.7% |
18 | 康奈尔大学 | 美国 | 20.90 | 85 | 13.23 | 172.3% |
19 | 亥姆霍兹德国研究中心协会 | 德国 | 23.37 | 113 | 12.54 | 115.8% |
20 | 杜克大学 | 美国 | 24.22 | 69 | 12.47 | 106.1% |
比较有意思的是,自然指数还进行了医疗机构的 AI 排名,前十名全部来自美国。这说明,医疗 AI 在美国很有市场。
排名 | 机构 | 国家/地区 | 2015–2019 Share | 2015–2019 Count | 国际文章(%) |
1 | 哥伦比亚大学欧文医学中心(CUIMC) | 美国 | 68.25 | 216 | 54.2% |
2 | 威斯康星大学医学 | 美国 | 49.31 | 154 | 48.1% |
3 | 杜克大学卫生系统 | 美国 | 38.32 | 115 | 46.1% |
4 | 加州大学圣地亚哥分校健康科学 | 美国 | 35.59 | 139 | 54.0% |
5 | 麻省总医院(MGH) | 美国 | 32.00 | 194 | 56.2% |
6 | 纽约大学朗格尼医学中心(NYULMC) | 美国 | 31.34 | 114 | 58.8% |
7 | 加州大学洛杉矶分校健康 | 美国 | 30.75 | 127 | 59.1% |
8 | 德克萨斯大学西南医学中心(UT Southwestern Medical Center) | 美国 | 27.97 | 62 | 48.4% |
9 | UCSF健康 | 美国 | 27.18 | 110 | 40.0% |
10 | 斯隆·凯特琳纪念癌症中心(MSKCC) | 美国 | 26.02 | 78 | 60.3% |
03 总 结
Nature Index的排名并非是对中国 AI 的否定,而Dimensions Data的出版物数量也不能说明中国 AI 已经引领。
图 3:2015-2019年间,六个国家(中、美、印、德、英、法)在 Share 和出版物数量上的增长情况
正如许多AI报告指出,中国在论文数量上占据优势,但平均引用量却低于世界平均水平。例如《AI 指数报告》统计发现,2019 年来自中国的论文被引用量比世界平均水平低约 20%,而来自美国的论文被引用量比世界平均水平高约 40%。
“仅仅是大量的、没有持久影响的原始论文并不是真正有用的,跟上技术前沿更重要。”牛津大学人类未来研究所研究中国 AI 战略的 Jeffrey Ding 博士说。
这两种数据排名的对比告诉我们,中国在 AI 方向确实已经处于前沿地位,但我们在将 AI 应用于传统基础学科上仍有欠缺。这种欠缺,除了提示我们应当更加注重基础研究外,或许也告诉我们 的AI 专家们:在传统学科中或许可以探索更多的新天地,而非仅仅局限在 AI 的核心任务上。