5.4 数据资源和算力资源的挑战

5.4 数据资源和算力资源的挑战

对于训练多种类型人工智能系统来说拥有高质量数据资源至关重要。联邦政府通过投资建设共享公共数据集以促进人工智能创新。“美国人工智能倡议”呼吁各机构为美国人工智能研发领域的专家、学者和行业机构提供更多可用的联邦数据、模型和算法,让其充分体现价值促进人工智能研发,同时还要保证数据资源安全和稳定,保护公民的自由、隐私和机密,获得公民信任。2018年3月,总统管理议程提出了一个新的跨部门优先(Cross-Agency Priority,简称CAP)事项,视数据为重要战略资产,制定了联邦数据战略(Federal Data Strategy),定义了战略原则和最佳实践行动计划,产生了更加协同一致地使用、访问和管理联邦数据的方式方法。此外,美国国家科学基金会(NSF)正通过树立数据革命理念,采用一种全国性的、联合的、具有凝聚力的方法,牵头开发建设联邦数据基础设施,这将为包括人工智能在内的所有科学与工程研究提供重要转机,为共同推动人工智能新技术取得突破性研究进展、促进科学发展、提高经济竞争力和保护国家安全提供可靠保障。[85]

“美国人工智能倡议”呼吁联邦机构为与人工智能相关的研发和创新配置高性能计算机资源。美国在开发人工智能研究所需高性能计算基础设施方面处于世界领先地位。2018年6月,美国能源部在橡树岭国家实验室推出了代号“顶点”(Summit)的超级计算机,为包括人工智能、能源和先进材料等广泛领域在内的科学研究提供了前所未有的计算能力。2019年5月,美国能源部宣布计划建造代号“前沿”(Frontier)的E级超算,预计2021年首次亮相,成为全球最强大超级计算机,有望使美国在高性能计算和人工智能领域保持领先地位。美国国家航空航天局(NASA)也有一个强大的高端计算项目,并在Pleiades超级计算机上增加了专门为MLAI(机器学习与人工智能委员会)工作负载设计的新节点。2018年,美国国家科学基金会(NSF)斥巨资用于探索、开发和部署一系列促进人工智能技术研发的网络基础设施,其中包括下一代超级计算机Frontera,Frontera位于得克萨斯大学奥斯汀分校,是世界上最快的大学超级计算机。[86]