全国政协委员贺晗:未来数字经济要拼的是“智能”
中国网财经3月5日讯(记者 畅帅帅)近日,中共中央、国务院印发了《数字中国建设整体布局规划》,提出到2025年基本形成横向打通、纵向贯通、协调有力的一体化推进格局,数字中国建设取得重要进展;到2035年,数字化发展水平进入世界前列,数字中国建设取得重大成就。
2023年全国两会3月4日至13日在京举行。首次当选全国政协委员的天娱数科董事、副总经理贺晗在接受中国网财经专访时表示,未来数字经济要拼智能的,建议构建开放共享协同的人工智能产业生态体系,推动我国数字经济高质量发展。
作为数字科技领域的实践者,您认为人工智能、虚拟现实等新技术如何带动数字经济的发展?
贺晗:AI(人工智能)是数字经济“皇冠上的明珠”,如果AI的技术落后了,国家力推的数字经济也会打折扣,甚至落伍。
未来数字经济要拼智能的,我觉得这一点应该引起重视,比如在数字经济里,像集成电路、工业互联网等目前重点发展的行业,它是跟人工智能高度相关的。再比如说在传统产业方面,物流行业、传统能源行业的数字化改造都是跟人工智能高度相关的。
在虚拟现实方面,其实核心不是脱实向虚,而是虚实结合、以虚促实。因为发展虚拟现实一方面也需要关键数字技术的突破,比如我们现在在做的像虚拟数字城,要通过三维重建深度学习动作等技术来提升虚拟数字人沉浸交互的一些体验。
同时在数字基础设施上也要有一些投入提升,比如说大规模的算力集群、图像渲染、模型训练等。
此外,目前虚拟现实跟商业文旅城市这些领域也在不断地结合,比如说现在虚拟数字人在电商直播、在线培训、服务咨询等很多场景开始替代真人,实现降本增效。
近日,中共中央、国务院印发《数字中国建设整体布局规划》,首次提出“2522”的整体框架进行布局加快发展数字经济,您认为将会在哪些方面推动中国数字经济发展?
贺晗:把“2522”拆开,其实就是推动数字经济发展的主要方面。
第一个数字“2”代表的是数字基础设施和数据资源体系。这几年数字基础设施提得比较多,数据资源体系应该是第一次跟数字设施基础设施并列在一起提出来的。去年的“东数西算”实际上是数字基础设施的部分,而“数据20条”是数据资源体系的部分。
在这次“数字中国”的顶层规划里面,就是把两个关键点并列到了一起。
第二个数字“5”就是文件提到的“五位一体”。前面两个“基础”,是数字产业化的部分,后面“五位一体”是产业数字化的部分,推动数字技术跟经济工业生态进行深度融合。
当前产业数字化的部分在数字经济中占比是最多的,去年是占比接近82%,而且比例还在逐步提高,是更强的增长动力。产业数字化的核心是通过数字对5个方面进行升级改造,提升全要素生产率,这其实也是目前推动高质量发展的主要方式。
第三个数字“2”是文件提到的“两大能力”,即可信可控、自立自强的。自立自强是针对比较重点的,或者是已经“卡脖子”、有潜在“卡脖子”风险的技术。可信可控是指在数字安全、网络安全方面可信可控。
最后一个数字“2”是两个环境,也是两个关键词。一个是国内的公平规范,第二个是国际的循环,就是开放。开放共赢、公平规范主要是数字治理的生态,涉及到产业体系、法律法规等方面。
近期,ChatGPT火爆出圈,您认为中国人工智能产业发展与发达国家的存在哪些差距? ChatGPT为何没有出现在中国?
贺晗:我们要反思,为什么ChatGPT没有在我国诞生?从技术角度看,人工智能的核心是数据+算法+算力,ChatGPT就是用海量的数据和海量的算力对算法模型进行长期重投入的训练升级,来系统性地提升基础技术能力,看似很“基础”,但在这背后,需要一个完善的人工智能产业生态体系来支撑。在这方面,我们有三处短板:
一是公共数据开放太少,产业数据共享太弱。美国在2009年已建立全国性的公共数据开放平台data。gov,整合了来自各公共部门、各级政府、自愿参与的企业与大学的所有开放数据,截至目前已有33.5万个数据集,涉及农业、商业、教育、能源、制造业、科研等多个领域。我国数据开放起步晚、进展慢,目前公共数据公开以地方为主,没有全国平台,“数据孤岛”问题突出。发达国家有全球最多的人工智能产业开源数据集,涵盖了自然语言处理、图像识别等大部分人工智能研究方向,而我们高质量的开源数据集凤毛麟角。
二是开源体系建设仍处在起步阶段,基础薄弱。发达国家有成熟的开源生态,通过在开源平台以协同开发的模式,集结了全球开发者的智慧,在算法开发效率和创新速度上占尽优势。ChatGPT的出现就是很好的例子,它也不是从零开始的,而是在谷歌Transformer模型基础上迭代多次发展而来,也是站在全球众多开源贡献者的肩膀上才出现的。全球最大的开源平台GitHub掌握在微软公司手里,平台上开源贡献者从2017年的1000万增长至目前的1亿人,积累了超2亿的代码库。中国是GitHub的第二大贡献者,GitHub已成了我们开发人员标配的生产力工具。开源无国界,但开源平台背后的公司是有国界的,虽然目前相安无事,但我们要警醒。
三是企业端智能算力成本高。对于大量进行模型训练和推理的科技企业来说,算力的瓶颈并不体现在算力的绝对规模上,而在于实现目标算力的成本,而这一成本又与芯片技术密切相关。自去年英伟达高端GPU芯片对中国供应受限后,国内智能算力也受到了严重影响。
如何弥合其中差距?
贺晗:我认为主要围绕三方面展开。一是加快推动数据要素高效流通使用。因地制宜,加快构建国家层面公共数据开放体系,深入推动公共数据跨层级、跨地域、跨部门有序共享和开发利用,释放公共数据红利。鼓励市场主体探索和完善数据定价体系,用市场化的手段推动数据要素的流通交易,对于数据要素在流通、交易、应用等环节产生的新业态、新模式、新技术,在守住法律底线的前提下,建立弹性包容、鼓励创新的治理机制与市场环境。
二是加快推动开源体系建设。大力弘扬共建共创共享的开源文化,营造有利于开源发展的环境。完善开源知识产权和法律体系,为开源生态建设提供良好的制度基础。通过规划指引、揭榜挂帅、试点示范、财政补贴、税收优惠、产业基金等方式,加强企业主导的产学研深度融合,鼓励企业围绕开源社区运营、开源代码托管平台建设、开源数据集建设、开源项目孵化等关键点进行长期投入。
三是加快推动智能算力体系建设。鼓励相关企业围绕训练、推理等人工智能领域实际算力需求,建设专用行业云及融合赋能应用平台,鼓励推出算力共享、算力错峰等新业务模式进一步降低算力成本,实现普惠包容算力。加快智能算力集群建设,引导新建数据中心打造智能算力中心,鼓励引入国产化GPU、ASIC等异构算力。
世界上现有的技术可以实现电影《头号玩家》中的游戏场景吗?
贺晗:应该还没有实现。虽然相关领域内的国际头部公司都有在搭建虚拟的场景,实现虚实的互动,但是效果离《头号玩家》仍然有较大的差距。其实这也是属于底层基础设施方面的差距,比如《头号玩家》场景中有大量的数据连接传输的需求,它需要非常高性能的通信网络,目前的5G网络还不能支撑起来。
第二个是虚拟人的层面。《头号玩家》中主人公是靠大脑意识来驱动他游戏中的虚拟形象,所以从具体技术点上,比如说脑机接口的技术,虽然国际上也在研究发展,但是离完全实现仍有不短的距离。