中国工程院院士刘韵洁回应每经:实体经济需要行业大模型但发展行业大模型要把数据保护好、利用好、管理好

编辑时间:2023-12-08         来源:注塑模具系列         浏览次数:1

  8月18日至19日,由工业与信息化部、宁夏回族自治区人民政府共同主办的2023中国算力大会在宁夏银川举行。

  要让算力充分转化为生产力,还面临哪些阻碍,又应当怎么样才能解决?怎么样能够让算力更便宜更好用?该怎么样提升全国算力网络的协同发展水平?带着这样一些问题,《每日经济新闻》记者在大会期间采访了中国工程院院士刘韵洁。

  刘韵洁是通信与信息系统专家,负责主持建设我国通信与信息领域的首个国家重大科学技术基础设施——未来网络试验设施项目(CENI)。在采访中,刘韵洁也多次提到该项目的成果有助于解决算力产业高质量发展中一些不足。

  记者注意到,就在一个多月前(7月6日),习来到紫金山实验室,仔细地了解推进重大科学技术任务攻关等情况。刘韵洁向汇报了实验室最新的研究进展。

  刘韵洁在2023中国算力大会期间回答记者提问 图片来自:每经记者 张蕊 摄

  NBD:在数字化的经济浪潮下,尤其是目前大模型涌现,算力慢慢的变成了继热力和电力之后的新型生产力,要让算力充分转化为生产力,您认为面临哪些阻碍,我们应当如何解决?

  刘韵洁:大模型出来后,通用大模型能解决的问题、它的智能化远远超出我们原来的水平,所以大家对它非常期盼。

  我国该如何搞,这方面我们该冷静地分析我国在大模型方面、在算力方面、在数据领域、在网络方面等有什么样的问题,这样一些方面都应该从比较深入的、专家层面进行研究分析,通过这样的研究分析来制定出我国的应对措施和办法,而不是现在一看大模型这么火大家都去做大模型,或者是GPU价格涨的厉害大家都去搞GPU。

  当然,不是说这么多东西不能搞,而是要根据我们国家的详细情况,具体需求情况、具体发展步骤等来做顶层设计,统一规划。

  大家都觉得我国在网络方面,在算力方面没问题,5G网络规模我们是全球最大,算力总规模我们是全球第二大,但实际上,我们在很多领域、很多方面还有短板。比如,我国是全球第二大算力国家,但是在应用方面,这些算力资源还没有被充分的发挥出来,还有富余,所以大家不能一窝蜂地去做算力,这要具体问题具体分析。

  尤其像“东数西算”方面,还有什么样的问题要解决,这样一些方面我认为都需要在顶层去思考,需要有数据、有调研、有专家分析,制定出相应的规划,而不是凭感觉,或者不同专家各执一词。

  尤其在目前状况下,国外ChatGPT不断迭代更新,很快ChatGPT5出来,最近还看到谷歌方面关于AI和基因结合的新进展,这样一些方面不断涌现,我国何时也能在这些应用领域不断涌现?这就要求我们冷静分析,不能只是在这方面单纯投资就可以。

  NBD:要让算力能够更好地赋能千行百业,您认为怎么样能够让算力更便宜更好用?

  刘韵洁:我国实施“东数西算”工程,这个政策很好,西部算力的电费比较低,差距很大,东部用户用到西部便宜绿色的能源,是很合理的。

  但是东部用户怎么使用西部的算力,一个办法是需要用网络,尤其是训练大模型的工作。但网络的成本是多大?如果通过现在的互联网去做那是很便宜,但是效率很低,也不安全,传输的数据可能就被别人盗取了,这样一些问题需要解决。另一个办法是专线,专线能确保安全、保证质量,但专线又很贵,大家用不起。

  这就需要有一个新的技术解决方案,一个新型的网络来提供服务。我提出一个新的概念,就算力而言,不管是“东数西算”还是算力网络,需要一个公用专网的技术,也就是提供一种网络技术,像专网一样能够保证安全和质量,又像公网一样经济、方便灵活。

  我国确定了一个未来网络大科学装置,我们叫CENI,这个大科学装置就能提供既便宜又安全的上网服务能力,这方面今年年底准备验收,明年就可提供服务。CENI就能够为我国的算力提供又安全又能保证质量又经济实惠的网络服务。

  为什么会比较便宜?是因为确定性的网络能做到不丢包,在传输文件方面其传输效率比普通网络能大大的提升36倍,这么高的效率就可以把价格降下来。确定性网络技术我认为在全国40个城市已能提供这个服务,可以为我国的“东数西算”、算力网络的建设提供非常好的服务。

  今天我看到有的运营商也宣布建立自己的确定性网络,我认为这都是非常好的,将来会给大家提供更多的选择,更多的好的网络服务。

  刘韵洁:我国的算力网要赶上美国做的这样一个大模型的需求,我认为是需要方方面面协同来发展的。比如,做大模型的或者做行业大模型的都需要数据,如果他没有这一些数据,这个大模型的训练就会受到制约。

  据了解,美国大模型之所以做得比中国好,是因为全球的数据他都爬取了很多遍,他有这个优势,我们在数据方面就没有发挥这个作用。所以数据怎么利用好、管理好、保护好就是一个很大的挑战。

  这些大模型跟算力怎么结合?跟用户的数据怎么结合?就需要网络,假如没有安全、保证质量又便宜的网络,这个训练、使用也会有很多问题,这确实需要方方面面的协同合作,搞网络的、搞模型的、搞应用的、搞数据的,包括搞数据管理的、政府部门等等都要制定相应的政策,大家能形成一盘棋,协同起来才能把这个工作做好。如果只靠某个单一的方面,就会制约我国的算力网络建设。

  NBD:目前,我国算力总规模居全球第二,我国已经是算力大国,从算力大国到算力强国还存在哪些短板?相应地,您觉得应采取哪些措施来补足这些短板?

  刘韵洁:我个人觉得,首先,大模型这方面短板显而易见,美国的ChatGPT3、ChatGPT4一个一个地出来,这个短板要跟上去,除了做大模型,我们在创新方面要提升。

  其次,在数据方面、应用方面,我认为是跟社会都有关系的,大家结合起来才能使得我国的大模型能够更快发展。我个人判断中国的机会是在行业大模型。因我们网络上的数据被美国爬取以后产生的ChatGPT3、ChatGPT4,他们又在爬取视频数据,据说可能不久会出ChatGPT5,下一步他们肯定要爬取行业的大数据,因此,我们怎么把行业的大数据保护好、利用好、管理好,这是很大的挑战。如果不把大数据利用好,行业大模型就出不来,就没有基础。

  另外,在网络方面,我们也遇到一些困难和挑战。比如新的网络架构、新的网络服务效率很高,能支持“东数西算”、支持算力网,但是它也面临一些政策方面的制约,比如网络的流量结算,因为这个新的网络本来是做科学实验的,是公益性、服务性的,按理来讲应该不结算。如果不制定相关的政策,大科学装置就没法发挥作用,要发挥作用就要把网络结算的费用转嫁到用户,但用户又会觉得贵,使不起网络,类似这样的困境,我认为政府部门和整个行业部门要关注。

  NBD:刚刚您提到行业大模型会是中国的机会,您觉得这方面的突破会比较快吗?

  刘韵洁:我认为是有可能的。因为我国很看重实体经济,实体经济需要这一些行业的大模型,尽管跟通用大模型也有关系,它可能要借助通用大模型的一些能力,不一定完全从头开始做,因为行业大模型有自己的一些特点,我们如果集中精力把行业大模型做出来,对我们的实体经济非常有意义,非常有价值。

  但是要做好这一点,要把行业的数据保护好、利用好、管理好,这个很重要,否则这么宝贵的数据,如果都让国外爬取完了,美国或者别的国家会把一些大模型首先发布出来,中国的机会我认为就没有了。

  但怎么把这一些数据管理好、保护好,我提出一个概念,就是叫“公用的专网”,就是这一些数据不能跑在网络上,因为我们的实体经济也跑在网络上,全都被美国爬走,全都被国外爬走。这要怎么应对?通过一个公用的专网就能解决相应的问题。

  我们去年2月份就宣布了在山东16市开通确定性网络,山东已经在做相关的规划布局,比如在能源方面怎么利用确定性网络。所以要使用确定性网络提供的服务,很快就可以用。

相关产品

Related products

Copyright © 2022 华体会-(hth.com)_主要产品和服务的地址 版权所有网站备案号:沪ICP备10000163号-1
技术支持 : 网站地图