您现在的位置:首页
8月14日上午10时,,国务院新闻办公室举行关于“十四五”时期数字我国制作开展效果的新闻宣布会。。。。。。国家开展厘革委党组成员、国家数据局局长刘烈宏介绍,,2024年头,,我国日均Token(词元)的消耗量为1千亿,,到今年6月尾,,日均Token消耗量现已突破30万亿,,1年半时刻增添了300多倍,,这反应了我国人工智能运用妄想的快速增添。。。。。。
他介绍,,到今年6月尾,,我国现已制作高质量数据集逾越3.5万个,,总体量逾越了400PB(1PB可存储约5亿张2MB巨细的高清相片,,400PB的总量相当于我国国家图书馆数字资源总量的140倍左右)。。。。。。人工智能模子的训练也推动了数据生意需求的攀升,,到本国产乱伦操逼小说年6月尾,,各地高质量数据集累计生意额近40亿元,,数据生意组织挂牌的高质量数据集总妄想抵达了246PB。。。。。。以北京数交所为例,,高质量数据集占生意总量的份额从上一年的10%跃升到现在的近80%。。。。。。
他介绍,,上海、天津、安徽等地正在试点“数据语料作价入股”等新模式,,指导企业将高质量数据集折算为股权投入到相关企业。。。。。。高质量数据集的开展需要数据标示工业的支持,,咱们已结构了成都、沈阳、合肥等7个数据标示基地,,助力高质量数据集的制作。。。。。。
中文数据在海内大模子的训练功效提高方面施展着主要作用。。。。。。咱们都十分眷注中文数据在训练数据中的占比状态,,国产乱伦操逼小说经由一段时刻的起劲,,海内大都模子训练运用的中文数据占比现已逾越了60%,,有的模子已抵达80%。。。。。。中文高质量数据的开发和供应才华继续增强,,推动我国人工智能模子功效的快速提高。。。。。。
下一步,,国家数据局将经由系统化结构继续推动高质量数据集制作,,加速打造具身智能、低空经济、生物制作等要点领域数据高地。。。。。。咱们也将推动全社会强化数据要素价值认同,,加速推动数据要素价值共创,,作育“为优质数据买单”的阛阓一致。。。。。。