王立鹏(探路新质生产力·产业样本)
你有没有憧憬过这样一幅场景——将文本、图片、视频、音频一股脑儿“投喂”到知识库中,然后对着电脑屏幕提问,几秒钟后,那些分散在不同媒介里的信息被整合出来,形成精准且可溯源的答案。
如果说个人电脑(PC)是缓慢进化的“达尔文式”设备,那么人工智能个人电脑(AIPC)则被认为是迎来物种大爆发的“寒武纪时刻”。要形成这种“质”的跨越,以大模型等技术为代表的新质生产力成为新引擎。星环信息科技(上海)股份有限公司成功将自研无涯大模型“跑”进个人电脑,在AIPC这条火热赛道上改写数据交互方式,让数据可以用自然语言开展对话、进行检索。
人与数据在电脑前“对话”
PC普及至今的数十年里,硬件更新的“摩尔定律”一直在延续,但在软件的“智能涌现”却停滞不前。最简单的例子是,用户要写一篇论文或者分析报告,数据、观点、报表等资料分散在不同文件里,最终结果是,电脑屏幕上密密麻麻铺满了文档,不时还要听个音频、看个视频,费时费力。
把大模型装进电脑是不是可行?自去年起,星环科技研发人员就一直在思考这个问题。公司副总裁朱珺辰坦言,生成式人工智能(AIGC)爆火后,科技驱动的前置条件已被满足,“在业内,行业大模型结合知识库正在从超越常人平均水平的L2阶段向超越90%常人的L3阶段进发,这让几何级‘智能涌现’成为可能。”
去年5月起,星环科技与英特尔等行业巨头探讨底层技术对接问题。彼时,市面上还没有任何AIPC产品的发布,这意味着一切产业应用落地都需要摸着石头过河。“困难比想象中更多。”朱珺辰坦言,最大挑战是承载能力,“通常来说,720亿参数大模型‘跑’起来,需要接近80G的内存,而PC算力和内存都有限,‘塞’不进大模型。但大模型又必须达到一定参数量级,才能有较好的问答效果。”
以技术驱动创新,星环科技集中力量攻关,对适合在PC端运行的推理模型进行裁剪和量化,使其能在32G内存里“跑”起来,光是自研小数据量的模型、量化裁剪、AIPC框架适配等就耗时好几个月。
还有一道难题,是解决大模型存在的“幻觉”,即阻止它“一本正经地胡说八道”。星环科技利用自身在数据库方面的技术优势,让真实数据构建起本地知识库。如今,20万字的论文和几分钟的视频上传到数据库中,不仅能用自然语言检索、推理,而且还能准确溯源,消除了“胡说八道”的风险。
技术迭代环环相扣
随着大模型奇点的来临,朱珺辰发现,行业的技术突破是以星期为单位的。这意味着,只要一个技术环节没跟上,就会落于人后。
向上追溯,无涯大模型AIPC版的演进环环相扣。朱珺辰解释,它的基础是星环科技从2022年底开始大规模投入研发的大模型相关产品——星环知识平台,包括语料的自动化构建知识、知识的存储与服务、预训练基础大模型“无涯”以及大数据分析模型“求索”等。虽然这些基础产品问世不过一年光景,但进化速度相当快。比如,一年前“无涯”还只是金融领域的特长生,一年后就已经能在法律法规、政务、制造等更多领域发挥特长,帮助更多行业用户拥有自己的私人AI助理。
AIPC的关键能力还在于多模态的综合应用。大数据时代,主要处理的是结构化数据,而AIPC要实现为个体服务,对非结构化数据处理也有更高的要求,包括图片、视频、文字、表格等等。为此,星环科技自研了向量数据库,可快速把非结构化数据自动化构建为知识,形成特征向量。其中涉及很多技术,无论是知识工程的构建、图谱构建,还是音视频解析,都需要进行研发和打磨,以此为基础才能满足AIPC时代人与数据对话的可能。
当下,新质生产力堪称“置顶”热词。在朱珺辰看来,大模型行业更加类似于新型生产工具角色,整个新兴产业也不再是一个个孤岛,而是能够通过技术引领创新,最终赋能传统产业,为未来产业打下根基,带动整个系统全要素生产率的提升。
无论“风口”如何变,创新始终不变
高新技术行业流行“追风”。科技创新的“风口”,看起来总是捉摸不透、变幻莫测,区块链、元宇宙、空间计算、大模型、生成式人工智能(AIGC)……这些“风口”直指当下最热门的新兴领域,也引领着技术创新前沿走向。
一波又一波的“风口”中,新兴产业热潮涌动,推动一大批上海科创企业走上舞台发光发热。但无论“风口”如何改变,其背后的关键“创新变量”始终不变——即以技术的革命性突破引领为抓手,改变传统经济增长方式,赋能未来产业发展。某种程度上,从新兴产业的上海样本中,能看到新质生产力的“原生特质”。
上海新兴产业迎着“风口”而上
圆通速递司机杨中桥负责“千里奔袭”的物流干线运输,这本是一桩极耗体力的累活,如今却变得轻松起来。原来,前不久车上加载了一套自动驾驶技术系统方案,杨师傅一学就会,只要点击自动驾驶按钮,卡车就进入自动巡航模式,“以前每时每刻要握紧方向盘,紧盯路况,现在人工只需辅助,每天就能安全行驶上千公里。”
杨中桥的驾驶状态和行驶轨迹,以及跑在全国干线公路上其他800多辆车的实况,均被实时回传到嬴彻科技(上海)有限公司的智能驾驶云平台上。此前,智能重卡站上“风口”,上海孕育出一大批企业,嬴彻科技就是其中之一。“早在2021年底,我们就实现了智能重卡前装量产,如今安全运营里程已近1亿公里。”公司副总裁王立鹏自豪地说,他们自主研发的全栈L2-L4级自动驾驶技术,为物流快递业带来颠覆式效率突破。
如果说智能重卡是已经成熟的“风口”,那么AIGC及大模型的“风口”正劲,上海也在这轮大模型竞速中打开了一片产业新空间。截至今年3月,全国前4批次通过上线备案的大模型中,上海占据24个,包括上海人工智能实验室的“书生”、商汤科技的“日日新”、Minimax的ABAB等。
与此同时,上海培育大模型生态成效初显。今年3月,上海合合信息科技股份有限公司发布一款文本向量化模型,很快就斩获C-MTEB榜单第一的佳绩。合合信息智能创新事业部总经理唐琪介绍,这是一种产业链上游的必备工具,能够将单词、句子或图像特征等高维的离散数据转换为低维的连续向量,显著提高大模型的精准度。
透视新兴产业的“风口”,技术创新是“以不变应万变”的硬规则。“从上海‘3+6’新型产业体系布局看,人工智能、生物医药、新能源等领域的创新是典型的新质生产力,以高新技术为代表的新兴产业,称得上是新质生产力的‘原生代’。”复旦大学管理学院教授芮明杰认为,两个国际通用指标可以用来评价新质生产力是否高效,一是全员劳动生产率,新质生产力应该反映在创新产品附加值的提升上;二是全要素生产率,反映的是技术、资源配置对生产贡献的指标,“与传统产业以资本、劳动力驱动的生产力不同,在新质生产力中,科技创新扮演了更重要角色。”
既要蚂蚁雄兵,也要大象起舞
在研究新质生产力的动力源时,上海前滩新兴产业研究院院长何万篷格外关注新兴产业中的新群体——创业企业和“快公司”。他认为,这些公司充满钻劲和韧性,多是技术流和行动派,充满热忱地引领新场景、触发新需求,迎“风”生长,激发出新兴产业的勃勃生机。
仍以引领新一轮人工智能(AI)变革的大模型为例。如今在上海,大量初创型企业正围绕基础模型、AIGC应用以及上下游工具链等奋力追梦。就在最近,AI角色创作平台“捏Ta”刚刚完成超千万元的天使轮和Pre-A轮融资,这距离企业初创仅16个月,“捏Ta”平台紧盯生成式人工智能的细分赛道——二次元,用创始人胡修涵的话描述,就是“以文本方式输入剧情,自动生成漫画角色”,且在国内几乎没有同类竞品。
除了蚂蚁雄兵,还有大象起舞。5年前,商汤科技投入巨额资金研发SenseCore商汤大装置,并在上海建设临港超算中心。正是基于扎实的算力新基建,商汤研发的底座大模型“日日新”得以持续优化,以平均2到3个月一个版本的频率迭代。就在4月23日,商汤科技发布日日新5.0大模型,董事长兼首席执行官徐立透露,新版本基于超过10TB tokens训练数据,推理时上下文窗口可以有效到200K左右,大部分核心测试集指标已对标或超过GPT-4 Turbo。
繁星汇聚,构成了上海新兴产业的星座。有数据显示,上海AI产业规模已从2018年的1340亿元跃升到2022年的3800多亿元,年均增长超29%。“新质生产力的载体一定是产业和企业,只有企业发挥创新力,才能带动全社会一起推动发展新质生产力。”芮明杰指出,这其中,初创企业要做技术“尖兵”,而巨头企业则应“一手引领创新,一手制定标准”,争取掌握新质生产力的话语权。
为此,上海聚焦创新策划,紧抓大模型、工业机器人、科学智能等“风口”,加速探索全过程创新的新范式,全力帮助企业在“风口”站稳、起飞。去年11月,上海出台推动人工智能大模型创新发展若干措施,涵盖实施大模型创新扶持计划、大模型智能算力加速计划等。与此同时,国内首个大模型孵化和加速载体——上海模速空间创新生态社区去年开始运营,半年来已入驻60多家企业。“捏Ta”所属的看见概念公司正是模速空间里的一员,胡修涵表示,这个孵化器里有算力调度、开放数据、评测服务、金融服务等全方位创业保障,可帮助初创企业轻装上阵。
抢抓先行者优势,为未来奠定基础
相比“风口”正盛的大模型,属于空间计算的真正“奇点”似乎仍未到来。此前,苹果Vision Pro头显的上市,让空间计算的概念火了一把,但行业仍处于早期发展阶段,这一“面向未来”的全新交互技术,距离理想化形态还有一段距离。
站在当下与未来的交叉口,玩出梦想创始人、CEO黄锋选择带领团队争分夺秒进行技术沉淀和产品迭代。企业成立至今4年,已自研出一套空间计算的手势识别技术,实现关键技术局部赶超,努力推动三维信息技术革命往前破冰。“无论是今天的新兴产业,还是明天的未来产业,大量底层技术都是一以贯之的,需要耐心等待从量变到质变的过程。”他判断,大模型与空间计算设备的结合,必定会在未来创造新的“风口”,“上海明确将未来空间作为五大未来产业之一,是释放新质生产力的关键领域,企业从现在起就要为此蓄力。”
今天新兴产业的“风口”,是过去技术创新突破的硕果,而今天的技术积累,或将成为未来产业的四梁八柱。在芮明杰看来,科技创新与产业发展具有明显的先行者优势,因此,新质生产力的着力点应该在于原创性和颠覆性,“所有的突破性技术都需要长期的研发投入,需要技术积累和高精尖人才汇聚,并且通过原创的技术和产品,率先设立技术标准和产业标准,才能奠定先行者优势,在未来掌握先机。”
当下,上海已在培育壮大新兴产业中寻找与未来的链接点。去年,元宇宙、区块链、高温超导等领域关键技术攻关行动启动实施,技术合同成交额达到4850.2亿元,高新技术企业超过2.4万家。今年,上海将加快打造电子信息、生命健康、汽车、高端装备4个万亿元级产业集群,着力打造新兴产业创新高地。
不过,芮明杰也提醒,企业即使身处新兴产业,也并不意味着能代表新质生产力,比如,有些工业机器人制造企业看起来“高大上”,但生产线源自国外进口,做的是来料加工的组装工作,究其根本依然是劳动密集型产业,企业要避免走入误区。上海社会科学院经济研究所所长沈开艳认为,上海一定要注重基础创新和场景应用,比如,上海的AI场景应用较多,但基础创新与国外相比还有待提高,未来应该双管齐下,从科技创新出发实现新质生产力的提升。
- 主持人走光(北京这一夜,陈数摔倒走光,闰妮风情万种,主持人翻车陈凯歌不满)
- 张苏军(副区长等4人当“保护伞”被查后,区政协主席也落马了)
- 加油站卖烟吗(加油站抽根烟会咋样?)
- 挂靠单位交社保(挂靠企业缴纳社保有什么优缺点?和灵活就业相比哪个性价比更高?)
- 京东商家登录(京东商家助手使用方法介绍 网络设置对话框功能说明)
- 济南市统计局(聚焦“项目突破年”济南市统计局将加强对十大领域重点项目开工及建设进度情况监测)
- 陈庆云(有机化学家、中科院院士陈庆云逝世系我国有机氟化学开拓者)
- 杨舒越(cba啦啦队哪个最漂亮?篮球宝贝颜值排行)
- 上海家化(龙头易主,上海家化失去的四年)
- 四平日报(2017,四平日报在做啥?)
- 王命旗牌(说一说清朝的“王命旗牌”和“尚方宝剑”)
- hwm(详解oracle中move的执行机制+通过move操作来降低HWM大小)
-
主持人走光(北京这一夜,陈数摔倒走光,闰妮风情万种,主持人翻车陈凯歌不满)
2015.12.16 -
张苏军(副区长等4人当“保护伞”被查后,区政协主席也落马了)
2015.12.16 -
加油站卖烟吗(加油站抽根烟会咋样?)
2015.12.16 -
挂靠单位交社保(挂靠企业缴纳社保有什么优缺点?和灵活就业相比哪个性价比更高?)
2015.12.16