拥抱AI大模型应用创新的春天
“计算机能思考吗?”自从英国数学家图灵于1950年在一篇著名的论文中提出“人工智能(AI)”概念以来,人类在AI领域的探究从未停止。2022年末,Chat-GPT问世,在语音图像识别、自然语言理解等复杂任务中表现出色,带动建构在庞大数据量和知识库之上的大模型在2023年出现爆发式增长。如果说2023年是AI大模型元年的话,那么2024年将有望成为AI应用创新年,AI不仅将推动产业转型升级,也将重新定义我们的工作和生活方式。
百模大战回归理性发展
2023年,以ChatGPT为代表的AIGC(生成式人工智能)领域迎来“百模大战”。在美国,谷歌、微软等科技巨头相继推出大模型。在中国,百度、阿里、华为、科大讯飞、腾讯等企业积极布局大模型赛道,三大运营商也都推出了原创大模型产品。根据《北京市人工智能行业大模型创新应用白皮书(2023年)》,截至2023年10月,我国拥有10亿参数规模以上大模型的厂商及高校院所共计254家,分布于20多个省(区、市)。
然而,大模型在训练过程中需要使用海量数据和参数,这就意味着大模型的建设方必须拥有强大的算力资源、安全能力,必须投入巨量资金。业内人士认为,在白热化的“百模大战”后,行业必将经历洗牌重组和优胜劣汰。2023年8月,由国家网信办等七部门发布的《生成式人工智能服务管理暂行办法》正式实施,从政策层面设置了准入门槛,标准体系覆盖多个行业,涵盖了行业能力、工程化性能、算力网络、安全可靠等方面。这也意味着“百模大战”将回归理性,AIGC行业迈入整合阶段。
千行百业呼唤原生应用
大模型在对话、写文章、企划、写代码等很多领域表现出了惊艳的创作能力,并且每天都在快速进化。但是,AIGC技术的能力还远远不止于此,由其推动的数字经济、实体经济的深度融合,将创造出更多颠覆性的应用和更大的社会价值,有望开启一轮关系到未来数十年的技术和产业变革。
在经历了“百模大战”后,越来越多的人认识到AI未来的竞争高地不在大模型本身,而在落地于千行百业的原生应用。中国工程院院士邬贺铨表示,基础大模型通识能力强,但聊天难成刚需,要体现大模型的价值,还要靠落地行业应用。百度创始人兼董事长李彦宏认为,人类进入AI时代的标志,不是产生很多大模型,而是产生很多AI原生应用。未来我们需要的是100万量级的AI原生应用,而不是100个所谓的大模型。英伟达CEO黄仁勋预测,AI领域的竞争将导致现成的人工智能工具的出现,从芯片设计、软件开发到药物发现和放射学,不同行业的公司将根据自己的需求,将自己特有的技术、数据与AI能力结合起来,发挥更大的作用。
在药物研发领域,大模型在药物分子建模和性质预测等任务上,表现出了卓越的性能;在采矿领域,AI监测系统能够精准识别异常情况,让工人坐在办公室里就能完成管理工作,提高生产效率和安全性;在工业制造领域,ChatGPT应用可提升设计、工程、制造和运营等流程的效率……经济转型期的千行百业为AI发展提供了丰富的应用场景和巨大的创新空间,AI的发展将把重点转移到行业大模型上,每一个行业都应该有属于自己的大模型和应用。未来必将有大量原生应用随着“会思考的计算机”渗透到经济社会发展的方方面面,不断推动数实融合,创造更大的经济价值和社会价值。
开源模型推动科技创新
2024年1月10日,中国电信宣布自研的星辰语义大模型全面开源,公开其底层代码、算法逻辑及其预制的各种基础大模型、开发模块、训练工具等核心产品能力,同时开放1T高质量清洗数据集,成为首个完成大语言模型(LLM)开源的央企。1月17日,商汤科技与上海AI实验室联合香港中文大学和复旦大学发布的新一代大语言模型书生·浦语2.0宣布开源。在此之前,阿里云于2023年12月开源通义千问720亿参数模型Qwen-72B。大模型赛道转向了“开源热”。360创始人周鸿祎预测:2024年开源大模型将迎来爆发式增长。
早在2017年,国务院发布的《新一代人工智能发展规划》就将“开源开放”列入基本原则。在2023中关村论坛上,科技部副部长吴朝晖表示,中国坚持开源协作,加强大模型技术持续创新,协同解决透明性、稳定性等共性问题,进一步推动算力资源和数字资源开放共享,加快形成大模型的产业生态。
训练大模型需要极大的算力资源,开发成本高昂,业界巨头拥有绝对优势,大量中小企业望尘莫及。而大模型开源则可以降低中小企业开发AI应用的门槛,提升大模型的使用率,为科技创新提供新的动力。大量第三方参与者汇聚成应用开发的洪流,将推动大模型向实体经济渗透,颠覆搜索引擎、电商、金融、教育、影视娱乐、医疗、游戏等诸多行业,重构人们的工作和生活。
2024年,AI大模型的竞争格局正发生剧变,新的应用和商业模式将不断涌现。AI大模型应用百花齐放的春天即将到来。
来源:人民邮电报