江南在线登录入口官网下载欢迎您 中文 English
当前位置:首页 > 新闻动态 > 行业新闻

前沿趋势|从“可用”到“好用”我国AI大模型产业化发展加速

发布时间:2024-09-01 17:57:55 | 来源:江南在线登录入口官网下载 | 游览:1

内容摘要:...

  当前,通用大模型、行业大模型、端侧大模型如雨后春笋般涌现,大模型产业的应用落地将进一步提速。作为新一代AI产业的核心驱动力,AI大模型广泛赋能我们国家的经济社会的多个领域,打开迈向通用AI的大门,推动新一轮的科技革命与产业变革。

  伴随AI领域中大模型技术的加快速度进行发展,北京、深圳、杭州、上海等地均发布了关于AI大模型的有关政策,加快大模型产业的持续发展。具体来看,北京着力推动大模型有关技术创新,构建高效协同的大模型技术产业生态;上海强调打造具备国际竞争力的大模型;深圳重点支持打造基于国内外芯片和算法的开源通用大模型,支持重点企业持续研发和迭代商用通用大模型。

  近年来,AI大模型得到加快速度进行发展,当前大模型热潮主要由语言大模型有关技术引领。语言大模型通过在海量无标注数据上进行大规模预训练,让模型学习大量知识并进行指令微调,从而获得面向多任务的通用求解能力。2023年,OpenAI多模态预训练大模型GPT-4发布,其具备多模态理解与多类型内容生成能力。2024年,OpenAI发布视频生成大模型Sora,应用时空碎片和扩散Transformer技术,大模型的多模态生成能力进一步成熟。

  中国AI大模型产业高质量发展源于多领域的广泛需求,例如来自办公、制造、金融、医疗、政务等场景中降本增效、生产自动化、降低风险、提高诊断准确率、提高政务服务效率等诉求。相关领域的创新和发展一同推动着中国AI大模型产业的蓬勃发展,预示着未来更广阔的市场前景。

  当前,“ChatGPT”“文心一言”“盘古Chat”等大模型的爆火推动了新一轮人工智能技术发展热潮,AI大模型相关研究、产品不断涌现,中国大模型产业规模迅速增加。据相关资料分析,中国大模型产业市场规模从2020年的15亿元增长至2022年的70亿元,年均复合增长率达116.02%,2023年约为147亿元。2024年,中国大模型产业规模将达216亿元。

  从开发模式来看,国内高校、科研机构、企业等不同创新主体热情参加大模型研发。我国参数规模在10亿以上的79个大模型中,企业、高校/科研机构、校企联合研发的数量分别为36个、29个、14个,分别占比45.57%、36.71%、17.72%,学术界与产业界之间的联合开发仍有较大发展空间。

  随着百度、腾讯、华为、阿里等互联网头部企业竞相布局大模型产业,我国AI大模型产业化发展加速。

  非凡产研发布的《2024年2月全球AIGC行业月报》显示,文心一言以1001万的访问量高居榜首,显示出在个人聊天与助手领域的强大吸引力。月之暗面以297万的访问量和105.80%的环比增长,成为了市场上的一匹黑马,其在个人聊天与助手领域的迅速增加,主要得益于独特的产品功能和市场策略。

  由国家网信办联合国家发展改革委、教育部、科技部等七部门公布的《生成式人工智能服务管理暂行办法》自2023年8月15日起施行,办法明确生成式AI实施算法“备案制”,意味着算法备案已成为AIGC产品的入市门槛。2023年11月4日,网易有道(“子曰”大模型)、蚂蚁集团(百灵大模型)、面壁智能(“面壁露卡Luca”)、出门问问(“序列猴子”)、昆仑万维(“天工”大模型)等约11家企业的AI大模型产品获批,并面向全社会开放服务。加上首批的10余个大模型,目前已有超过20个大模型获得审批。伴随审批落地,多家抢跑,AI大模型有望快速进入到拼原生应用、拼产业落地的阶段。

  从算盘、计算机再到大模型,工具的“上新”不断带领人类进入发展新阶段。AI时代,意味着将会解放大量的创新能力,更快的创新与技术迭代。在上海浦东软件园,达观数据有限公司(以下简称“达观数据”)、上海森亿医疗科技有限公司(以下简称“森亿智能”)和飞腾信息技术有限公司(以下简称“飞腾公司”)等优秀企业潜心研发,将技术落地于具体应用场景,打造大模型应用新范式。

  达观数据“曹植”大语言模型作为国内首批垂直、专用、自主可控的国产版GPT模型,结合了先进的自然语言处理(NLP)、智能文档处理(IDP)、光学字符识别(OCR)、机器人流程自动化(RPA)等技术,具有长文本、垂直化和多语言的功能特点。通过创新性地并联多种模型和知识图谱,“曹植”大语言模型为公司可以提供文档智能审阅、智能知识管理、知识搜索与问答、文档智能写作、智能推荐等智能化服务,全方位赋能长文档写作、机器翻译、语义分析审核、知识问答、text-to-SQL等语义场景,助推企业数字化与智能化升级,实现智能管控、降本增效。

  医疗领域超高的专业复杂度,给医疗生成式语言模型的落地应用带来了新的挑战。森亿智能自主研发的病历生成式语言模型,可根据患者的信息、跟随医生思路自动灵活扩写病历,包括病情描述、鉴别诊断、治疗方案等信息,边写边生成,无需选择病历模板即可轻轻松松完成病历生成。此外,该模型还能够准确的通过医生的使用目的代入不一样的角色(交班、汇报、出院),以多种角度和方式总结生成病历摘要、治疗建议、出院小结。

  作为由飞腾腾云S2500和国产GPU厂商信创算力服务器协同打造的创新应用,“航旅大模型”以语言大模型为基础,结合民航特色语言知识库,通过大模型训练、行业场景微调、行业场景对齐和大模型运行推理等技术创新,实现多主体、多场景、多阶段知识体系构建,为客户提供更个性化的服务。飞腾公司与合作伙伴联合加速卡厂商,在一个月内完成基于飞腾CPU的服务器与天数智芯加速卡的深度适配,为“航信大模型”的顺利开发和部署提供坚实的算力底座。