AIGC(生成式AI)可以说是近年来科技产业最大的进展,诸如ChatGPT以及Stable Diffusion等应用的兴起,不论作为个人助手、辅助内容创作,或者是广告设计制作,都带给产业很大的冲击,激发很多新的想法。然而目前这些应用都还是透过云端实现,这也带给产业很多资安方面的疑虑,比如说三星的制程机密数据外泄事件,以及各大科技公司纷纷禁止公司员工使用ChatGPT之类的服务,都让业界思考,或许应该把AIGC往终端推动,藉以解决资安的问题,并希望降低成本。AIGC的核心技术是LLM,也就是大型语言模型,在全球科技大厂竞相追逐相关模型的建立与发展时,台湾也没有自外于世界潮流,产学界都全力跟上这波潮流,推动LLM的相关技术发展。
图片来源 : shutterstock、达志影像
八月中于台湾阳明交通大学所举办的LLM产学技术交流会中,来自产业、学界与政府单位的各路专家分享了许多针对LLM(大型语言模型)的技术发展以及未来应用的展望,会中提出了包括智能制造、永续发展、大型模型发展机会、社会责任以及网络中心的服务应用与AI技术产业落地等六大项目。
而其中最令人关注的,还是诸如业界对于AIGC未来应用的展望,以及高速网络与计算中心主任张朝亮对发展自有大型语言模型的推动的深刻观点。
联发科在主题演讲中提到未来AIGC在终端的发展潜力,指出该公司已于此应用领域之相关技术与生态布局很久。事实上,在交流会结束后没几天,联发科就公开了他们与Meta合作,要将AIGC应用引进智能型手机芯片的计划。
张朝亮主任也在演说中直指未来AIGC走向边缘或终端是趋势。
驱动AIGC往终端发展的关键因素
近年来,AIGC模型取得了长足发展,代表性的ChatGPT等语言模型已经可以实现基本的人机对话,并协助人类完成各种创意或日常工作。然而大型AIGC模型通常需要大量运算资源,目前主要依靠云端运算平台部署,比如OpenAI的GPT模型就部署在微软的Azure云平台上。随着模型规模不断增大,其运行成本也在飞速增长。
为降低成本并扩大使用场景,AIGC未来必将向终端设备转移。一方面通过模型压缩等技术手段实现AIGC在终端的部署;另一方面终端设备的大量用户基础也为AIGC提供了广阔的应用空间。除了经济考虑,终端AIGC还具有保护用户隐私、低延迟实时运算以及随身便携使用等优势。可以预见,AIGC将在手机、耳机、汽车等终端设备上大规模落地,推动终端设备产业的新一轮革新。
第一,降低成本。终端运算可以避免积累大量运营开支,对于商业化应用更加经济高效。随着AIGC模型日益复杂,其运算成本也在飞速增长。根据Analytic India Magazine发布的研究报告指出,单ChatGPT的日常运营就需要花费约70万美元。若是放在中小企业乃至大公司,都是沉重的负担。如果转移到终端,就可以避免云运算的高额订阅和交易费用,降低商业化应用的门坎。
第二,改善用户体验。本地运算可以实现更快速的响应,提高交互的实时性。对话系统和创作助手等应用,都需要低延时的实时体验。如果全部依赖云端运算,既不能实现毫秒级的响应,也增加了网络不稳定的风险。转移到终端后,用户体验可以得到全面提升。
第三,保护隐私。本地运算可以避免个人数据外流,更有利于保护用户隐私。AIGC应用往往需要处理用户的个人信息,如果这些敏感数据上传到云端,可能会遭到滥用。终端计算则可以将敏感操作局限在设备内部,减少数据外泄的风险。
第四,提高可靠性。终端计算免去对网络的依赖,运行更加稳定可靠。一旦网络中断,云端应用就会完全失效。而终端计算则可以在脱机的情况下持续运行,大大提升了应用的可靠性。这对于一些敏感场景的应用尤为重要。
第五,拓展应用场景。终端的可移植性更有利于AIGC在移动、旅行等多样场景的应用。云端运算要求时刻保持网络连接,这对于外出旅行的情形不够友好。而可携式终端设备则可以随时随地使用AIGC功能。这也大大拓宽了AIGC技术的应用场景。
终端产品迎接AIGC的技术布局
面对AIGC浪潮,终端设备正在进行大规模的技术升级以满足模型运行的需求。
从芯片角度看,高通、联发科等顶级芯片商已将AIGC能力的强化作为重点发展方向。高通计划在今年10月发布的骁龙8 Gen 3芯片中加入AIGC运算单元;联发科也宣布将在今年底推出的旗舰芯片组中加入Meta的Llama 2语言模型,未来也将扩及更多智能家电或汽车等终端产品。可以预见,未来绝大多数旗舰手机都将内置AIGC运算能力。另外也有像耐能这类AI芯片公司推出针对AIGC应用的终端与边缘AI芯片产品,这些芯片公司都在快速推动性能升级,未来要执行复杂的内容生成工作都不会是问题。
从系统平台来看,Android和Windows等主流操作系统也在导入AIGC支持。Google I/O大会曾宣布将在Android系统中引入AIGC框架;微软曾在Build 2022开发者大会则提出将AIGC引入Windows 11。这些都为终端AIGC的部署建立了坚实的生态基础。
最后从框架层面看,目前正有多个机器学习框架致力于AIGC模型的优化。其中MobileNet、TensorFlow Lite和Core ML等框架可以帮助开发者轻松将AIGC模型部署到手机和其他终端设备上。这为AIGC在边缘或终端上的快速商业化应用奠定基础。
首当其冲的终端产品
目前,多款首批内置AIGC的终端产品已经面世或即将推出。
智能型手机是当仁不让的首选,苹果iPhone 14 Pro系列手机已经内置Core ML框架,支持基本的影像生成功能;Google Pixel 7手机也宣布加入AIGC支持。随着骁龙8 Gen 3等新一代芯片的推出,届时旗舰手机完成从云端到终端的AIGC转移只是时间问题。
其次是智能型耳机,苹果的AirPods Max已经启用AIGC翻译等功能。随着骨传导技术的发展,支持AIGC的智慧耳机有望成为与智慧手机并驾齐驱的重要终端形式。
智能型汽车也是重点终端领域。特斯拉的Model S和Model X已宣布内置AIGC运算单元,未来整车AIGC有望实现。这将带来更人性化的用户体验,比如AIGC导航和备忘系统等。
终端AIGC将催生新应用
随着AIGC在终端设备的落地,许多潜在的新应用即将出笼。
在智能手机领域,利用本地知识图谱,AIGC可以实现更个性化的搜索和推荐功能,理解用户的实际需求并作出响应。此外,基于内置语音助手和AIGC模型,智能手机可以实现与用户的自然对话,提供实时的、泛用的AI助手服务。在创作方面,AIGC也可直接在手机上完成文生图、文生音等任务,为用户提供实时的内容创作能力。
智能型耳机和其他可穿戴设备在引入AIGC后,将实现跨语言的实时翻译,免去手动操作的麻烦,也可直接将语音转换为文字。此外,AIGC也将赋能更自然的人机交互界面,以及基于语音的复杂操作指令等。
对汽车来说,AIGC导航系统可以根据实际路况自动调整建议路线;智能型备忘系统可以提醒驾驶者注意事项,并可以像Siri那样回答各种问题。AIGC将为未来的智能出行提供强大支撑。
终端AIGC面临的挑战
尽管应用前景广阔,终端AIGC在商业化道路上也会遇到一些挑战。
首先是安全性,如何避免模型被非法使用或滥用是个重要课题,需要在系统层面实现权限管控和监测机制。此外,模型本身也可能存在安全漏洞,这需要持续评估和修正。
其次,目前终端设备的计算能力与内存资源仍然有限,难以支撑大规模AIGC模型的运行,这需要通过模型压缩、量化等方法进行优化。且部分复杂任务仍需借助云端支持,终端设备需要具备云端协同的能力。另外,且AIGC生产的内容也可能不适合某些年龄段的使用者或者有违反道德的可能,需要系统设计去避免或者在某种程度上对内容进行审核。
总体而言,尽管终端AIGC前景巨大,但技术难关仍然存在。业界需要通过创新技术与商业模式设计去应对这些挑战。
好消息~北美智权报有微信公众号了!
《北美智权报》内容涵盖世界各国的知识产权新闻、重要的侵权诉讼案例分析、法规解析,以及产业与技术新知等等。
立即关注北美智权微信公众号→ NAIP_IPServices
~欢迎读者分享与转发~ |
|
|
作者: |
林宗辉 |
现任: |
北美智权报资深编辑 |
学历: |
台湾大叶大学 |
经历: |
电子时报半导体资深分析师
MIT Techreview中文版研究经理
财讯双周刊撰述委员
美国波士顿Arthur wood投资顾问公司分析师 |
|
|
|