当地时间11月28日,亚马逊云科技(AWS)在拉斯维加斯举行的reInvent 2023大会上发布了两款芯片,并宣布扩大与英伟达的合作。
在GPU供不应求的背景下,各大科技巨头都在加大对自研芯片的投入,AWS最新发布的两款芯片分别为用于人工智能大模型训练的AI芯片Trainium2以及一款定制化的通用芯片Graviton4。而就在本月早些时候,微软在西雅图举行的Ignite开发者大会上,也推出两款定制芯片以应对不断增加的大模型训练成本挑战。
AWS CEO亚当·塞利普斯基(Adam Selipsky)在开幕式上表示,AWS将于明年开始提供新的训练芯片Trainium2。
但AWS和微软新发布的AI芯片尚无法取代英伟达的AI芯片。在reInvent大会开幕式上,AWS表示,将向客户提供对英伟达最新的AI芯片H200的访问。英伟达创始人CEO黄仁勋出席了大会开幕式。
AWS最新发布的第二代AI芯片Trainium2的速度是上一代的四倍,能效是上一代的两倍。塞利普斯基表示,初创公司Databricks和亚马逊支持的大模型头部公司计划使用新的Trainium2芯片构建大模型。
亚马逊云科技计算和网络副总裁大卫·布朗(David Brown)表示:“芯片是用户所有工作负载的基础,这也是为什么亚马逊云科技一直将这一领域视为其至关重要的创新领域。随着生成式AI引起广泛关注,Tranium2可以帮助客户以更低成本和更佳能效,更快地训练机器学习模型。”
值得一提的是,Anthropic是微软支持的OpenAI的直接竞争对手。Anthropic已经开发了人工智能大模型Claude 2,直接对标GPT-4。Anthropic联合创始人CEO达里奥·阿莫代伊(Dario Amodei)也出现在reInvent大会开幕式。阿莫代伊是OpenAI前高管。
今年9月,亚马逊宣布向Anthropic投资至多40亿美元现金,以加大人工智能云领域的布局,这也是亚马逊迄今为止在生成式人工智能领域一项最大规模的投资。作为交易的一部分, AWS将成为Anthropic关键任务工作负载的主要云提供商,为Anthropic团队提供AWS Trainium和Inferentia芯片计算基础设施的访问权限,Anthropic将利用从亚马逊购买的大量专有芯片来训练其未来的人工智能模型。
AWS最新发布的另一款Graviton4芯片处理器是基于Arm架构的通用CPU芯片,较上一代产品性能提升30%,且比英特尔或AMD的芯片消耗更少的能量。这也是AWS在五年内推出的第四代CPU。AWS表示,目前已有超过5万个客户正在使用该公司的Graviton芯片。
AWS的Graviton芯片也面临微软的直接竞争。微软在Ignite大会上宣布推出定制CPU芯片Cobalt,Graviton和Cobalt都是采用Arm架构。
科技公司加大自研芯片投入背后是生成式AI催生的大模型训练需求的激增。今年早些时候,AWS推出了一项名为Bedrock的生成式人工智能服务,客户可以使用亚马逊和其他初创公司的语言模型来开发自己的聊天机器人和图像生成服务。
在reInvent大会开幕式上,AWS宣布面向企业用户推出一项最新的聊天机器人服务Amazon Q,该机器人可以连接到各种业务软件工具,起始价为每月20美元。
Amazon Q的推出意味着亚马逊在生产力软件领域将对微软和谷歌构成挑战。微软Microsoft 365的Copilot和谷歌Workspace的Duet AI的费用均为每月30美元。
技术行业研究公司Futurum集团副总裁斯蒂芬·迪肯斯(Steven Dickens)在一份报告中写道:“AWS的Amazon Q将改变客户的游戏规则,我预计Amazon Q在未来几个月内会被开发人员和云管理员广泛采用。”
近期OpenAI的人事震动也引发了整个人工智能行业对于伦理的担忧。塞利普斯基在reInvent开幕式上截取了一则关于“因安全担忧,微软短暂限制员工使用OpenAI的ChatGPT”的新闻,并给出了亚马逊对生成式AI安全性的回应。
AWS最新宣布了一项针对生成式AI应用程序中令人反感内容的新保护措施,称为Guardrail。塞利普斯基表示,该服务允许用户过滤掉“有害内容”。
(来源:第一财经)