Gate 广场创作者新春激励正式开启,发帖解锁 $60,000 豪华奖池
如何参与:
报名活动表单:https://www.gate.com/questionnaire/7315
使用广场任意发帖小工具,搭配文字发布内容即可
丰厚奖励一览:
发帖即可可瓜分 $25,000 奖池
10 位幸运用户:获得 1 GT + Gate 鸭舌帽
Top 发帖奖励:发帖与互动越多,排名越高,赢取 Gate 新年周边、Gate 双肩包等好礼
新手专属福利:首帖即得 $50 奖励,继续发帖还能瓜分 $10,000 新手奖池
活动时间:2026 年 1 月 8 日 16:00 – 1 月 26 日 24:00(UTC+8)
详情:https://www.gate.com/announcements/article/49112
AWS,通过强化学习自动化降低了AI定制化准入门槛
亚马逊网络服务(AWS)发布了旨在提升人工智能(AI)模型效率并降低学习成本的新功能。其核心是基于强化学习的细节调优选项“RFT”以及无服务器定制功能。这些功能旨在让开发者仅凭最少的机器学习专业知识即可对AI模型进行用户定制化改进。
AWS于3日(当地时间)在拉斯维加斯举行的年度会议“AWS re:Invent 2025”上宣布,将在Amazon Bedrock和SageMaker AI中应用相关功能。Amazon Bedrock是一个可基于主要AI公司的“基础模型”构建生成式人工智能功能的平台,此次RFT更新为企业优化AI智能体开辟了道路,而无需强大的机器学习基础设施。
企业通常将性能最卓越的大型语言模型(LLM)用于AI智能体,但这导致需要过高的推理处理能力。即使在日历确认或文档检索等重复性任务中,也出现了资源使用过度的低效问题。AWS认为新引入的基于强化学习的定制功能可以解决这些问题。简而言之,这是一种能够以更少计算量确保足够效率的结构。
以往,引入强化学习伴随着极高的技术壁垒。包括准备训练数据、收集反馈、构建高性能计算基础设施等,需要耗费数月时间。但Amazon Bedrock上的RFT功能允许开发者选择所需模型,上传用户交互记录或训练数据,然后指定奖励函数,模型的调优工作便会自动进行。AWS解释称,此过程无需机器学习专业人才即可执行,仅凭“对什么是好结果的想法”便已足够。
初期,该功能将独家支持亚马逊自有模型Nova 2 Lite,但未来计划扩展至数十种模型。Amazon SageMaker AI也将以无服务器形式添加类似功能。SageMaker是支持企业设计和部署自有AI模型的平台,预计将提供一种更易于集成强化学习选项的“智能体化”环境。
在智能体化模式下,用户以自然语言输入需求后,AI智能体将引导从数据生成到模型评估的整个过程。同时,也为高级开发者提供自引导方式,拓宽了用户的选择范围。AWS解释称,此功能还可同时应用反馈学习、可验证的基于奖励的学习、监督学习方式调优等多种强化学习技术。该功能不仅与Nova兼容,也与Llama、Qwen、DeepSeek、GPT-OSS等模型兼容。
与此同时,AWS还宣布将在SageMaker HyperPod中引入“无检查点训练”功能。以往训练中发生错误时,恢复需要数十分钟以上,但现在无需客户干预即可在数分钟内恢复状态。这是通过在整个集群中实时保存模型状态实现的。
此外,AWS还将开源AI智能体框架“Strands Agents”移植到了TypeScript语言。该语言比JavaScript稳定性更高、出错可能性更低,预计将提供更稳定的智能体开发环境。
此次发布正值生成式AI市场内竞争对手纷纷加强定制功能的趋势。谷歌(GOOGL)、微软(MSFT)等也在加速推出类似功能,预计用户能够轻松自行构建最优AI模型的环境将进一步加速发展。此类技术演进似乎将起到催化剂作用,推动AI更深地融入实际企业环境。