免费安卓手游下载、分享游戏攻略、电脑硬件资讯、数码科技最新资讯
当前位置: 首页 > 数码科技 > 谷歌推出Gemini 2.5 API“隐式缓存”功能,开发者成本可降75%

谷歌推出Gemini 2.5 API“隐式缓存”功能,开发者成本可降75%

时间:2025-06-23 06:05

小编:小世评选

在快速发展的科技领域,为了满足开发者和企业在成本和效率上的需求,谷歌近日对其Gemini 2.5 API进行了重要更新,推出了“隐式缓存”(Implicit Caching)功能。这一功能的引入,标志着API技术的又一次进步,意在帮助开发者更便利地使用该,并显著降低使用成本。

“隐式缓存”功能详解

根据科技媒体WinBuzzer的报道,谷歌的新功能适用于Gemini 2.5 Pro和Gemini 2.5 Flash模型。隐式缓存功能能够自动检测API请求中的重复前缀,并将其加以重用,这样一来,开发者在使用时能够节省大量的计算资源和资金。谷歌公司表示,开发者的使用成本最高可以降低75%,这对于预算有限的开发团队是一个福音。

与2024年5月推出的“显式缓存”(Explicit Caching)不同,隐式缓存的主要优势在于其极高的便利性。开发者无需手动进行配置,系统默认开启这一功能,从而为用户提供了更加简化的操作流程。通过这种智能化的方式,开发者能够更专注于产品的开发,而不是花费过多的时间在API的设置上。

如何最佳利用隐式缓存

为了帮助开发者充分发挥隐式缓存的优势,谷歌提出了一些优化建议。在构建提示词(Prompt)时,将稳定和常见的内容放在开头,随后再添加用户特定的变量内容,可以极大地提升缓存的命中率。短时间内发送具有相似前缀的请求也有助于提高隐式缓存的效果。

值得注意的是,谷歌设定了最低Token数量的要求。具体Gemini 2.5 Flash需要至少1024个Token,而Gemini 2.5 Pro则需要2048个Token。API响应中新增的“cached_content_token_count”字段将显示缓存Token的使用情况和相应的计费优惠,这让开发者能够实时监控自己的使用效率。

显式缓存的选择依然保留

虽然隐式缓存带来了显著的便利,但谷歌依然保留了显式缓存作为可选方案。显式缓存支持Gemini 2.5及2.0模型,与隐式缓存不同,开发者可以自定义缓存内容和生存时间(TTL,默认值为1小时)。这种选择为开发者提供了更大的灵活性,尤其是在需要控制缓存行为和内容时,显式缓存将是一个有力的工具。

实际效果仍待验证

尽管谷歌在宣传中提到隐式缓存可以为开发者节省高达75%的成本,但实际效果如何仍需第三方进行验证。不同的使用模式可能会导致成本节约的效果各异,这给开发者在选择使用隐式缓存时带来了一定的不确定性。因此,对于希望最大化效益的开发团队在实际应用中进行详细的实验和评估显得尤为重要。

谷歌推出的Gemini 2.5 API隐式缓存功能,是对现有API技术的一次有力补充。通过智能化的自动检测和缓存机制,将重复请求的成本降至最低,使开发者可以大幅提高工作效率,同时降低经济负担。随着这一功能的推出,开发者们面临着更为灵活的开发环境,可以在进行复杂项目时更加安心。

在未来,我们期待这一功能能够在实践中证实其承诺的成本节省效果。同时,希望谷歌能够持续优化其API,不断为开发者提供更多的便利和支持,帮助他们在竞争激烈的市场中取得成功。无论是大型企业还是初创公司,优质的开发工具和都是其克服挑战、实现创新的重要基石。

精品推荐

相关文章

猜你喜欢

更多

热门文章

更多