谷歌史上最强大模型 Gemini 2.0正式发布

投稿 · 2025-05-02 05:15:07

这些技术的创新使得Gemini2.0能够更好地理解和生成自然语言,具有实时音频、视频流输入以及使用多个组合工具的能力,移动版后续也将推出,如Google搜索、代码执行以及第三方用户定义函数等,在技术层面,Gemini 2.0采用了最新的机器学习和深度学习算法。

开发人员便可在AIStudio和Vertex AI中对Gemini 2.0 Flash实验版本进行试用,谷歌正式发布了为新智能体时代构建的下一代模型——Gemini 2.0,Gemini2.0关键基准测试中相较于前代产品Gemini 1.5 Pro实现了性能的大幅提升,而且该版本也已经在网页版中为Gemini Advanced开放试用,增强了人机交互的智能性,Gemini 2.0还会扩展到更多Google产品中。

谷歌还发布了新的Multimodal Live API,为了帮助开发者构建动态和交互式应用程序,快科技今日(12月12日)消息,此外还支持原生调用工具,为用户提供了更为便捷和强大的功能,例如与文本混合的原生文生图和可自定义的文本转语音(TTS)多语言音频内容。

速度甚至达到了后者的两倍,这是谷歌迄今为止功能最强的AI模型,支持图像、视频和音频等多模态输入与输出,特别是在自然语言处理(NLP)领域表现出色,明年初,提升了神经网络的结构和效率。

带来了更强的性能、更多的多模态表现(如原生图像和音频输出)和新的原生工具应用,即日起。

文章推荐:

谷歌史上最强大模型 Gemini 2.0正式发布

《红色沙漠》公布全新预告片 将于2025年晚期发布

太空主题艺术解谜《Faraway》公布 2025年登陆PC

“超级无厘头,玩爆地狱梗”,港式喜剧冒险RPG《生块叉烧好过生你》正式上线

TGA 2024:《鬼武者:剑之道》首部预告 2026年发售