艾巴生活网

您现在的位置是:主页>互联网 >内容

互联网

Gemini 1.5 Pro适合创意程序员这就是他们能做的

2024-05-17 17:18:09互联网传统的飞鸟
本周人工智能领域取得了重要进展,特别关注Gemini 1 5 Pro 和 Astra 的发布。Gemini 1 5 Pro的新能力具有编程知识的开发人员Pietro

本周人工智能领域取得了重要进展,特别关注Gemini 1.5 Pro 和 Astra 的发布。

Gemini 1.5 Pro适合创意程序员这就是他们能做的

Gemini 1.5 Pro的新能力

具有编程知识的开发人员Pietro Schirano发布了一个视频,使用 Google 工具创建的脚本展示了这些新技术的功能。

Schirano 对识别相机拍摄的物体的 Gemini 演示印象深刻,因此使用 Python 创建了自己的 Gemini 1.5 Pro Flash 版本。

该脚本允许计算机的摄像头实时解释它所看到的内容。在视频中,斯基拉诺拿着他的手机,脚本在屏幕上描述了他的外貌以及他正在做什么(拿着 iPhone)。令人惊讶的是,脚本还识别出了图像背景中的一扇门。

剧本还有待打磨的地方

虽然该脚本尚未优化并且仅分析各个帧,但斯基拉诺计划在向公众发布之前对其进行优化并使其“更加神奇” 。此外,他希望未来能够实时分析视频。

这个例子展示了人工智能改变我们现实的潜力。

无限的可能性和应用打开了,特别是在可访问性领域。像斯基拉诺这样的程序员的创造力让我们更接近未来,人工智能不再只是科幻小说,而是改善我们生活的切实工具。

我们不应该专注于批评,而应该利用聪明才智和创新来探索这些进步的实际应用。人工智能有潜力解决实际问题并改善人们的生活质量。

重要的是,Schirano 的视频展示了一个特定的用例,Gemini 1.5 Pro 和 Astra 的功能更进一步。