IT之家3月24日消息,谷歌发言人亚历克斯・约瑟夫在给TheVerge的一封电子邮件中证实,谷歌已开始向GeminiLive推出新的人工智能功能,这些功能使其能够“看到”你的屏幕内容,或者通过你的智能手机摄像头获取画面,并实时回答与之相关的问题。这些功能是在谷歌首次展示为其提供技术支持的“阿斯特拉项目”(ProjectAstra)近一年后推出的。
IT之家注意到,谷歌公司在去年5月召开的2024年I/O开发者大会上,曾展示了基于Gemini的全新ProjectAstra项目,可以本地运行在Pixel手机上,被看作是对标OpenAIGPT-4o的最新模型。
谷歌表示ProjectAstra是最新的多模态AI项目,用户打开摄像头,该多模态项目可以直接解释用户画面中物品。