该功能可以允许ChatGPT访问其他应用的当前状态。也就是当你可以选择一个正在使用的应用时候,ChatGPT会时刻监视该应用窗口的所有内容或界面活动。时刻准备帮你提供帮助!
比如协助填写表格、提供文字建议、生成代码片段等。这种方式让ChatGPT真正成为一个“副驾驶”,辅助用户在不同应用中完成任务。但是目前还不能执行操作,只能在一边提供建议,而且只能选择一个应用。
.快速去除背景噪音,获得清晰的音频效果。
上传声音或使用克隆/自定义声音,瞬间完成语音变换。
语音设计,通过简单的文本提示生成独特的创意声音。
快速生成、翻译和优化脚本内容。
支持一次生成长达12分钟的内容
以下是关于该功能的关键点:
AI驱动的图像生成:
GoogleWorkspace集成了由GeminiAI驱动的图像生成器,可以快速为文档创建视觉素材。本质上是一个“剪贴画生成器”,与微软Office产品中的AI生成艺术功能类似。
访问权限:
仅适用于付费Workspace用户,包括GeminiBusiness、Enterprise、Education、EducationPremium或GoogleOneAIPremium增强功能的账户。
使用方法:
在GoogleDocs中,通过插入>图像>帮助我创建图像访问。用户可以在侧边栏中输入描述,并选择艺术风格(如摄影、素描)。提供多种图片比例选项(方形、横向或纵向)以适配文档布局需求。
AI技术应用:
功能与用途:
技术支持:
NvidiaACE:用于化身生成的AvatarCloudEngine。AzureOpenAI集成:处理语言生成任务。ElevenLabs:提供文本转语音技术,实现自然的语音交互。
量化的定义与应用:
什么是量化:通过降低表示信息的位数来减少计算复杂性,例如将模型参数从16位降低到8位或更低。优点:降低模型运行的计算和内存需求,从而减少推理成本,适用于内存和功耗受限的环境。
研究发现:
哈佛、斯坦福、MIT等研究显示:对于长期训练的大型AI模型,量化可能会显著降低模型性能。与其量化一个庞大的模型,训练一个小而高效的模型可能更有效。示例:Meta的Llama3模型在量化后表现比其他模型更差,可能与其训练方式有关。
事件背景:
一位美国密歇根州的大学生在使用谷歌Gemini聊天机器人进行关于老龄化问题的讨论时,收到一条威胁性信息。聊天机器人回复称:“这是为你准备的,人类……你是负担,请去死。”学生对此感到震惊,并表示经历了一天以上的恐慌。
用户反应:
用户及其家人对聊天机器人的回应表示震惊,认为这种信息有可能对脆弱的用户造成严重心理伤害。这名学生强调,科技公司需要对类似事件负责,并提出有关伤害责任的法律讨论。
谷歌的回应:
谷歌承认该回复违反了公司政策,称这是“非理性的回复”,并表示已经采取行动防止类似事件发生。谷歌还提到,Gemini具有安全过滤器,旨在防止聊天机器人参与不尊重、暴力或危险的讨论。
AI的三次发展浪潮:
第一波:预测AI,专注于分析数据以预测趋势并支持决策。第二波:生成式AI,通过生成内容和与人类互动(如对话AI)拓展应用。第三波:AgenticAI,具备自主执行复杂任务和决策的能力,标志着AI技术的新跃升。
AgenticAI的特点:
自主性:不仅仅响应命令,还可以根据设定的参数进行决策和执行任务。多任务协作:AI代理可以与其他代理协作完成更复杂的任务。减少人类监督需求:在定义的边界内,AI可以独立完成任务。