特朗普胜利利好人工智能监管:AI将获得自由奔放资格
11月7日消息,特朗普战胜对手哈里斯,成为美国第47任总统。此前,特朗普曾多次表示,他计划在任职第一天废除拜登政府的《人工智能行政命令》,并与那些严厉批评除最宽松的监管之外的所有监管者的势力结盟,转而推行宽松的AI监管政策,减少对企业的报告要求,避免披露商业机密。
国内资讯
字节跳动AI助手豆包被曝开启视频生成内测
11月7日消息,字节跳动旗下大模型AI助手豆包正式推出视频生成内测,支持图片文字一键成片、动态运镜和多镜头一致性、风格比例随意挑选。
据火山引擎总裁谭待介绍,豆包视频生成大模型支持多风格多比例的一致性多镜头生成,可应用在电商营销、动画教育、城市文旅、微剧本等领域。他表示,无论是语义理解能力,多个主体运动的复杂交互画面,还是多镜头切换的内容一致性,豆包视频生成大模型均达到业界先进水平。
此前视频生成模型大多只能完成简单指令,豆包视频生成模型则能实现自然连贯的多拍动作与多主体复杂交互。有创作者在抢鲜体验豆包视频生成模型时发现,其生成的视频不仅能够遵循复杂指令,让不同人物完成多个动作指令的互动,人物样貌、服装细节甚至头饰在不同运镜下也保持一致,接近实拍效果。豆包视频生成模型基于DiT架构,通过高效的DiT融合计算单元,让视频在大动态与运镜中自由切换,拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力。豆包视频生成模型具备专业级光影布局和色彩调和,画面视觉极具美感和真实感。(IT之家)
字节推出单图视频驱动模型X-Portrait2:一键生成相同表情神态,简化创作流程
11月6日消息,字节推出单图视频驱动模型X-Portrait2,不同于以往依赖人脸关键点检测的单图驱动方法,X-Portrait2构建了一个表情编码器模型,通过一种端到端自监督训练框架,能够从大量人像视频中自学习ID无关的运动隐式表征。
同时,该模型不仅能保留原图的ID,还能捕捉并迁移从细微到夸张的表情和情绪,简化了现有动作捕捉、角色动画和内容创作流程。进一步将这个编码器与强大的生成式扩散模型相结合,即可生成流畅且富有表现力的视频。经过在大规模高质量表情视频上的训练,X-Portrait2在运动表现力和ID保持性方面显著优于先前技术。(IT之家)
阿里测试AI创作工具Animode,参与动漫制作
11月7日讯,据报道,阿里巴巴正在测试AI视频创作工具Animode,该工具可以帮助用户制作动画风格的视频。Animode是一款视频一键动漫化的AI工具,可以通过视频转换视频的功能将诗篇转换成二次元风格。Animode内置有多种样式,包括3D场景、动画场景,以及VR现实融合模式等,可快速创建复杂的场景。
此外,Animode能够捕捉真人动作,用于创建动作实时同步的二次元角色上,为此,内置有动作库、视频转运动、一键创建语音等功能。(品玩快讯)
淘宝升级AI产品“生意管家”,双11期间服务400万商家
11月6日消息,媒体获悉,今年天猫双11,电商AI全方位服务商家经营。数据显示,淘宝面向所有商家上线的AI产品生意管家,双11期间已累计服务400万商家,帮助中小商家生成超过1亿件商品及营销素材,帮助超80万商家进行了超200万次的数据流量分析。
据悉,淘宝在过去一年多次升级商家侧AI产品,并于十月初正式上线“生意管家”,整合了素材生成、数据服务、经营代理等多项AI工具及能力,为所有淘宝天猫商家备战双11提供高效生产力。
数据显示,天猫双11期间,全站推广助力商家好货更快打爆,近29万商家、超160万商品实现生意增长,活跃客户成交日同比增长超6倍。爱步、乐卡克、无印良品MUJI等品牌使用AIGC图片生成能力,素材点击转化率至高提升97%;妮维雅采用AIGC视频生成能力,素材点击转化率至高提升300%。(飞象网)
视觉中国:子公司拟参设基金,投资北京智谱华章公司股权
11月6日,视觉中国公告,公司全资子公司华夏视觉拟与海南智桥私募基金管理合伙企业业(有限合伙)共同投资盐城智华创业投资基金合伙企业(有限合伙),担任有限合伙人。盐城智华认缴出资总额为1.3亿元,华夏视觉认缴3000万元,占比23.075%。
小鹏发布AI人形机器人Iron:1:1复刻真人、已下工厂拧螺丝
11月6日,小鹏汽车发布全新的AI人形机器人Iron。这款机器人采用了和真人1:1打造,身高178cm、体重70kg、全身主动自由度62个、手部可动自由度15个。作为对比,特斯拉Optimus机器人身高172cm、体重73kg(第一代数据,第二代减重10kg)、全身主动自由度200+个、手部可动自由度27个。其他方面,小鹏AI人形机器人”大脑“采用最新自研图灵AI芯片,拥有3000T的算力,能够像人一样思考记忆,同时也让手脚自主活动。并与智驾体系同源,采用了AI汽车上的鹰眼视觉系统,可以720°无死角看世界,还运用了端到端大模型和强化学习算法,让机器人行走有像驾驶般的能力。
小鹏天玑AIOS,给机器人流畅自由对话的能力,有记忆、能推理,真正像人一样活动。目前该款机器人已经在小鹏广州工厂进行小鹏P7+车型生产实训,小鹏Iron未来将会聚焦在工厂和门店等场景。(快科技)
美图再度携手三星,AI创新功能助力用户创意实现
11月7日消息,三星宣布了与美图的最新合作,这已经是双方今年的第三次联手。根据合作协议,三星手机将首次预装上美图秀秀App,为用户带来更为丰富的图像编辑体验。此次合作中,美图奇想大模型(MiracleVision)技术将深度集成到三星W25和W25Flip6系列手机中。用户将能够享受到包括“AI无痕消除”、“白板涂鸦”、“图像风格化”以及“壁纸生成”等一系列先进的AI图像生成与编辑功能。
据悉,此次合作是基于美图奇想大模型开放平台进行的。该平台是美图公司推出的重要AI技术服务平台,专注于为企业提供专业的AI算法服务和定制化解决方案。自2019年上线至今,已成功服务了智能设备、智能汽车、金融、传媒、消费等多个行业的众多头部企业客户。业内分析人士认为,美图与三星的此次合作进一步展现了美图在人工智能影像与设计领域的领先地位,同时也助力了行业客户在品牌力和生产力方面的多维度提升。(电动新物种)
首台“重庆造”国产服务器下线:搭载华为鲲鹏920+昇腾AI处理器
11月7日消息,首台“重庆造”国产服务器下线仪式在重庆科学城芯鸿数智科技有限公司举行。芯鸿数智是由拓维信息系统股份有限公司与重庆高新开发集团下属重庆科学城科技产业发展有限公司共同出资设立。
通过此次合作,芯鸿数智将持续加大研发投入,打造基于“鸿蒙+AI”的软硬一体化产品和人工智能行业标杆应用。兆瀚RA2300-A系列服务器是一款基于鲲鹏920处理器+昇腾AI处理器的2U机架式推理服务器,支持Atlas300IPro推理卡、Atlas300VPro视频解析卡,能够为用户提供强大的实时推理能力。作为AI推理专用服务器,该系列服务器可广泛应用于中心侧AI推理场景,具有超强计算性能、低能耗、易于部署维护和支持云边协同等特点,满足多种多样的人工智能应用场景的算力需求。
芯鸿数智智能计算制造基地已在西部(重庆)科学城正式投产运行,可实现年产服务器6万台、台式电脑10万台,未来将进一步吸引上下游配套企业聚集。(快科技)
北京首座大模型“超级工厂”落户京西
11月7日消息,由中关村科技园区石景山园管理委员会、北京市石景山区科学技术委员会主办的人工智能大模型产业创新发展大会上,百度智能云千帆大模型产业(北京)创新基地服务平台启动上线。
目前创新基地已集聚十余家具备行业大模型训练和垂直领域应用开发能力的企业,入驻企业已累计完成120余次模型训练,模型训练和推理消耗token(数据或文本的基本单元)数超过6亿。(钛媒体APP)
晶泰科技与金光集团建立全面合作,AI赋能共创营收爆发点
近日,晶泰科技宣布与印尼第一财团金光集团宣布通过其旗下支柱企业——金光金融集团,正式签署战略合作。双方将通过建立合资公司,在多个工业领域展开全面合作,共同推进亚太地区人工智能(AI)产业的未来革新。
金光集团(SinarMasGroup)作为印尼最具影响力和多元化的企业集团之一,在医疗保健、矿业、可再生能源、物流、消费品、化工和金融服务等领域占据主导地位。晶泰科技是全AI+机器人新药及新材料研发平台,已累积服务超300家来自全球的顶尖企业及科研机构。
晶泰科技与金光集团的深度合作,或将解锁强大的专业协同效应,以前沿科技在多个领域催生具有开创性和巨大商业潜力的解决方案,显著推动双方的收入增长,并进一步促进区域经济扩张。两家公司表示期待此次携手,共同抓住东南亚地区蓬勃发展的AI市场所带来的机遇,树立集创新力、竞争力与经济影响力于一体的商业合作典范。(格隆汇)
平均招聘月薪24000元,却预计将有3亿个工作岗位被生成式AI取代
中兴通讯7亿元在北京成立技术公司,含多项AI业务
近日,北京兴云数科技术有限公司成立,法定代表人为王喜瑜,注册资本7亿元人民币,经营范围含信息系统集成服务、物联网技术服务、数据处理和存储支持服务、人工智能基础软件开发、人工智能应用软件开发、大数据服务、信息咨询服务等。股东信息显示,该公司由中兴通讯全资持股。(每日经济新闻)
国际资讯
微软推出Magentic-One:多AI智能体协同完成复杂任务
11月7日消息,微软本月发布Magentic-One系统,通过协调多个专用AI智能体,高效处理复杂工作流程。
Magentic-One系统隶属于AutoGen开源平台,在不同环境中无缝编排任务,进一步巩固了微软在AI任务自动化中的地位。Magnetic-One的核心是协调器代理(Orchestrator),它负责管理框架内的多个子智能体,该协调器不仅是任务调度器,更是高效完成任务的蓝图设计者。
该协调器通过构建“任务账本”(taskledger)来启动操作,并在项目进展中维护“进度账本”(progressledger),确保每个阶段的任务都能按时完成。Magnetic-One通过协调器指挥四个主要代理:WebSurfer智能体、FileSurfer智能体、编码智能体、计算机终端智能体,四个代理各自承担不同的角色,共同实现任务的无缝执行。协调器的自适应特性使其能够监控项目的每个阶段,及时调整计划以应对障碍。如果某个代理在特定步骤上遇到困难,协调器会重新分配任务或更新策略,确保项目持续推进。这种灵活性使Magnetic-One在任务执行中展现出人类般的适应能力。(IT之家)
GPT-4o加钱能变快,新功能“预测输出”7秒完成原先23秒的任务
OpenAI发布了一项名为“预测输出”(PredictedOutputs)的新功能,使得GPT-4o的响应速度提升至原先的5倍,适合文档更新、代码重写等无需从头生成的任务。此功能通过跳过不变内容,使模型在处理编程、迭代任务时显著提速。例如,某些编程任务原需70秒,现在仅需20秒。
尽管速度更快,但“预测输出”功能存在一定限制,例如仅支持GPT-4o系列,且不兼容多项API参数。此外,预测不使用的tokens仍按完成费率收费,使得新功能在速度提升的同时成本有所增加。(大G.AI商业)
微软申请专利以应对AI“幻觉”问题
近日,微软提交了一项专利申请,旨在通过一种技术方法减少或消除人工智能生成的虚假信息。该专利的名称为“利用外部知识和反馈与语言模型互动”,这一提案的核心是为AI模型提供一种“响应增强系统”(RAS),使其能够根据用户的查询自动提取更多信息,并检查其回答的“有效性”。
该工具为企业AI聊天机器人提供了AI驱动的验证,能够在后台进行事实核查,判断AI的回答是否“无根基”或“有根基”,在向用户提供答案之前,只提供有实际数据支持的回答。(AIBase基地)
消息称PerplexityAI搜索公司正融资5亿美元,市值将破90亿美元
媒体报道称搜索初创公司PerplexityAI即将完成5亿美元融资,预估完成后公司市值达到90亿美元(当前约646.66亿元人民币)。消息称本轮融资由风险投资公司InstitutionalVenturePartners(IVP)领投,此外IVP会派遣一位高层入驻Perplexity董事会。
此前,Perplexity公司在1月份完成了7360万美元的B轮融资,当时的估值约为5.2亿美元。PerplexityAI的估值在几个月内增长了三倍,这表明其在市场中的快速发展和潜力。这种快速的增长吸引了更多投资者的目光,并进一步推动了其估值的提升。Perplexity作为一家信息搜索公司,致力于挑战由Alphabet旗下的谷歌主导的搜索引擎市场。该公司不仅获得了IVP的支持,还得到了亚马逊创始人杰夫贝索斯和芯片设计公司英伟达的投资。(IT之家)
微软Win11画图应用大变身!AI填充、擦除一应俱全
11月7日消息,Windows11新版画图应用已向Canary和Dev频道的WindowsInsider项目成员推出测试,具体版本号为11.2410.28.0。本次更新最主要的是引入了AI技术,包括生成填充和生成擦除两大功能,为用户的艺术创作带来全新体验。
生成填充功能让用户通过自然语言编辑和添加内容,同时保持项目的现有艺术风格。用户可以使用选择工具在画图工具栏中创建矩形或自由形状的选择区域,然后通过弹出的小菜单选择生成填充选项,输入想要添加的内容描述,并点击创建。如果用户对生成的结果不满意,可以简单地点击“重试”按钮,或者通过调整选择区域或文本提示来获得不同的生成结果。
生成擦除工具则允许用户从画布上移除不必要的物体,并填补空白,使其看起来像是物体从未存在过。用户在使用橡皮擦工具时选择生成擦除,手动涂抹画布上的一个或多个区域来选择要删除的内容,然后点击应用以移除物体。此外,用户还可以使用矩形或自由形状的选择工具来指定要使用生成擦除命令的区域。Cocreator的底层扩散模型也得到了改进,以更快地提供更好的结果,并内置审核功能,确保用户有一个值得信赖的创意体验。(快科技)
Instagram将借助AI技术识别青少年谎报年龄行为:朋友祝贺生日的帖子也能推测真实年龄
Meta公司发言人称,未来被误分类为青少年的用户可向公司申诉解除青少年账户限制,但该流程仍在开发中。目前,被误判为“青少年”的用户可自行关闭严格设置,无需家长许可。(IT之家)
三星计划通过自研知识图谱技术,提升GalaxyAI个性化体验
11月6日消息,三星电子全球AI中心总监KimDae-hyun在社论中透露,公司计划通过自研知识图谱技术来提升GalaxyAI的个性化体验,同时确保用户数据的安全。
三星计划通过更好的个性化,提升GalaxyAI的功能和易用性,知识图谱技术被认为是实现这一目标的关键技术之一。三星计划将自研的知识图谱技术与生成式AI相结合,以提供更好的用户体验、安全性以及易用性。此外,三星还计划在所有设备中使用混合AI模型。混合AI模型结合了设备端AI和云端AI,根据用户需求动态调整。当数据安全和速度至关重要时,设备端AI将发挥作用;而当需要处理大量数据时,云端AI则更为合适。
AI颠覆服装设计!FLUX.1-devLoRA服装生成器来了设计小白也能秒出服装效果图
TryOnLabs最新开发的FLUX.1-devLoRA服装生成器,利用先进的人工智能技术,为用户带来前所未有的时尚设计体验。只需输入对服装的文字描述,如颜色、图案、材质、风格等细节,就能快速生成相应的服装设计图。FLUX.1-devLoRA模型的强大之处在于其灵活的输入格式和丰富的时尚知识库。用户可以尽情发挥创意,描述心目中的理想服装。
凭借丰富的训练数据,FLUX.1-devLoRA能够准确理解用户的需求,生成符合流行趋势和消费者偏好的服装设计。
为了方便用户使用和进一步开发,FLUX.1-devLoRA的模型权重以Safetensors格式提供下载。用户可以通过HuggingFace平台获取模型文件,进行本地部署或进行二次开发。
FLUX.1-devLoRA服装生成器的出现,无疑为时尚设计领域带来了新的可能性。它不仅可以帮助设计师快速捕捉灵感,进行创意探索,还能让普通用户轻松体验服装设计的乐趣,定制个性化的时尚风格。(AIbase基地)
SK电信发布人工智能驱动的个人助理Aster
SK电信(SKTelecom)在SKAI峰会2024上发布了为全球用户量身定制的人工智能(AI)驱动个人助理“Aster”。Aster展示了日常生活中“指导伴侣(GuidingCompanion)”的含义。该服务计划于今年晚些时候在北美进行封闭测试,并计划于明年全面推出市场。
Aster被设计为“代理人工智能”,超越了简单的问答或搜索功能,通过理解用户的意图来设定目标、制定计划和完成任务。SK电信正致力于优化其大型语言模型(LLM)和Agent平台。这将使个性化信息的传递,以及基于已识别的客户意图的任务计划和执行成为可能。(全球TMT)
AI语音实时转录:BolaAI与OpenDental合作简化牙科工作流程
近日,人工智能语音技术提供商BolaTechnologies,Inc.与牙科管理软件提供商OpenDentalSoftware宣布达成合作。此次合作将BolaAI的VoicePerio软件集成到OpenDental的牙科诊所管理软件中,旨在简化牙科诊所的临床工作流程,减轻员工负担。