如今,AI应用究竟行至何处?通用型、工具型、行业型、硬件型都有哪些?
为此,产业家对国内主流AI应用做了一些盘点与梳理。希望在洞察行业前沿趋势的同时,也为把握未来的AI应用格局提供一个重要窗口。
作者|斗斗
编辑|皮爷
出品|产业家
“猛增至91万、涨幅高达264%、34倍”这一数据来自GitHub上的AI开源项目统计对比。
对于AI应用的开发热情,业内从如此激昂过。
那么,截止如今,国内的AI应用到底有哪些?分布在哪些方向和领域?以及它们具体的能力到底如何?
而由于AI智能助理(Coplilot)可以将AI的能力深入嵌入具体应用场景中,能够主动理解使用者的意图并提供成型的方案,成为了国内通用生成式AI应用最广泛的产品形态。协同办公领域基于其先天优势,AI应用落地较多。
工具型AI应用主要包括聊天机器人、搜索引擎、文本工具、AI作画以及代码工具等,主要集中在C端。
值得注意的是,由于其高度依赖底层大模型。竞争优势的构建,主要来自差异化的产品定位,以及持续训练更强大的底层模型和算法,所以,目前国内工具类AI应用的同质化程度较高。
更强大的底层模型和算法,是工具型AI应用打造竞争力的关键。
一是语音助手,应用场景包括智能座舱、智能音箱、家用机器人等各类智能终端。另一类则为数字代理AIAgent,主要应用包括自动驾驶、智能机器人等,具备更加广阔的应用空间。不过,目前AIAgent在感知与决策能力上仍存在瓶颈。
总体来看,AI应用的整体发展势头尚处于初级阶段。这一点,透过一级市场的投资动态也可见一斑。
据CBInsights数据显示,到2023年第二季度为止,生成式AI领域的总投资额相较去年全年的25亿美元暴增4.6倍,尽管其中大约70%的投资资金集中在包括大型模型在内的底层AI基础设施建设,应用层的融资占比仅为三成。
就当下而言,一个值得思考的问题是,AI应用究竟行至何处?通用型、工具型、行业型、硬件型都有哪些?为此,产业家对国内主流AI应用做了一些盘点与梳理。希望在洞察行业前沿趋势的同时,也为把握未来的AI应用格局提供一个重要窗口。
着眼当下,看向未来。
一、通用AI应用
1、钉钉AI助理
功能方面,钉钉AI应用提供了内容生成与摘要,能够自动生成长文档、会议记录、聊天摘要等内容概览,显著提高信息处理效率;二是智能助手服务,包括但不限于AI写真、涂鸦作画、法律助手等功能,服务于个人用户及企业的多样化需求;三是工作流程优化。通过AI优化协同办公流程,如智能排程、任务自动化处理等,降低人力成本;四是应用生成与扩展。基于AIPaaS平台,可快速生成新的AI驱动应用或增强现有应用的功能。
接入能力上,钉钉AI应用通过统一接口与各类AI服务紧密结合,实现跨应用的一体化交互。并允许第三方开发者和合作伙伴基于钉钉AIPaaS平台开发适配自家业务的AI应用,形成共生共赢的生态环境。
目前钉钉AI应用已经在多个关键办公环节实现智能化自动化操作,减少人工干预,提升工作效率;能够根据用户行为和偏好进行一定程度的个性化推荐和定制服务;能够实时响应用户需求,提供决策辅助数据,帮助企业更好地进行管理和决策。
2、飞书智能伙伴
飞书智能助手MyAI能够自动汇总会议纪要,通过自然语言处理技术准确记录并整理会议重点内容,同时还可以创建各类报告,如日报、周报、月报等,大大减轻人工撰写负担。并实现了文档处理、信息管理与提取、业务洞察与流程管理以及组织洞察与赋能的智能化。
例如支持自动续写和生成文档、表格、邮件、思维导图、问卷等多元化的创作需求;具备业务洞察能力和业务流程管理能力,为企业提供决策支持和流程自动化方案等。
接入能力方面,用户可以直接在飞书App中通过对话形式与MyAI互动,完成创建日程、查询信息、发起任务等操作。同时,飞书AI可以与其他应用程序和服务无缝集成,例如可通过集简云这样的平台将其AI助手功能接入到飞书机器人中,实现各种自动化工作流。企业还可以根据自身需求选择不同的AI底层模型,赋予飞书智能伙伴更高的定制性和适应性。
目前,飞书AI已成功应用于多个办公场景,包括但不限于会议管理、文档处理、内部信息检索、任务创建与跟踪、流程自动化等,有着较实用的办公辅助能力。
除此之外,WPSAI还包含约100多项AI应用,涉及办公场景的各种生产力提升,如智能排版、智能图表制作、智能审阅、智能检索、智能问答等。
接入能力方面,WPSAI已经成功接入到WPS的文字处理、表格、演示文稿(PPT)、PDF阅读器等全线产品中,实现了无缝整合;WPSAI也接入了一站式数字办公平台WPS365,为企业客户提供智能化办公工具,实现企业文档管理和协同工作的智能化升级。
目前,WPSAI采用了大语言模型技术,能够理解和生成自然语言,模拟人类进行复杂文本创作和编辑任务。且WPSAI已经面向全体用户逐步开放体验,意味着其技术成熟度和稳定性足以应对大规模用户群体的使用需求。
二、创意工具型AI应用
2、文心一格
用户只需输入一段自然语言描述,文心一格即可依据描述内容生成对应的高质量图像,实现了从文本到视觉艺术作品的转换。还可以根据用户需求生成不同风格的画作,包括但不限于国画、油画、水彩画、插画、动漫等多元风格。
文心一格不仅可以描绘具体的实物,还能理解抽象概念和情感色彩,赋予作品一定的艺术想象力和创新性。
接入能力方面,文心一格提供了Web应用程序,用户可以直接访问官方网站使用该服务。具有对外提供API的能力,但具体是否开放API供第三方开发者接入尚待验证。
文心一格作为一款AI绘画工具,目前已经在基于文本描述的图像生成领域取得了突破性进展,可以满足用户多样化的图像创作需求。
3、剪映Dreamina
Dreamina能够根据用户输入的文字描述生成对应的创意图片,允许用户只需输入文本即可创造出多样化的图像内容,涉及不同风格、色彩和元素;用户还能对生成的图片进行一系列的编辑和调整,如更改尺寸、比例、模板,甚至细化到对图片元素的增删、颜色变化和位置调整等,大大提高了创作自由度和个性化表达的可能性。
剪映系列产品的特点是通常具有良好的跨平台支持,Dreamina很可能也能够在手机、电脑和iPad等多种设备上使用,方便用户随时随地进行创作。目前并未开放给企业级用户。
4、妙鸭相机
功能方面,用户只需上传少量照片,妙鸭相机即可借助AI技术生成高质量的写真照片。
FaceChain/FaceChain-FACT算法可使得的妙鸭相机生成的面部表情自然、细节丰富。
此外,其还具备AI修图、数字分身创建、模板选择等能力。
目前,妙鸭相机凭借其AI图像生成技术,在市场上迅速走红。从用户反馈来看,妙鸭相机在照片生成的质量、速度和智能化方面都有较高的水平,能满足消费者对低成本高质量照片的需求。
5、爱诗科技PixVerseAI
截止至2024年3月初,PixVerseAI能够实现高度自动化和智能化的视频创作流程,显著提升视频生产的效率和创意表达的可能性。
6、字节跳动豆包AI
豆包AI具有强大的自然语言处理和理解能力,可以与用户进行流畅且富有个性化的对话,提供问答、智能创作等功能,支持文本和语音输入输出,增强了用户体验的多元性。且具有视觉识别和人脸识别能力,这意味着它可以基于视觉信息进行互动,例如识别用户和物体,从而提供更为情境化和个性化的服务。
豆包作为一款AI工具,能与多种终端设备无缝对接,允许用户在不同平台上使用其功能,而且能利用抖音及其他字节系产品的庞大用户群和数据资源进行拓展和优化。
目前,豆包已经达到了较为成熟的AI对话助手阶段,不仅能提供基本的文字交流,还能通过视觉和语音技术增强交互的真实感。能够处理多种任务,从日常闲聊到专业咨询,再到个性化内容生成,覆盖范围广泛。不过,根据提及的信息,豆包AI尚未具备直接生成图片的能力,这可能是其未来迭代升级的一个方向。
三、行业型AI应用
1、京东京言AI助手
另外,通过接入金融机构的业务系统,光子可以帮助自动化执行一些常规的、规则性强的后台操作,如账户管理、交易处理、报告生成等,提高工作效率,减少人为错误。
利用AI算法,光子还能够对海量金融数据进行深度挖掘和智能分析,为金融机构提供实时的投资策略建议、风险预警和业务优化方案。
接入能力方面,光子具备良好的系统集成能力,可以无缝对接金融机构现有的IT基础设施,包括但不限于CRM系统、ERP系统、交易平台等,实现数据的互联互通。
4、医联AI医生
医联AI医生(MedGPT)具有强大的智能诊断能力,可对近3000种疾病进行首诊判断,诊断结果与三甲医院医生的诊断一致性高达96%,能够提供初步的病情分析和诊疗建议。
此外其还具备多模态学习与分析、病例讨论与学习、医疗知识库与更新、慢病管理与健康咨询等能力。
接入能力方面:医联AI医生可与医疗信息系统(HIS)、电子病历系统(EMR)、远程医疗平台等无缝对接,实现数据共享和实时交互。还能够接入线上线下的医疗服务场景,包括互联网医院、实体医疗机构、家庭医生签约服务等。
目前医联AI医生通过不断学习和迭代,持续优化诊断准确性和服务效能,已具备较为完善的医疗诊断辅助功能,能够在实际医疗场景中发挥重要作用,减轻医生的工作负担,提升诊疗效率。
功能方面,小P老师能够为不同年龄段的学生提供从幼儿教育到高中教育阶段全学科的教学支持,包括但不限于语文、数学、英语、科学等课程的答疑解惑和知识点讲解。
还可以提供个性化教学、智能交互与答疑、学习资源推荐、学习数据跟踪与分析等功能。
目前,小P老师已经可以自动组织学习内容,进行知识点梳理和专题讲解,让学生在互动学习过程中享受个性化教学体验。此外,在深度学习与自适应学习以及课堂互动与情境模拟逐步深入。
四、AI硬件应用
1、小爱同学
此外,还能基于用户的使用习惯和偏好,逐渐学习并提供更为个性化的服务,比如智能推荐音乐、新闻等。
2、天猫精灵
功能上,用户可以通过自然语言与天猫精灵进行对话,实现各种指令的传达,例如播放音乐、电台节目,查询天气、新闻、交通信息等;还在天猫超市和其他合作平台上购买商品,并且通过声纹识别技术进行支付确认,简化购物流程。
接入能力上,天猫精灵AI平台对外开放API和SDK,允许第三方开发者为其开发“技能”,即扩展应用,形成庞大的生态系统,支持更多的智能设备和服务接入。
不仅整合了阿里巴巴集团内部的丰富资源,还与众多外部合作伙伴达成内容和服务上的合作,让天猫精灵成为连接多元服务的入口。
目前,天猫精灵已具备较高的智能水平和广泛的接入能力。值得注意的是,随着AI技术的发展,天猫精灵可能正在研发或考虑如何整合更高级的自然语言处理和生成技术,以进一步提升其对话理解和回应质量。
3、毫末智行自动驾驶
功能上,毫末智行提供从L2-L4级别的自动驾驶解决方案,包括城市道路、高速公路等复杂场景下的自动驾驶功能,如城市NOH(NavigationonHighway)系统,实现无图导航辅助驾驶,支持城市道路中的自动变道、避障、路口通行等功能。
此外,还具备云端仿真与数据智能、硬件感知与决策规划、智能硬件接入等能力。
接入能力方面,毫末智行的AI技术已经成功应用于长城汽车等主机厂的多款车型,表明其具备与汽车制造商的高度集成能力,能够将自动驾驶系统无缝接入到整车电子电气架构中。
目前,毫末智行的自动驾驶技术已经实现了商业落地,不仅在乘用车市场中获得了数百万辆级的装车量,还在智能物流、无人配送等领域开展应用,在AI应用方面已形成了较为完整的技术体系和商业化布局。
写在最后:
目前,人工智能在中国已经对各行各业产生了深远影响。
通过引入AI技术,企业能够优化生产流程、预测维护需求、自动控制生产线,从而大幅提高生产力和运营效率。例如,在制造业中,AI助力智能制造,实现精密质量控制和资源优化配置。
AI技术还促使产品向智能化方向发展,无论是消费电子产品、家用电器还是工业设备,都逐渐融入AI元素以提升用户体验和价值。同时,AI也使得传统产品服务形态发生转变,形成“产品+服务”、“硬件+软件”的新组合。
AI驱动的产品研发也更加依赖于数据分析和模型模拟,设计师和工程师能够借助AI工具进行快速原型设计、仿真测试和迭代优化。此外,AI还能帮助企业进行市场需求预测、产品创新设计以及个性化定制,促进产品差异化竞争。
此外,还带动产业结构转型升级。例如,农业领域的精准种植、养殖,服务业的智能客服、个性化推荐系统等,都在很大程度上体现了AI技术的赋能作用。
总而言之,尽管当前AI还未实现科幻电影中的全自主思考和行动,但它确实在实实在在地改变着我们的生产和生活方式,默默地推动经济社会的创新发展。
这类应用不仅将深度学习、自然语言处理、计算机视觉等AI模块作为核心组件,还将构建起全新的交互模式和应用场景,使AI真正成为驱动应用功能和服务创新的核心引擎。