随着智能手机的普及以及移动互联网技术的发展,短视频已经成为了人们日常娱乐生活的一部分。近年来,短视频产业迅速崛起,并愈发壮大。那么,短视频产业的前景如何呢未来又该如何发展呢,如何把握用户需求,为短视频生产者提供降本增效的解决方案,让生产者占据红利的一部分市场。从2023年起,人工智能工具的飞速发展,ChatGPT、AI绘画成功落地,对于文字,图片的处理已经可以批量的产出。短视频的产出如何做到批量化呢?下面将采用阿里云视觉智能开放平台的现有API能力,做出一个批量化处理的方案。
阿里云视觉智能开放平台是什么?
阿里云视觉智能开放平台(VisionIntelligentApplicationProgrammingInterfacePlatform)简称视觉智能平台,是基于阿里巴巴视觉智能技术实践经验,面向视觉智能技术企业和开发商(含开发者),为其提供高易用、普惠的视觉API服务,帮助企业快速建立视觉智能技术应用能力的综合性视觉AI能力平台。阿里云视觉智能开放平台的官网地址为vision.aliyun.com。平台会为您提供普惠易用的AI能力。适用于城市大脑、安防、数字营销、泛金融身份认证、互联网娱乐、手机应用等行业,企业和开发商(含开发者)可以选择相应能力自行封装解决方案或者是产品、服务。
基于阿里云视觉智能开放平台的动漫化视频产出方案流程
1、客户直接上传的是视频素材,就可以直接进行视频人像卡通化处理。2、客户如果传入的是图片输出,可以先调用人物动漫化之后,再对动漫化后的图片进行通用视频生成。3、基于客户的图片素材,可以先调用通用视频生成之后,生成视频,再进行视频人像卡通化处理。
如何实现以上的三个流程呢后面将为大家详细讲解下方案,和各个方案的优缺点。
阿里云视觉智能开放平台的接口调用
作者采用的是python调用的方案,示例代码如下:
importosfromalibabacloud_facebody20191230.clientimportClientfromalibabacloud_facebody20191230.modelsimportGenerateHumanAnimeStyleRequestfromalibabacloud_tea_openapi.modelsimportConfigfromalibabacloud_tea_util.modelsimportRuntimeOptionsconfig=Config(access_key_id=os.environ.get('ALIBABA_CLOUD_ACCESS_KEY_ID'),access_key_secret=os.environ.get('ALIBABA_CLOUD_ACCESS_KEY_SECRET'),
endpoint='facebody.cn-shanghai.aliyuncs.com',
client=Client(config)response=client.generate_human_anime_style_with_options(generate_human_anime_style_request,runtime)print(response.body)exceptExceptionaserror:print(error)print(error.code)
视频人像卡通化:
通用视频生成
整体的动漫化效果差距不大,但是3个方案还是有不同的优缺点,下面就详细分析下优缺点:方案一优点:可以直接调用视频人像卡通化接口,处理流程耗时更短,更简单。缺点:无法对视频转场,音频等无法二次处理,只支持视频的传入。
方案二优点:1、支持直接对图片处理,且可以自定义选择图片的动漫化效果,优先判断生成的效果。2、视频生成的时候,可以自定义视频的转场,播放速度,音频,生成的视频长度等效果。
缺点:处理流程长,需要调用2个API接口,成本高些。
方案三优点:视频生成的时候,可以自定义视频的转场,播放速度,音频,生成的视频长度等效果。且可以选择多种素材的组合,比如图片+视频的模式生成新的视频。缺点:处理流程长,需要调用2个API接口,成本更高些。
总结
本方案支持了图片,视频,图片+视频的三种输入形态,都能完美的实现视频动漫化的效果,而且是可批量操作的,大的节省了人力成本,让视频的产出效率更高,更新更快,让短视频生产者更加有竞争力。