人工智能AI大模型周刊第37期个人文章

2024年世界移动通信大会MWC拉开序幕,高通发布全新高通AIHub,提供优化的AI模型库,支持在骁龙和高通平台上部署。优化后的模型提升AI推理速度,减少内存带宽和存储空间占用,实现更高能效和电池续航。高通展示多模态大模型在安卓手机和WindowsPC上的应用,增强用户体验。此外,高通还展示了在安卓手机上运行的LoRA模型,可以调整生成内容。这些技术提供了个性化生成式AI的高效方式。

在安卓手机上首次实现的多模态大模型,用户可以通过手机AI助手进行照片和语音输入进行对话。高通在MWC2024上展示了终端侧AI的新突破,包括在手机和PC上运行的音频推理多模态大模型。AIHub也发布了,支持超过75个大模型。另外,高通还推出了AI增强的WiFi系统FastConnect7900。这些技术展示了终端侧AI趋势已经到来。

DeepMind团队推出了新的AI模型Genie,拥有110亿个参数,能够基于用户输入的图片和提示词生成2D平台游戏。Genie经过20万小时的2D游戏视频训练,可以生成2D游戏,而不是完全的VR游戏。这个模型由时空视频标记器、自回归动力学模型和可扩展的潜在行动模型组成。用户只需提供草图或数字艺术作品,Genie就能帮助生成2D游戏。它能将草图转化为开放世界,并根据玩家操作预测下一个像素帧。Genie是在无监督和无标签视频的情况下进行训练,能够学习不同角色的动作和行动。

最新推出的英伟达RTX500和RTX1000GPU专为提升笔记本电脑的AI能力而设计,性能提升显著。除了英伟达,其他芯片厂商也在AIPC领域展开激烈竞争,不断推出新产品。整个AIGC领域呈现出蓬勃的发展态势,预示着未来的技术创新和竞争。

英伟达与HuggingFace和ServiceNow联合发布了名为StarCoder2的LLMs系列模型,旨在成为代码生成领域的新标准。该系列包括30亿、70亿和150亿参数模型,通过新的代码数据集Stackv2进行训练,能更好地理解低资源编程语言。StarCoder2可执行源代码生成、工作流生成、文本摘要等任务,提高开发人员工作效率。新的30亿参数模型比初版性能更优,采用BigCodeOpenRAIL-M许可证,允许免版税访问和使用。感兴趣的用户可从BigCode项目的GitHub页面获取源代码,从HuggingFace下载模型。

Adobe在布鲁克林举行的HotPod峰会上发布了名为“ProjectMusicGenAIControl”的新AI音乐创作工具原型。这个工具利用生成式人工智能技术,帮助用户创作和编辑音乐,用户只需输入文本描述,工具就能生成对应风格的音乐。用户还可以自定义生成的音乐,并进行重新混音生成循环音频。虽然市面上已经存在类似的音乐生成工具,但这个新工具给用户更多控制权。Adobe表示,该工具目前处于早期实验阶段,可能会整合到现有编辑工具中。

Meta将于7月推出最新版本的人工智能大语言模型Llama3,旨在提升模型性能以取得竞争优势。此前的Llama2已应用在社交媒体平台,但存在无法回答部分问题的情况。Llama3则能够解决这些问题,继续延续开源设定。Meta在有序训练这款大语言模型,并将任命内部人员进行语气与安全培训。开源带来的威胁令专家担忧,但Meta坚持开源是为了提供更优质的服务。Llama已成为开源生成AI中的主力军,更新势必将使其再度焕然一新。

李楠在魅族新品发布会上介绍了魅族21Pro手机的AI开放特性,号称这台手机是“AI时代的树莓派”。魅族21Pro手机将对LLM大模型团队开放系统权限,提供FlymeAPI文档,允许LLM向用户请求数据,并开放SoC边缘AIAPI。此外,魅族还发起“MeizuOpenLLMHackathon”竞赛,邀请用户参与竞赛,开发“月活最高的新LLM”应用。

这是一个视频翻译配音工具,可将一种语言的视频翻译为指定语言的视频,自动生成和添加该语言的字幕和配音。支持多种语言,包括中文、英语、韩语等。工具提供多种功能,如识别字幕、提取字幕并翻译、文字合成语音等。用户可以通过设置选项自由配置组合,实现翻译和配音、自动加减速、合并等操作。软件支持CUDA加速,并提供CLI命令行模式。用户还可以通过设置文件进行详细配置。软件功能丰富,操作简单,适合视频翻译和配音需求。

OOTDiffusion是OOTDiffusion的官方实现,该项目将发布论文。模型在VITON-HD数据集上训练的检查点已发布,DressCode数据集的检查点即将发布。请参考HuggingFace链接以及humanparsing和openpose的预处理。安装步骤包括克隆存储库并创建conda环境。推断步骤包括半身模型和全身模型的使用。待办事项包括发布论文、Gradio演示、模型权重和训练代码。愿意的话请给我们一个star!

StickerBaker是一个利用人工智能制作贴纸的工具,由@replicate和@flydotio提供支持,完全开源。用户输入提示后,系统会生成一个贴纸。通过webhook传递预测数据至Replicate,生成完毕后上传至Tigris进行图像托管。该工具使用Replicate生成贴纸,Fly.io提供基础设施,Tigris用于图像托管。开发者可以通过安装依赖、设置环境文件、启动Phoenix服务器等步骤进行本地开发,并通过部署到生产环境来更新url和origin。部署时需要设置好Postgres数据库。

为了更好地服务大家,我们决定引入【Ai新物种】知识星球。在这个全新的领域里,我们将提供最前沿的资讯和项目,帮助大家探索人工智能的奇妙世界。Ai新物种星球将成为您获取实践经验和知识的最佳平台,让您与未来科技紧密接轨。无论是最新的技术趋势还是创新项目的机会,都将在这里得到及时推送。加入我们,一起探索人工智能的无限可能!

加入chatgpt项目交流群,请扫描下方群二维码,二维码长期有效。

THE END
1.和橘子学AI绘图440集100实战(2024新课)深度...AI绘图的基本原理 AI绘图并不像人画画那样得先打草稿后再描边上色,而是运用了“扩散”来绘图,即以...https://bbs.pinggu.org/thread-12919502-1-1.html
2.python利用stablediffusionwebui进行AI画图朝阳1双击web.bat 会自动下载所有依赖,然后浏览器会打开,例如http://127.0.0.1:7860/ 启动参数 --lowvram --theme dark --xformers --precision full --no-half --no-half-vae --api --autolaunch 如果报错 OSError: Can’t load tokenizerfor‘openai/clip-vit-large-patch14’. If you were trying to lo...https://www.cnblogs.com/qcy-blog/p/18177119
3.AI它使用自然语言处理和文本转语音技术(Edge-TTS/VITS-Fast/elevenlabs)生成对观众问题的回答并可以通过so-vits-svc/DDSP-SVC变声;另外还可以通过特定指令协同Stable Diffusion进行画图展示。并且可以自定义文案进行循环播放。 视频教程合集 | 在线文档 目录 项目结构 下载项目 运行环境 ...https://gitee.com/sandayleo/AI-Vtuber
4....AI重磅发布多模态大模型PixtralLarge!3D数字教程软件入门 平面设计 3D数字 C4D教程 Blender教程 短视频制作 影视动画 摄影艺术 室内设计 绘画插画 海外教程 电商教程 产品精修 办公职场 编程开发 考证·外语 品牌设计 综合教程 UI设计 兴趣生活 详情 图文教程 训练营推荐 3D数字 超越GPT-4o!Mistral AI重磅发布多模态大模型Pixtral-Large!0...https://m.huke88.com/course/167483.html
5.RealFlow模拟海浪来袭特效教程Createalarge资源数量:9,其他后期软件教程_其他,Create a large-scale water simulation in RealFlow,Create a large-scale water simulation in RealFlow/Create a large-scale water simulation in RealFlow (1 of 9) (HD),Create a large-scale water simulation in RealFlow/Create https://www.aigei.com/view/110213.html
6.AIGC提示工程指南:AI使用导航教程论文与研究:《Prompt Engineering for Large Language Models》等文献提供了理论基础。 在线教程:慕课网、知乎等平台上有关大语言模型和提示工程的教程和讨论。 实战案例: 项目实例:创建一个AI文本生成项目,目标是生成关于科技趋势的文章。使用一个预训练的大语言模型。首先,定义目标任务,例如“生成一篇关于大数据应用的...https://www.imooc.com/article/348872
1.想入门学习AIGC,自己却对此毫无基础,该怎么办,看这篇零基础入门教学AI绘...建议新手可以考虑使用AiChat官网账号。这样使用实惠,生成的效果也十分惊艳,同时速度也非常快。这样,你就可以开始你的创作之旅了。 使用Midjourney画图 为了实现画图,我们只需要输入绘画的提示词prompt,prompt是你对想画的图的描述(AiChat中英文都支持)。受限在绘画描述中自己打字,也可以从画面描述中选择添加,绘画指令添...https://blog.csdn.net/xiaokangss/article/details/144104216
2.AI画图巨头StabilityAI推出创新视频生成模型:StableVideo...Stable Video Diffusion是由Stability AI推出的视频生成模型,基于Stable Diffusion构建,现已开源。该模型能基于静止图像生成视频,目前尚未面向所有用户开放。 技术亮点 视频生成: 支持将静止图像转化为视频。 开源访问: 通过GitHub提供项目地址。 用户候补名单: 有兴趣的用户可以通过Stability AI网站注册等候名单。 https://www.yizz.cn/4147.html
3.flygondahanghai2024/docs/ai如,MEWX AI、小狸猫 MEWX AI 教程《选修篇 7.1【国内工具】学会用 MEWX AI 完成 AI 绘画》 Vega AI 网页:https://rightbrain.art/ Vega AI 教程《7.2【国内工具】学会用 Vega AI 完成 AI 绘画》 无界AI 网页:https://www.wujieai.com/ Tiamat https://tiamat.world/ 微信小程序 Tiamat 暂时没有网页...https://github.com/OpenDocCN/flygon-dahanghai-2024/blob/master/docs/ai-huihua/README.md
4.好消息!吴恩达再发大模型精品课程:GenerativeAIwithLarge...吴恩达创办的DeepLearning.AI一直在提供各种面向AI领域的精品课程。在上个月,他们发布的四门AI短课程(包含了ChatGPT的使用、ChatGPT Prompt工程技术、面向LLM应用的LangChain教程和Diffusion工作原理)受到了广泛的欢迎。今天,吴恩达宣布与AWS的研究人员一起推出了全新的长课程《Generative AI with Large Language Models》,...http://datalearner.com/blog/1051688052742878
5.AI绘画《超入门级教程:训练自己的LORA模型》,MM超爱的萌宠...第一个需要下载的模型 clip-vit-large-patch14,是我们需要从https://huggingface.co/openai/clip-vit-large-patch14 自行下载模型文件,上传到/ark-contexts/data/huggingface/hub/models–openai–clip-vit-large-patch14/snapshots/8d052a0f05efbaefbc9e8786ba291cfdf93e5bff 文件夹下。 https://www.skycaiji.com/aigc/ai2042.html
6.3秒实现多音色混合克隆!F5/E2TTS教程上线;PsyDTCorpus5k心理...在线运行:https://go.hyper.ai/SZxqv 教程界面示例 3.Stable-Diffusion-3.5-Large 图像生成 Demo Stable Diffusion 3.5 Large 模型是一个多模态扩散生成器 (MMDiT) 文本生成图像模型,其特点是图像质量、排版、复杂提示理解和资源效率的显著提升,其 80 亿参数的庞大规模,提供了专业级别的图像生成能力,特别适合高分...https://hyper.ai/cn/news/35598
7.web.yjsuoj.com/nodenews/886891.shtmlJapanese large tits 02.37MB 19好评 欧美老妇黑毛B 少妇被粗大的猛烈的进出69影院 婚前教育BY阿司匹林...午夜ai免费久久 08.55MB 59%好评70人) 新金瓶梅高清完整版百度影音 差差差很疼30分钟短视频免费...《小太妹免费mp3下载手机软件安装教程》每日更新正版HD电_中国新闻网 兰州黄色av大片 公厕人形尿便...http://web.yjsuoj.com/nodenews/886891.shtml