ScreenPipe 是一个用于屏幕录制和视频处理的开源工具。
“神笔马良”是猫眼娱乐发布的AI工具,能够将长剧本一键转化为视听化呈现的动态故事板。
PortraitGen 是由中国科学技术大学开发的,基于多模态生成先验的4D肖像视频编辑工具。
Pixels Dance 是一个在线工具,用于创建和分享CSS动画。
LVCD是一种基于参考的带有扩散模型的线性视频着色工具。
个性化解决方案,旨在生成一系列图像时保持多个角色场景中人物的面孔、服装、发型和身材的一致性,从而创建连贯的故事。
FAL.AI 是一个专注于AI生成音频、视频和图像的云平台,通过其强大的技术吸引了大量开发者和企业客户。
一款基于阿里云人工智能技术的创意绘画工具,能够自动生成多样化的艺术作品,满足用户对于国潮、水墨、原画等多种风格的需求。
CloneAI是一款利用AI技术将视频和照片转化为视觉震撼艺术作品的手机应用。
一个开源的、端到端的通用光学字符识别(OCR)系统,旨在通过统一的模型架构实现更高效和准确的文本识别。
一个开源的实时人像美化和背景替换工具,基于深度学习技术,为视频通话、直播和虚拟背景应用提供高级视觉效果。
ControlNext是一款强大的自动化控制系统设计与仿真平台,专为工程师和科研人员设计,用于快速搭建、测试和优化自动化控制策略。
Twitter视频下载支持视频、dms视频、图片是一款Chrome浏览器扩展程序,它提供了从Twitter下载视频、私信视频和图片的功能。
一款专为Chrome浏览器用户设计的扩展程序,允许用户轻松下载Twitter上的视频内容。
Deep-Live-Cam是一个开源的实时面部交换和一键式视频深度伪造工具,它允许用户仅使用单张图片即可生成深度伪造视频。
KEEP是一种基于卡尔曼滤波原理的视频人脸超分辨率工具,旨在通过稳定的人脸先验和跨帧信息传播,提高视频人脸图像的超分辨率效果。
D-ID Video Translate是一款先进的视频翻译工具,能够实现视频内容的自动识别和实时翻译,为跨语言交流提供便捷。
Glif是一个全面的无代码AI沙盒平台,支持构建AI工作流程、应用程序、聊天机器人及更多内容,提供多样化的创意与实用工具。
SkyReels是全球首个融合3D引擎与生成式AI的视频创作平台,能够将用户的想象即时转化为生动的视频内容。
Tavus是一个先进的AI视频个性化平台,利用AI技术为观众创建具有不同语音和视觉变量的个性化视频。
Clapper是一款开源的AI视频生成与编辑工具,它通过集成先进的AI技术,为用户提供了一键生成图像、视频、语音和音乐等素材的便捷功能,极大地简化了视频制作的流程。
Rotato在线工具集是一个集成了多种实用在线工具的平台,旨在为用户提供便捷、高效的在线处理方案,覆盖从文本编辑、图片处理到文件转换等多种功能。
Stable Video 4D(SV4D)是由AI公司Stability AI推出的首个视频生视频模型。该模型能够将单个物体的单视角视频输入,转换成8个不同视角的多视角视频,为用户提供全视图3D动态视频体验。
清影 AI 视频生成服务是一个基于人工智能技术的创新平台,专注于通过智能算法快速生成高质量的视频内容。该服务以其高效、便捷和个性化的特点,适用于多种行业和场景,满足不同用户的需求。
OpenAI在官网发布了最新大模型GPT-4o mini,具备文本、图像、音频、视频的多模态推理能力。
EchoMimic是一款由蚂蚁集团研究团队推出的创新技术,能够根据音频内容和角色照片生成生动对口型视频。该技术突破了传统方法的局限性,实现了更逼真和动态的人像生成。
可灵AI是快手推出的新一代AI创意生产力平台,专注于为用户提供创意内容的生成与编辑服务
“寻光”是由阿里达摩院开发的一站式AI视频创作平台,它在2024年上海世界人工智能大会上亮相,并引起了广泛关注。该平台旨在通过人工智能技术,提供全新的视频创作模式,重塑传统视频制作的全流程。
MimicMotion是腾讯公司推出的一款人工智能人像动态视频生成框架,该框架利用先进的技术,能够根据用户提供的单个参考图像和一系列要模仿的姿势,生成高质量、姿势引导的人类动作视频。
VIMI 是由商汤科技推出的全球首个可控人物视频生成大模型 AIGC 产品。
viggle.ai是一个基于人工智能的角色动态视频生成工具。它采用名为JST-1的视频-3D基础模型,赋予静态图像或视频中的角色以生命般的动态表现。Viggle.ai以其创新的功能和直观易用的界面,为创作者们提供了无限创意的可能性。
Hedra是一个集成先进AI视频模型的创作实验室,专注于通过生成模型为下一代人类叙事提供动力。其主打产品Character-1能生成具有表现力和可控性的人类角色视频,旨在帮助用户构建虚拟世界和讲述故事。
RunwayML推出了Gen-3 Alpha,这是一款用于高保真、可控视频生成的新型模型。它是Runway基于为大规模多模态训练而构建的新基础设施训练的首批模型之一,与Gen-2相比,在保真度、一致性和动作上都有显著提升,是构建通用世界模型的重要一步。
WorldDreamer 是一款创新的视频生成模型,它通过预测遮蔽的视觉令牌来理解并模拟世界动态。该模型将世界建模视为一个无监督的视觉序列建模挑战,旨在通过视觉输入映射到离散的令牌并预测被遮蔽的令牌来实现视频生成。
Moki是由美图公司推出的AI短片创作工具,专注于辅助视频创作者打造动画短片、网文短剧、故事绘本和音乐视频(MV)。它基于美图自研的奇想智能大模型(MiracleVision),提供智能剪辑、自动配乐、音效添加和字幕生成等功能。
Hallo是由复旦大学开发的一项前沿技术,专注于肖像图像动画。它利用先进的扩散模型生成逼真且动态的肖像动画,与传统的参数模型相比,Hallo技术提供了更为自然和流畅的面部动作。
Dream Machine是一款基于AI的视频生成工具,能够根据文本和图像快速生成高质量、逼真的视频内容。
该工具能够从单一图像生成具有复杂面部表情和身体动作的虚拟人物,包括笑、说唱、唱歌、眨眼、微笑、说话等效果。
Follow-Your-Emoji是一个基于扩散模型的人像动画框架,能够将目标表情序列动画化到参考人像上,同时保持人像身份的一致性、表情的传递、时间的连贯性和保真度。它通过采用表情感知标志和面部细粒度损失技术,显著提升了模型在控制自由风格人像表情方面的表现,包括真实人物、卡通、雕塑甚至动物。此外,它还通过简单有效的逐步生成策略,扩展到稳定的长期动画,增加了其潜在的应用价值。
腾讯混元团队与中山大学、香港科技大学联合推出全新图生视频模型“Follow-Your-Pose-v2”,只需要输入一张人物图片和一段动作视频,就可以让图片上的人跟随视频上的动作动起来,生成视频长度可达10秒。
星火绘镜是一款由科大讯飞推出的AI短视频创作平台。这个平台允许用户轻松地从文字描述生成短视频内容,将文本转换为视频分镜,并扩展成完整的短视频。它特别适合需要快速将创意或故事转化为视频内容的用户,例如内容创作者、营销人员和教育工作者。
一站式AI视频创作,1200+免费3D数字人。
海艺 SeaArt AI是一个将文本或图像转换为图片或视频的AI绘图平台,旨在帮助用户将其想法通过图像或文本描述转化为AI生成的图片或视频。
AnimateAnyone是一个基于人工智能的角色动画生成工具,可以将静态图像转化为动态视频,实现角色的动画化。
SignLLM 是全球首个多语种手语视频生成模型,能够将文本或语音指令实时转化为手语视频,为听障人士提供沟通新方式。
Open-Sora是一个由hpcaitech开源的类Sora架构视频生成模型,它基于Diffusion Transformer(DiT)架构,旨在通过文本描述生成高质量的视频内容。该项目涵盖了整个视频生成模型的训练过程,包括数据处理、训练细节和模型检查点,供对文生视频模型感兴趣的人免费学习和使用。
该研究介绍了针对大型语言模型的无偏水印技术,表明可以添加水印而不影响生成文本的质量。研究提供了一个无偏水印的理论框架,确保输出不受水印的影响。这种方法为负责任的人工智能开发讨论提供了一个追踪和归因模型输出的方法,而不会牺牲质量。
Avid Technology(简称Avid)是一家提供专业音频和视频制作解决方案的公司,其产品和服务广泛应用于电影、电视、音乐制作和广播行业。
FIFO-Diffusion是一种基于预训练扩散模型的新型推理技术,用于无需训练即可从文本生成无限长的视频。
Viva 是一个免费的 AI 生成工具和社区,提供 Text-to-Image、Image-to-Image、Text-to-Video、Image-to-Video 等功能,以及强大的 AI 编辑工具。用户可以扩展图像、重新绘制任何内容,使图像和视频更加高质量和 4K。
SynthID作为一项创新的数字水印技术,能够对由AI生成的视频和文本进行标记。
Veo 可以捕捉不同的视觉和电影风格,包括风景和延时镜头,并对已生成的镜头进行编辑和调整。
Synthesia是一款基于人工智能的视频生成平台,通过文本输入,利用AI技术将文本转换为包含面部表情、语音和肢体语言的视频内容,极大提升了视频的表现力和吸引力。
准确识别视频中的语音,基于识别结果的文字选段随心裁剪视频片段。
美图AI消除是美图设计室提供的一项高级功能,旨在帮助用户去除图片中的不想要的元素,如水印和遮挡物。
美图秀秀是一款流行的图像和视频编辑应用程序。
StoryDiffusion是由字节跳动和南开大学合作推出的AI工具,专注于长范围图像和视频生成,通过一致性自注意力机制,实现图像和视频内容的连续性和一致性。
FaceAiSwap是一个提供AI人脸交换服务的在线平台。它允许用户将自己的脸部与喜欢的名人或朋友的脸部进行交换,为用户创造独特、有趣的图片内容。
DigenAI 数字人是一款创新的AI产品,其在数字互动方式革新和商务领域应用方面展现出巨大潜力。
Stability AI 推出了 Stable Artisan,这是一款支持使用 Developer Platform API 创建高质量媒体的 AI 工具,包含 Stable Diffusion 3 等高级模型,能够生成和编辑图像,并支持多种图像处理功能,以及用文字或图像创作精细视频。
ScreenPipe 是一个用于屏幕录制和视频处理的开源工具。