阿里通义千问团队推出的新一代视觉推理模型,能够“看懂”图片和视频内容,并结合信息进行分析、推理和解决问题。
基于神经热场的无混叠任意尺度超分辨率方法,能够实现高质量的图像放大,同时避免常见的混叠问题。
一种新型的快速图像到图像翻译方法,通过在潜在空间中进行桥接匹配,实现高效且多用途的图像转换。
原生多模态输入输出的AI模型,具备强大的生成和交互能力,支持文本、图像、音频等多种模态的输入与输出,能够广泛应用于创意设计、数据分析、编程辅助等多个领域。
MiniMax推出的全新文本到图像生成模型,旨在通过高效的图像生成能力和极低的使用成本,帮助用户快速将文本描述转化为高质量的图像。
先进的文本到图像生成模型,支持中文和英文输入,能够根据文本描述生成高质量的图像。
集AI绘图、文案写作、在线图片编辑、设计素材库以及AI分享社区于一体的多功能创意工具平台。
一款深度学习模型,专门用于从图像和视频中快速移除背景并提取前景。
一款开源的多模态AI模型,专注于图像生成与多模态理解任务,性能超越DALL-E 3和Stable Diffusion,适用于创意设计、教育、企业隐私保护等多种场景。
商汤科技推出的AI表演应用,专为创意内容创作者设计,具备强大的生成功能和活跃的创意社区。
一款简单易用的智能视频剪辑和制作APP,旨在帮助用户快速完成视频创作并分享到各大社交平台。
支持中英文提示词的AI角色生成工具,能够根据用户输入的描述生成具有独特外观和风格的角色图像。
强大的创意工具,旨在为创意工作者提供前所未有的风格控制和视觉表现能力。
ComfyUI是一个基于节点的GUI,为Stable Diffusion提供了一种更加直观、灵活的方式来操作和管理生成的过程。
一款基于人工智能技术的图像识别工具,用户可通过上传图片或输入图片URL来识别图像内容,并获取相关搜索结果和信息。
它集多种图像编辑和处理功能于一身,无论是简单的裁剪、滤镜效果,还是复杂的颜色调整、光效调整,都能轻松应对。
北京奇点星宇科技推出的一个国内领先的AI图像创作绘画平台和模型分享社区,提供在线Stable Diffusion图片生成功能和海量的模型素材库。
MangaNinja是一种基于参考图像的线稿上色方法,通过独特的设计确保精确的人物细节转录,实现细粒度的颜色匹配和交互控制。
Grok AI是由xAI公司推出的一款具有先进推理能力的网页版AI工具,支持推理、编程、视觉生成和创意创作等功能。
Gemini AI AnyChat是一个实验性平台,展示了 Gemini AI 在视觉处理领域的突破,能够同时处理实时视频和静态图像。
NeuralSVG是一种从文本提示生成矢量图形的隐式神经表示方法,能够生成具有有序和可编辑形状的矢量图形,并支持动态条件控制,如背景颜色等。
一款低门槛、高效率的视频创作工具,利用前沿开源技术,为用户提供顶尖算法工具和深度资源整合,优化视频生成全链路流程,让每个人都能轻松享受创作乐趣。
Grok是一款具备前沿聊天、编程和推理能力的人工智能工具,能够将文本概念转化为视觉现实,并在日常任务中提供实时洞察和辅助.
一款具备强大中文逻辑推理能力的AI模型,能够处理复杂的数学、代码和逻辑推理任务。
VMix 是一个用于提升文本到图像扩散模型美学质量的插件式美学适配器。它通过在图像生成过程中引入美学控制,增强了生成图像的美学表现,同时保持了图像与文本的对齐。
一款基于AI技术的图像分析工具,能够将图片快速转换成适用于多个主流AI绘画平台的提示词。
一个用于图像超分辨率的开源工具,它通过先进的算法来增强图像的分辨率,使低分辨率图像变得更加清晰。
给定一个参考图像池,ColorFlow 能够为黑白图像序列中的各种元素(包括角色的头发颜色和服装)准确地生成颜色,并确保与参考图像的颜色一致性。
谷歌Whisk是一款创新的AI图像生成工具,无需提示词即可实现多张图片风格的混合生成新风格图像。
Midjourney 推出的一款支持多人协作的 AI 工具,用户可以在无限画布上自由创作虚拟世界的角色、地点、派系等元素,结合了 AI 的强大生成能力和实时协作功能,旨在帮助创作者更轻松地打造一个完整的虚拟世界。
妙刷是美团推出的AI创作小程序,能够根据用户上传的图片生成风格迥异的趣味图像和视频。在微信中搜索“妙刷”小程序并进入。
一款功能强大的图像生成和编辑模型,旨在通过一站式解决方案,高效处理多种视觉任务。
一款先进的文本图像到视频生成模型,能够根据简单的文本输入和图像生成高质量的视频内容。
由 Stability AI 提供的一款基于社区许可的人工智能模型,主要用于图像生成和控制。
一款功能强大的图像生成与编辑工具,支持图像融合、风格转移等多种操作,为用户提供丰富的视觉创作体验。
Black Forest Labs(黑森林实验室)开发的一系列高性能图像生成模型的工具包。
Cooraft是一个由Dzine.ai提供支持的全能AI设计平台,它能够在浏览器中为用户提供一系列创新的摄影和设计功能。
Le Chat是Mistral AI推出的一款集成了多模态能力、网络搜索、Canvas界面和图像生成等功能的多语言对话助手。
Vidu1.5是由生数科技开发的一款高级AI视频生成平台,能够根据文本、图片或视频输入生成具有高度一致性和动态性的视频。
Meissonic是一款由阿里巴巴集团、Skywork AI及多所高校共同研发的颠覆性图像生成模型,它基于掩蔽图像建模技术,能够生成高质量、高分辨率的图像。
FLUX1.1Pro 迎来重大更新,推出全新版本 FLUX1.1Pro Ultra,支持高达4兆像素的分辨率,生成速度大幅提升,每张图片仅需约10秒完成。
Stability AI 提供的一系列图像模型,旨在通过先进的人工智能技术,为用户提供高质量的图像生成和处理服务。
Rive Layouts是Rive推出的新功能,它允许设计师和开发者创建动态的、适用于任何屏幕尺寸或设备的图形。
Blendbox是一款AI艺术创作工具,它通过层叠创作和非破坏性编辑功能,让用户在创作过程中拥有更多的创意控制力。
Recraft是一个面向专业设计师的高端图像生成和编辑工具,提供无限设计可能性,强调创意与效率的结合。
KREA是一个致力于简化AI生成过程的工具,它提供了易于使用的界面和丰富的功能,旨在帮助用户轻松创建各种AI生成的应用和图像。
Sana 是一个文本到图像的框架,能够高效生成高达4096×4096分辨率的图像。它以极快的速度合成高分辨率、高质量的图像,并保持强文本图像对齐,可部署在笔记本电脑GPU上。
FLUX.1-Turbo-Alpha 是由阿里巴巴集团旗下的阿里妈妈创意团队开发的一个预训练语言模型。
一个用于图像编辑和处理的在线工具,它通过算法帮助用户实现图像的逆向绘画效果。
一款元宇宙版Sora的AI视频生成模型,可一键创作高质量视频、配音、编辑剪辑,甚至将个人照片变成个性化视频。
CogView3 是由清华大学团队开发的一个用于图像和视频处理的人工智能工具。
"Blueberry"模型是近期在AI图像生成领域引起广泛关注的神秘模型,以其出色的性能在排行榜上迅速上升,成为该领域的新晋强者。
个性化解决方案,旨在生成一系列图像时保持多个角色场景中人物的面孔、服装、发型和身材的一致性,从而创建连贯的故事。
FAL.AI 是一个专注于AI生成音频、视频和图像的云平台,通过其强大的技术吸引了大量开发者和企业客户。
一款基于阿里云人工智能技术的创意绘画工具,能够自动生成多样化的艺术作品,满足用户对于国潮、水墨、原画等多种风格的需求。
一款面向专业人士的在线故事板制作工具,无需绘画技能即可轻松创建插图和故事板。
Photoleap 是一款由 Lightricks 开发的创意且功能强大的照片编辑应用。
文小言是百度推出的一款“新搜索”智能助手,旨在通过AI技术为用户提供更丰富、更个性化的搜索体验。
一款创新的图像生成模型,专注于混合现实与插画风格的图像创作。
ControlNext是一款强大的自动化控制系统设计与仿真平台,专为工程师和科研人员设计,用于快速搭建、测试和优化自动化控制策略。
阿里通义千问团队推出的新一代视觉推理模型,能够“看懂”图片和视频内容,并结合信息进行分析、推理和解决问题。