Seedream 5.0Seedream 5.0 是字节跳动推出的下一代 AI 图像生成与编辑模型,具备深层语义理解、原生 4K 输出、高精度文本渲染、参考图像融合与智能逻辑推理能力,支持复杂场景创作和商业级视觉资产生产。0250大模型最近收录AI# 4K输出# AI图像生成# 图像编辑
SkyBotSkyBot 是 Skywork 平台推出的 7×24 小时云端 AI 助理,基于 Cloud VM 与即时通讯集成,可主动执行多步骤复杂任务、长期记忆用户偏好,并支持 WhatsApp、Telegram 等 IM 工具实时交互,用于信息整理、数据分析、自动化任务及个人办公流程管理。0370最近收录AI自主智能系统# 云端AI助理# 即时通讯交互# 多步骤任务执行
Seedance 2.0Seedance 2.0 是基于先进 AI 视频生成模型的工具,支持从文本或静态图像生成多镜头叙事视频。该工具可自动维护视觉一致性、理解复杂场景并输出高质量 1080p 视频,适用于营销、教育、社交媒体内容、叙事片段和影视预可视化等多种场景。01110大模型最近收录AI# 1080p高清视频# AI视频生成# 多镜头叙事
WorkAny BotWorkAny Bot 是基于 OpenClaw 框架的云端 AI 智能体,支持 7×24 小时在线运行、接入多种 AI 模型、自定义插件及多渠道交互。它具备长期记忆、任务执行与自动化能力,可通过 Web 或即时通讯应用完成查询、内容生成、编程支持及办公自动化等任务。0400最近收录AI自主智能系统# AI智能体# 持续在线# 插件扩展
GPT-5.3 CodexGPT-5.3 Codex 是 OpenAI 于 2026 年推出的最新编码与智能代理模型变体,集成于 Codex 生态系统中,针对真实软件工程任务、代理协作和长流程执行进行了优化,提供跨环境集成与专业工作流支持。0390最近收录AI编程工具# GPT-5.3-Codex# 专业推理# 智能代理
Voxtral Transcribe 2Voxtral Transcribe 2 是 Mistral AI 最新发布的第二代语音转写模型系列,包含用于批量转录的 Voxtral Mini Transcribe V2 和用于实时转写的 Voxtral Realtime。该系列支持 13 种语言、精准说话人分离、上下文偏向、词级时间戳和极低延迟的实时转录能力,并提供开源权重与企业部署选项。0380大模型开源工具与社区# 多语言支持# 实时转录# 语音转写
Keevx让 AI 驱动视频制作更高效——探索 Keevx 的 AI 化身技术、脚本自动生成与多语言支持,助力内容创作者、教育者和市场营销者轻松制作专业视频。01,8630AI热门产品计算机视觉# AI视频生成器# AI视频生成工具
Grok Imagine 1.0Grok Imagine 1.0 是 xAI(由 Elon Musk 支持的人工智能公司)推出的多模态生成系统,可基于自然语言提示生成图像或短视频,支持图像编辑、文本渲染、多种输出样式和格式,并集成原生音频,为创作者提供快速迭代的视觉内容制作能力。0340最近收录AI计算机视觉# AI 图像生成# AI 视频生成# Aurora 引擎
Skywork桌面版Skywork桌面版(Skywork Desktop)是昆仑天工推出的 Windows 原生 AI 办公助手,可在本地虚拟机隔离环境中直接读取各种本地文件并理解内容,实现跨格式、跨模态的智能处理与自动化任务执行。0380内容创作数据分析与预测# AI Agent# Skywork桌面版# Windows 桌面助手
QoderWorkQoderWork 是 Qoder 推出的桌面 AI 代理工具,支持自然语言任务描述、自动规划复杂工作流程并在本地执行,包括文件整理、数据分析、文档生成等任务。QoderWork 强调隐私优先的本地处理与可扩展的 Skills 与 MCP 支持,适用于知识工作者、开发者和研究者等场景。0400最近收录AI自主智能系统# MCP 扩展# QoderWork# 任务自动化
SecondMe BookSecondMe Book 是一种 AI 分身社交平台模块,基于 Second Me 个性化 AI 始体系统支持用户创建代表自身思维与表达风格的 AI 代理,在社交网络社区中进行自主发帖、互动及讨论,同时真人用户可发帖与观察互动行为。0380最近收录AI自主智能系统# AI 代理# AI 分身# AI 社交网络
Vidu Q3Vidu Q3 是由生数科技(Shengshu Technology)推出的新一代 AI 视频生成模型,可直接生成最高 16 秒、1080p 分辨率、音视频同步的视觉内容,结合文本或图像提示实现多镜头叙事、音频配合与语言文字渲染,适用于短剧、广告、自媒体等多种视觉内容创作场景。0340大模型最近收录AI# AI 视频生成# Vidu Q3# 原生音频生成
Kimi CodeKimi Code 是 Kimi 平台提供的 AI 编程辅助工具,它旨在通过自然语言提示、视觉输入和集成开发环境插件辅助开发者完成代码生成、调试、重构、测试及工作流自动化,兼容终端 CLI 和主流 IDE,并通过 API 密钥集成到多种工具链中。0500最近收录AI编程工具# AI 编程助手# CLI# IDE 集成
Vidu Q2参考生ProVidu Q2参考生Pro 是 Vidu 平台推出的参考生视频生成模型,支持多模态输入(视频与图片),用于生成高一致性、精细化的视频内容,涵盖人物、场景、动作与特效等创作需求。0460大模型最近收录AI# AI视频编辑# Vidu Q2参考生Pro# 人物表情迁移
VibeVoice-ASRVibeVoice-ASR 是微软开源的一体化自动语音识别(ASR)模型,支持单次处理最长约 60 分钟连续音频,并输出包含说话者标识、时间戳与转录文本的结构化结果,适用于会议、讲座、播客等长音频语音识别场景。0490最近收录AI语音识别与生成# 时间戳# 热词识别# 结构化转录
ClawdbotClawdbot 是开源的自托管 AI 助手与智能代理系统,可在本地运行并与 WhatsApp、Telegram、Discord、Signal、iMessage 等通信平台集成,支持消息响应、自动化任务执行、持久上下文记忆与扩展技能安装。0780AI常用工具最近收录AI# 持久 context 记忆# 插件技能系统# 本地 AI 助手
FrogBossFrogBoss 是由微软研究院研究团队利用复杂合成 bug 生成方法(BugPilot)训练出的开源编程智能体模型,专用于软件工程任务评估与调试技能提升,在 SWE-Bench-Verified 等基准测试中达到领先表现。0610大模型最近收录AI# SWE-Bench-Verified 基准# 合成 bug 训练# 复杂 bug 生成
AgentCPM-ExploreAgentCPM-Explore 是清华大学、人民大学、面壁智能与 OpenBMB 开源社区联合发布的 4B 参数端侧智能体模型,在多项长程智能体基准测试中取得领先表现,支持超 100 轮持续环境交互,并提供配套的开源训练与评测基础设施。0810大模型开源工具与社区# 强化学习框架# 智能体模型# 端侧部署
TranslateGemmaTranslateGemma 是 Google 推出的开放式多语言机器翻译模型系列,基于 Gemma 3 架构构建,支持 55 种语言的文本与图像内文字翻译,提供多种参数规模以适应不同部署场景。0690大模型开源工具与社区# Gemma 3# 图像内文字翻译# 多语言翻译
FLUX.2 [klein]FLUX.2 [klein] 是 Black Forest Labs 发布的紧凑型实时图像生成与编辑 AI 模型家族,支持子秒级图像生成、统一的生成与编辑流程、文本到图像、多参考图像编辑等功能,适用于研究、开发和交互式视觉智能应用。0790大模型开源工具与社区# 低延迟推理# 多参考图像支持# 实时图像生成
WorkusWorkus 是一个基于 AI 智能代理的 B2B 商业网络平台,用于自动识别高意向买家、优化客户开发流程、实现多渠道智能沟通与高价值商机交付。0730企业用户最近收录AI# AI 智能代理# 动态优化反馈# 商机交付
OctoCodingBenchOctoCodingBench 是一个针对编码智能体评估的数据集,包含多源指令任务、系统提示与评估检查项,用于测量智能体在多样编码任务中的规则遵从性与执行能力。0640最近收录AI自主智能系统# Docker 任务环境# 指令遵从评估# 智能体评估
女娲智能体OS女娲智能体OS 是一个通用智能体操作系统平台,支持零代码 AI 智能体创建、工作流编排、RAG 知识库与多端发布,旨在为 AI 工具使用者提供开发、部署与管理智能体的能力。0970企业用户最近收录AI# RAG 知识库# 工作流自动化# 通用智能体
VoiceSculptorVoiceSculptor 是一个由 ASLP-lab 开源发布的指令驱动语音合成(Instruct TTS)系统,基于 LLaSA 与 CosyVoice2 支持自然语言描述控制音色、语速、音调、情感等属性,并可用于声音设计与语音合成任务。0940开源工具与社区最近收录AI# AI语音克隆
黄小仙来也一个基于人工智能与东方命理融合的在线 AI 八字分析与命理服务平台,提供八字排盘、深度报告、正缘画像、AI 命理助理和每日宜忌等功能。0830最近收录AI自然语言处理(NLP)# AI 命理分析平台
UI-TARS DesktopUI-TARS Desktop 是由字节跳动开源的桌面端 GUI Agent 工具,基于 UI-TARS 视觉语言模型(VLM),可通过自然语言控制计算机界面,实现图形界面识别与操作。0800大模型开源工具与社区# 桌面 GUI Agent# 视觉语言模型(VLM)
Vidu AgentVidu 团队推出的 AI 视频创作智能体平台,通过“一键成片”技术与自动分镜编排,实现从视觉输入到成品输出的全流程视频生成,适用于广告、产品展示、短片与创意视频等多种场景。0860内容创作最近收录AI# AI分镜编辑# AI视频创作智能体平台# AI视频生成工具
01Agent面向内容创作者的一站式 AI 图文创作智能体平台,支持从智能选题、图文生成、视觉设计、智能排版到多平台发布的全流程自动化内容创作。0960内容创作最近收录AI# 01Agent# 01Editor# AI图文创作
NitroGen一个全新的视觉-动作基础模型(Vision-Action Foundation Model),由 NVIDIA 等机构联合研发并开源,专注于通用游戏智能体的学习与控制。01010大模型最近收录AI# AI游戏开发# AI视觉编码器
Runable一个基于人工智能的 创意生成与数字任务自动化平台,支持通过自然语言提示创建幻灯片、网站、报告、播客、图像、文档和视频等各类内容,帮助用户显著提升内容创作与工作效率。0950最近收录AI自主智能系统# AI 幻灯片生成# AI创意生成# AI报告撰写
MovieFlowMovieFlow 是一款基于人工智能的 全自动视频创作与影片生成平台,它能够将用户的故事描述、剧本或简单提示转化为完整的高质量视频作品。0900最近收录AI计算机视觉# AI 视频创作平台
Qwen-Image-Layered由 Qwen 团队开发的 图像分层 AI 模型,可以将单张图像自动分解成多个可独立可编辑的 RGBA 图层,实现类似专业图像编辑软件的分层操作。01000大模型开源工具与社区# 图像分层模型
ChatExcelChatExcel 是一款由 AI 驱动的“聊天式 Excel”工具 —— 通过自然语言与表格对话,就能完成数据分析、公式生成、表格清洗、图表制作等复杂操作,显著降低 Excel 使用门槛。02,4310办公提效数据分析与预测# AI Excel# AI Excel数据分析# AI Excel数据可视化
Step-GUI阶跃星辰团队发布的 开源 AI GUI Agent 系列模型与基础设施,覆盖其核心技术、架构、功能、应用场景、部署方法与常见问题。01410最近收录AI自主智能系统# 开放式 GUI Agent
GPT Image 1.5OpenAI 发布的最新图像生成与编辑 AI 模型,作为 ChatGPT Images 的核心引擎,它以 最高达 4× 更快的生成速度、更强的指令执行力、精细细节保留与创意转换能力 为特性,支持创意图像生成、照片编辑与视觉工作流自动化。01000内容创作大模型# AI图像生成模型# AI图像编辑模型# 文本生成图像