
一、Step 3.7 Flash:原生多模态AI Agent模型,最高400 Tokens/s生成速度
Step 3.7 Flash是由国内AI创业公司“阶跃星辰”(StepFun)于2026年5月29日正式发布并开源的一款面向生产级Agent(智能体)场景设计的高效率Flash模型。它的定位非常明确:成为企业构建和部署AI智能体的高性能、低成本基座。
与追求极致参数规模的“巨无霸”模型不同,Step 3.7 Flash采用了稀疏混合专家(MoE)架构,在总参数高达1960亿(另含18.8亿参数的视觉编码器ViT)的情况下,每次推理仅激活110亿参数。这种设计使其在速度、成本与复杂任务处理能力之间取得了卓越的平衡。其最高生成速度可达每秒400个Token,并支持长达25.6万Token的上下文,特别适合需要快速响应、多轮交互的自动化工作流。
Step 3.7 Flash核心功能快览
Step 3.7 Flash是一款专为高频、多轮、低延迟的智能体应用场景设计的开源大模型。它采用稀疏MoE架构,总参数1960亿,激活参数仅110亿,在保持强大能力的同时显著降低了推理成本。模型核心强化了四大能力:原生多模态理解与执行、联网与视觉搜索增强、高可靠工具调用与编排以及Agent生态兼容优化,能够稳定处理UI界面、图表、文档等复杂视觉信息,并驱动浏览器、终端、Office等外部工具完成自动化任务。

产品关键信息列表:
- 发布公司:阶跃星辰(StepFun)
- 发布日期:2026年5月29日
- 模型类型:稀疏MoE架构大语言模型(含视觉编码器)
- 核心定位:生产级高效率AI Agent基座模型
- 是否开源:是(采用宽松的开源协议)
- 总参数量:196B (1960亿) + 1.8B ViT
- 激活参数量:11B (110亿)
- 最高生成速度:400 Tokens/秒
- 上下文长度:256K Tokens
- 核心优化方向:Agent能力、Coding、Search与多模态工作流
二、Step 3.7 Flash的主要功能和特点
Step 3.7 Flash并非通用聊天模型,其所有能力都围绕“让AI智能体更可靠、更高效地工作”这一目标进行系统性优化。其主要功能和特点可归纳为以下四个方面:
- 原生多模态理解与执行 模型能够原生理解并处理图像、UI界面、图表、文档、网页截图等复杂视觉信息。它不仅能“看懂”图片内容,还能将视觉信息转化为结构化的数据、可执行的代码或具体的任务指令。例如,给它一张软件界面截图,它可以理解各个控件的功能并生成操作脚本;给它一个数据图表,它能进行分析并撰写报告。
- 联网与视觉搜索增强 在面对信息不确定或知识盲区时,Step 3.7 Flash能够主动发起联网搜索(包括文本和图像搜索),获取多源证据并进行交叉验证。这意味着它不再局限于训练数据,可以实时获取最新信息来辅助决策,大大增强了在开放世界任务中的实用性。
- 高可靠工具调用与编排 这是其作为“生产级”Agent模型的核心。模型经过专门优化,可在长程、多轮的工作流中稳定调用各类外部工具和API,如浏览器、命令行终端、Office套件(Word, Excel)、各类软件接口等。官方称其显著降低了智能体在执行复杂任务时“跑偏”或工具调用失败的风险。
- Agent生态兼容优化 为了降低开发者的集成成本,Step 3.7 Flash针对主流的Agent开发框架和工具协议进行了兼容性优化。它可以无缝接入 Claude Code、KiloCode、Hermes Agent、OpenClaw 等流行框架,并支持 MCP(Model Context Protocol)和Skills 等工具调用协议。这使开发者无需大幅修改现有工作流即可利用该模型的能力。
三、如何使用Step 3.7 Flash?
Step 3.7 Flash作为开源模型,为开发者提供了灵活的部署和使用方式。
1. 获取与部署方式:
- 开源代码与模型权重:模型已在阶跃星辰的官方开源平台(如Hugging Face、ModelScope等)发布,开发者可以下载模型权重进行本地部署或微调。
- 云端API调用:通过阶跃星辰开放平台(StepFun)提供的API服务,可以直接调用Step 3.7 Flash,无需管理底层基础设施。
- 本地部署优化:官方提供了GGUF格式的量化版本,方便开发者在个人工作站或边缘设备上进行部署,适配不同性能的硬件资源。
2. 快速上手教程:
对于大多数用户,通过阶跃星辰官网的在线体验入口是最快捷的方式。
- 访问官网:打开浏览器,访问阶跃星辰官方网站:www.stepfun.com。
- 注册/登录账号:完成简单的注册流程并登录。
- 选择模型:在模型选择区域,找到并选择“Step 3.7 Flash”。
- 开始体验:你可以在对话框中直接输入指令,例如:“分析这张图片中的图表趋势”(需上传图片),或“打开浏览器搜索今天的最新科技新闻并总结成简报”。模型会展示其多模态理解和工具调用的能力。
3. 集成到现有项目:
对于开发者,可以参考官方文档,通过几行代码将模型集成到自己的Agent系统中。通常步骤包括:安装SDK、配置API密钥(如果使用云端服务)、定义工具列表,然后即可开始构建智能体应用。
四、官方地址与获取方式
- 官方网站:https://www.stepfun.com
- 这是获取产品最新信息、技术文档、在线体验和API服务的主要入口。
- 开源仓库:
- Hugging Face:搜索 “StepFun-AI/Step-3.7-Flash”
- ModelScope:搜索 “阶跃星辰/Step-3.7-Flash”
- (注:具体仓库地址请以阶跃星辰官方公告为准)
- 在线体验与API:通过官网登录后,可在控制台找到Step 3.7 Flash的体验入口和API调用配置。
五、Step 3.7 Flash vs 同类型竞品对比分析
为了更直观地展示Step 3.7 Flash的市场定位,我们将其与同期其他面向Agent场景的知名模型进行横向对比。
| 特性维度 | Step 3.7 Flash (阶跃星辰) | Claude Code (Anthropic) | OpenClaw (开源社区) | Hermes Agent |
|---|---|---|---|---|
| 核心定位 | 生产级、高效率Agent基座 | 代码生成与自动化助手 | 开源通用Agent框架 | 研究导向的智能体模型 |
| 模型架构 | 稀疏MoE (196B+1.8B ViT) | 未公开(推测为稠密) | 框架,可接入多种模型 | 通常基于Llama等微调 |
| 最大亮点 | 速度与成本平衡、工具调用可靠性、原生多模态 | 代码能力极强、逻辑严谨 | 灵活性高、社区生态丰富 | 指令遵循能力强 |
| 工具调用 | 高可靠编排,支持长程多轮工作流 | 优秀,但更侧重代码环境 | 依赖后端模型能力 | 良好,但稳定性待提升 |
| 多模态能力 | 原生支持,可理解UI/图表/文档 | 有限(主要通过插件) | 依赖后端模型 | 通常需额外视觉模型 |
| 生成速度 | 最高400 Tokens/s (宣传数据) | 较快,但未公开具体数据 | 取决于后端模型 | 取决于基础模型 |
| 开源情况 | 完全开源 | 闭源(仅API) | 框架开源,模型另选 | 模型通常开源 |
| 生态兼容 | 优化支持主流框架(Claude Code, OpenClaw等) | 自有生态 | 作为框架本身 | 良好 |
| 适用场景 | 企业级自动化流程、复杂任务智能体 | 软件开发、编程辅助 | 实验性Agent项目、快速原型 | 学术研究、特定任务智能体 |
对比总结:Step 3.7 Flash在工具调用的生产级可靠性、原生多模态理解以及极高的推理速度上形成了差异化优势。相较于闭源的Claude Code,它提供了开源的自由度;相较于其他开源方案,它在面向复杂、长周期任务的稳定执行上做了深度优化。
六、典型应用场景与实际体验
Step 3.7 Flash的设计瞄准了真实的企业生产需求,能为多个岗位和行业解决具体问题:
- 软件研发与测试工程师:可以构建自动化的UI测试智能体。只需给模型一个软件界面截图,它就能理解界面元素,生成并执行测试用例,自动点击、输入数据、验证结果,大幅提升测试效率。
- 数据分析师与商业智能(BI)岗位:模型能够直接读取图表、Excel文件或数据库查询结果截图,理解其中的数据关系,并自动进行趋势分析、生成数据报告,甚至根据结论提出业务建议。
- 运营与市场人员:可以打造一个“市场情报助手”。智能体能够根据指令,自动搜索竞品最新动态、社交媒体舆情、行业报告,并整合信息生成竞品分析周报或营销策略建议。
- 客户支持与流程自动化:通过连接企业内部系统(如CRM、ERP),智能体可以处理标准的客户查询、生成服务工单、跟进处理进度,实现7×24小时的初级客服与流程触发自动化。
实际体验优势:根据基准测试,Step 3.7 Flash在考察多工具协同的Toolathlon上得分达49.5%,在真实环境日常任务执行的ClawEval-1.1上达到67.1%,在横跨44种职业的GDPval上达到45.8%。这些数据表明,其在处理需要协调多个步骤和工具的复杂任务时,具有较高的成功率和实用性。
七、Step 3.7 Flash能为用户带来的价值
- 降本增效:高达400 Tokens/s的生成速度和高效的MoE架构,意味着用更低的计算成本获得更快的任务响应,直接降低企业的AI算力支出。
- 提升自动化可靠性:针对工具调用和长程工作流的优化,减少了智能体“失控”或失败的概率,使得将关键业务流程交由AI处理变得更加可行和放心。
- 降低开发门槛:对主流Agent框架和协议的兼容,让企业现有的开发团队能更平滑地集成和迁移,加速AI智能体的落地周期。
- 解锁多模态场景:原生视觉理解能力让AI不再局限于文本,可以处理企业内大量存在的图像、文档、图表等非结构化数据,拓展了自动化边界。
八、最近3到6个月内的重大更新与动态
Step 3.7 Flash于2026年5月29日刚刚发布,是阶跃星辰“Step”系列模型的最新版本。此次发布是该公司推动Agent技术进入企业生产流程的关键一步。
- 与前代对比:相较于2026年2月开源的Step 3.5 Flash,3.7版本在Agent核心能力上进行了系统性强化,特别是在多模态理解与执行的深度、工具调用的稳定性以及生态兼容性上有了显著提升。
- 公司动态:阶跃星辰在2026年1月完成了超50亿元的B+轮融资,投后估值进入200-300亿元区间,并正在加速赴港IPO的准备工作。其模型已在OPPO、荣耀等手机品牌装机超4200万台,并与吉利汽车等车企深度合作。
九、常见问题FAQ解答
Q1: Step 3.7 Flash是免费的吗?
A: 是的,Step 3.7 Flash是开源模型,其模型权重可以免费下载、研究和商用(需遵守其开源协议)。通过阶跃星辰官方平台调用API服务可能涉及费用,具体需参考其定价策略。
Q2: 我需要很强的技术背景才能使用它吗?
A: 对于普通用户,通过官网的在线演示界面可以零代码体验其核心功能。对于希望集成到业务中的开发者,需要具备一定的编程和AI应用开发知识。官方提供了详细的文档和示例来降低上手难度。
Q3: 它和ChatGPT、Claude等通用聊天模型有什么区别?
A: 核心区别在于设计目标。ChatGPT等旨在进行开放域对话,而Step 3.7 Flash专为执行具体任务而优化。它更擅长理解复杂指令、调用工具、处理多轮工作流,并且在多模态理解和工具调用的可靠性上更强,但在天马行空的创意对话上可能不如专用聊天模型。
Q4: 它的“视觉搜索”功能是什么意思?
A: 传统搜索是基于文本关键词。Step 3.7 Flash的“视觉搜索”意味着它可以对图像内容进行理解并生成搜索查询。例如,你给它一张不认识的花的图片,它不仅能识别出可能是某种花,还能自动生成搜索词去查找这种花的详细信息,实现“以图搜图”和“以图搜文”。
Q5: 本地部署对硬件有什么要求?
A: 由于采用了稀疏MoE架构且激活参数仅110亿,其对硬件的要求相对友好。官方提供的GGUF量化版本可以在消费级显卡(如RTX 4090)甚至高性能CPU上运行。具体配置要求需参考官方发布的模型卡片。
十、总结
Step 3.7 Flash的发布,标志着AI智能体(Agent)技术从“玩具”和“演示”走向企业级生产环境迈出了坚实的一步。它不再单纯追求benchmark分数,而是紧紧围绕“可用、可靠、好用”的生产需求,在速度、成本、多模态理解和工具调用稳定性上找到了一个优秀的平衡点。
对于开发者而言,它是一个功能强大且开源自由的基座,可以快速构建复杂的自动化智能体。对于企业而言,它提供了一个经过优化、能够真正集成到业务流程中创造价值的AI解决方案。尽管在通用知识面和创意能力上可能不及一些顶级闭源模型,但在其专注的生产级Agent赛道,Step 3.7 Flash无疑是一个极具竞争力的新选择。
随着阶跃星辰在资本和产业端的持续发力,Step 3.7 Flash有望在金融、制造、软件、客服等多个行业催生出真正规模化落地的AI应用。
本文最新更新日期:2026年5月30日
参考文章或数据来源
本文综合参考了以下权威信源的信息:
- i黑马:《阶跃星辰开源Step 3.7 Flash大模型 ,推动Agent向企业生产级演进》
- 凤凰网:《阶跃星辰开源Step 3.7 Flash大模型》
- 上海证券报/中国证券网:《阶跃发布并开源生产级高效率Agent模型Step 3.7 Flash》
- AI工具集:《Step 3.7 Flash – 阶跃星辰开源的新一代 Flash 模型》
- 网易转载i黑马报道:《阶跃星辰开源Step 3.7 Flash大模型 ,推动Agent向企业生产级演进》
- 腾讯网:《阶跃星辰发布并开源 Step 3.7 Flash:原生多模态,最高生成速度400 Tokens/s》
- 证券日报网:《阶跃星辰发布并开源Step 3.7 Flash 推动Agent进入企业规模化生产流程》
- 阶跃星辰官方网站 (www.stepfun.com)
- 高工智算相关行业分析报道
引用总结:本文主要引用了i黑马、凤凰网、上海证券报、腾讯网、证券日报网等主流科技与财经媒体的报道,以及阶跃星辰官方发布的技术信息,确保了内容的时效性、准确性和专业性。所有性能数据及功能描述均以上述信源为准。
数据统计
更多AI产品信息
阶跃Step 3.7 Flash
已有 5 次访问体验
已收录
申请修改
阶跃Step 3.7 Flash的官网地址是?
阶跃Step 3.7 Flash的官网及网页版入口是:https://www.stepfun.com/ 官网入口👈
网站流量数据说明
网站数据仅供参考。评估因素包括访问速度、搜索引擎收录、用户体验等。 如需获取详细数据(如IP、PV、跳出率等),请联系站长获取。
推荐数据源
爱站/AITDK
关于阶跃Step 3.7 Flash文章内容的特别声明
AI产品库AIProductHub是一个专注于AI产品收录与分享的网站平台,平台收录了1000余款AI产品,覆盖创作、办公、编程、视频生成、电商、设计、写作、图像生成等多个领域和行业,平台旨在帮助更多的用户发现更好用的AI产品。本站【AI产品库官网 – AIProductHub】提供的【阶跃Step 3.7 Flash】信息来源于网络,由AI搜集汇总并整理成文。 对于该外部链接的指向,不由【AI产品库官网 – AIProductHub】实际控制。【阶跃Step 3.7 Flash】在【2026-05-30 17:00】收录时, 该指向跳转网页链接内容属于合规合法,后期如出现违规内容,可直接联系网站管理员删除,【AI产品库官网 – AIProductHub】不承担任何责任。
本文地址:https://aiproducthub.cn/sites/step-3-7-flash.html 转载请注明来源
相关导航

LogoAI是一款AI驱动的在线Logo设计工具,输入品牌信息即可快速生成专业标识,支持自定义编辑和配套视觉素材输出。

Awaker
智子引擎Awaker是业界首个具备自主更新能力的多模态大模型,采用MoE架构,在复杂推理任务中表现卓越,已成功应用于国家电网、城市治理等实际场景。
Pixmax
Pixmax是一款一站式AI视频创作平台,直连Seedance 2.0满血版API,提供免排队、支持真人、成本减半的影视级视频生成服务。

造梦日记
造梦日记,原名盗梦师,是西湖心辰联合西湖大学研发的一款AI绘画工具,覆盖多模态模型训练和图像生成,包括二次元头像生成、图片设计等,可应用于绘画、动漫游戏、运营策划和电商等领域,人人都可实现自己的创作梦。

LexAI-Global Platform for Legal Research & Knowledge Management
LEX AI: Premier platform for legal pros, with 300+ global sources, personalized alerts, summaries, and mobile access. Revolutionizing Legal Horizon Scanning.

花生AI
花生AI是B站的AI视频创作工具,支持文生视频、音色克隆等功能,3分钟即可快速成片。

元典智库
元典智库是一款面向法律从业者的一站式法律信息与知识服务平台,通过AI技术实现案例、法规、企业等数据的智能检索与分析。

涂鸦智能Hey Tuya AI生活助手
涂鸦智能Hey Tuya是一款基于Multi-Agent架构的AI生活助手,能够协同全屋智能设备,实现从被动控制到主动服务的智能生活体验。
您必须登录才能参与评论!
立即登录


























速度快到惊人,真能省下算力费。