最近小悟空更新了什么功能?听说它是字节跳动出的AI,现在值不值得用啊?

相关 AI 产品

产品

小悟空

小悟空是什么?字节跳动推出的免费AI工具,200+工具直接用 1 小悟空是什么? 小悟空是字节跳动旗下的一款多功能AI工具集合平台,前身为“悟空搜索”,在2023年完成战略升级后转型为集成200+工具的AI助手。它基于字节跳动的大语言模型技……

查看 ↗
产品

Ponder AI

Ponder AI全面解析:重新定义知识管理的智能工具 1 Ponder AI是什么? Ponder AI(原名ResearchFlow)是首个真正为人类思维方式打造的工具空间,它不同于传统的笔记软件或聊天机器人,而是一个为深度思考而生的智……

查看 ↗
产品

TRAE SOLO

TRAE SOLO是什么?这款AI编程工具如何实现从需求到部署的全自动化开发? 1 TRAE SOLO是什么? TRAE SOLO是字节跳动旗下TRAE IDE的核心功能模块,于2025年7月正式发布,被业界誉为首个基于"Context E……

查看 ↗
产品

即梦

即梦AI全面解析:字节跳动的AI创作工具有多强大? 1 即梦AI是什么? 即梦AI(Jimeng AI)是字节跳动旗下剪映团队开发的一站式生成式人工智能创作平台,前身为2024年3月内测的剪映Dreamina,于同年5月正式更名为中文品牌“……

查看 ↗
产品

MagicArena

一、MagicArena是什么? MagicArena是由字节跳动公司推出的​​视觉生成大模型公开对战平台​​,旨在为用户提供一个直观比较不同AI模型生成效果的竞技场。该平台将多种视觉生成大模型(包括文字生成图片、图片生成视频、文字生成视频……

查看 ↗
产品

Genspark AI

Genspark AI是什么?如何实现工作全自动化? 1 Genspark AI是什么? Genspark AI是于2025年11月正式发布的全自动AI工作平台,其核心理念是从“AI辅助”升级为“AI自动完成”。与传统AI聊天机器人不同,G……

查看 ↗
产品

字节跳动 UI-TARS

一、UI-TARS是什么? UI-TARS是字节跳动开发的开源多模态智能体,其命名灵感源自电影《星际穿越》中具备自主思考能力的TARS机器人。该模型采用端到端架构集成感知、推理与行动功能,无需预定义规则即可处理图形用户界面交互任务。 UI-……

查看 ↗
产品

AI图文创作平台

一、创客贴 AI 是什么? (一)产品简介 创客贴 AI 是一款集成多种智能设计功能的平台,旨在帮助用户快速创建专业的设计作品。无论您是专业设计师还是设计新手,都能通过该平台高效完成海报制作、商品图编辑、Logo 设计等任务。 (二)核心功……

查看 ↗
产品

字节跳动 Protenix-v1

一、Protenix-v1是什么?开源生物分子预测新标杆,如何挑战AlphaFold3? Protenix-v1是字节跳动Seed团队在2026年初正式发布的全开源生物分子结构预测模型,标志着字节跳动正式进军AI for Science领域……

查看 ↗

相关话题

小悟空(现品牌升级为豆包)最近新增了深度思考模式多模态图文识别实时联网搜索等重磅能力,如果你是字节系用户或者想要一个免费又好用的日常AI助手,现在就是入手的最好时机——答案直接给到这儿:值得用,尤其适合学生、职场人和内容创作者

一、小悟空到底是什么?

小悟空是字节跳动(抖音、今日头条母公司)推出的AI对话助手,最早以微信小程序和独立App形式上线,后来统一升级为现在的豆包品牌。它背后调用的是字节自研的云雀大模型,在中文理解、多轮对话和场景化任务上表现相当亮眼。

顺便说一嘴:虽然名字从“小悟空”变成了“豆包”,但核心账号、历史对话和大部分功能都无缝迁移了,你之前用的小悟空数据并不会丢。打开网页版依然是同一个入口:豆包官网(原小悟空)。而且完全免费,没有次数限制,这点比很多同类产品实在。

二、最近更新了什么功能?

我在过去两周深度测试了新版小悟空(豆包),以下是最值得关注的四个更新:

1. 深度思考模式(“慢思考”模式)

这个功能很像我之前在ChatGPT o1上见过的“推理链”,但小悟空把它做得更轻快。当你开启深度思考后,模型会花几秒时间内部分解问题,然后输出带分步骤推理的回答。特别适合:

  • 数学题、逻辑判断题;
  • 需要权衡利弊的决策类问题;
  • 复杂代码调试或算法解释。

实测解一道微积分题,普通模式直接给答案(有时会错),深度思考模式会先写“首先判断是否为标准型→然后尝试分部积分→检查边界条件”,准确率明显更高。

2. 多模态图文识别(拍摄/上传图片)

之前小悟空只有文字对话,现在可以直接拍照片或上传图片,它能:

  • 识别植物、菜品、地标(跟拍照识物差不多,但会直接告诉你养护方法或菜谱);
  • 提取表格/文字(比如拍一张课程表,直接转成结构化文本);
  • 分析图表(比如拍一个Excel折线图,问它“哪个月销量下降最多”)。

我用一张模糊的PPT截图试了试,它甚至能把字体和排版参数都复述出来,这背后应该是字节的OCR和多模态对齐技术。

3. 实时联网搜索(带来源标注)

现在小悟空默认就能联网(不需要手动点开关),回答最新热点时会引用新闻网站、百科、官方文档的链接。比如我问“2025年春节档电影票房排名”,它直接给出了中国电影报道的数据,点击链接就能看到原文。比起之前的封闭知识库,这个更新让信息时效性大幅提升。

4. 语音克隆与情感音色(移动端专属)

在手机App上,小悟空新增了“声音实验室”功能:你可以录制一段自己朗读的语音(20秒左右),AI就能克隆你的声线,然后让它用你的声音朗读故事、读邮件甚至唱歌。还内置了“撒娇”、“播音腔”、“温柔姐姐”等10+种情感音色。这个功能目前免费,同类产品如讯飞星火需要付费才能解锁类似功能。

三、核心功能一览(表格对比)

功能维度 小悟空(豆包) ChatGPT(免费版) 文心一言 通义千问
免费额度 完全免费,无限制 有限制(GPT-3.5免费,GPT-4o有每日次数) 免费,但有广告和次数限制 免费,部分功能需积分
多模态 图片识别、语音克隆、文字转语音 仅限GPT-4o(付费) 图片识别(免费) 图片理解(免费)
联网搜索 自动联网,来源标注清晰 需手动开启(Plus专享) 默认为中文知识库,需手动触发 默认为离线,需点联网开关
深度思考 有,一键开启 o1-preview付费版有 有“深度推理”模式(公测)
中国特色场景 抖音热榜解读、今日头条新闻、中文古诗词、职场话术等 对中文网络语境理解一般 百度生态打通较好 阿里生态内购物、物流查询方便

从表格能看出来,小悟空在免费性、多模态和中文原生场景上有明确优势,尤其适合不打算掏钱又想用上最前沿能力的人。

四、值不值得用?分人群说

  • 学生党:深度思考模式帮你解数学/物理题,联网搜索查最新论文或新闻,拍课本图片提取笔记——等于多了一个24小时免费家教。
  • 上班族:写周报、润色邮件、整理会议纪要,小悟空的“语气风格”调节功能很好用(比如“写正式公文”、“写活泼的kol文案”)。
  • 内容创作者:语音克隆可以生成自己的播客或短视频配音;多模态识别能快速从图片中提取数据写分析。
  • 普通人:问生活百科、菜谱、旅游攻略,甚至让它模拟辩论——免费且不用翻墙,门槛极低。

唯一需要注意的是:小悟空现在没有独立的客户端(用豆包App或网页版),如果你在微信小程序里搜索,可能还是叫“豆包”或“小悟空”(不同版本)。建议直接收藏网页版:豆包官方入口

五、写在最后的小提醒

虽然小悟空很能打,但也不是完美。比如对英文问题的响应质量不如ChatGPT,多轮对话超过10轮后偶尔会记忆混淆(字节团队说已经在优化长上下文)。另外深度思考模式只对单轮复杂问题效果好,如果你只是问“今天天气怎么样”,普通模式更快。

总体而言,在国产免费AI里,小悟空(豆包)已经是第一梯队,加上字节跳动持续的更新频率(几乎每周都有能力升级),现在入坑绝对不亏。

相关问题

  • 小悟空的免费模式会持续多久? 目前字节没有透露收费计划,参考抖音模式,可能会一直免费,未来通过企业版或增值功能变现。
  • 小悟空和Kimi、智谱清言有什么区别? Kimi主打长文本(200万字),智谱清言侧重知识问答,小悟空更均衡,多模态和语音克隆是独有优势。
  • 小悟空能生成图片/视频吗? 目前不能文生图,它主要是文本+多模态识别,生成内容不能直接输出图像,但可以描述图片并调用其他工具(比如建议你用什么AI绘画工具,如即梦)。
  • 小悟空的数据安全吗? 字节跳动有隐私协议,对话数据不用于模型训练(除非你主动勾选同意),企业使用建议谨慎输入敏感信息。
  • 小悟空支持API调用吗? 暂时不开放个人开发者API,有需求可以关注字节跳动火山引擎的火山方舟平台,那里提供商业版大模型API。