奇点前尘:回望人工智能2025

The Eve of the Singularity

作者:ypingcn 首次发布时间:2025年12月28日 最后更新时间:2025年12月28日
[AD] -- 下方为内容广告,点击支持作者,想过滤广告? -- [AD]

大模型 Deepseek 是在 2025 年初发布的,今年的 AI 发展之快令人咋舌,特此记录下来。

  • 1 月 20 日:DeepSeek R1 聊天机器人
  • DeepSeek 发布基于 R1 的免费聊天机器人,迅速登顶美区 App Store 免费榜,被视为中国开源高性价比推理模型“打到海外”的标志性事件。

  • 1–3 月:Gemini 2.0 / 2.5 系列
  • Google 先后上线 Gemini 2.0 Flash(1月30日)、2.0 Pro(2月5日)及 Gemini 2.5 Pro 实验版(3月25日),将百万级上下文和“思考模式”引入主流产品线。

  • 2–4 月:OpenAI 4.x 与 o 系推理模型
  • 2月27日发布 GPT‑4.5“Orion”,4月14日推出 GPT‑4.1/mini/nano,4月16日发布推理模型 o3 与小型 o4‑mini,补齐编码、工具调用和长链式推理能力。

  • 4 月 5 日:Meta Llama 4
  • Meta 发布 Llama 4(Scout、Maverick 等),采用混合专家(MoE)架构的多模态开源模型,强调多语言与超长上下文。

  • 5 月 22 日:Anthropic Claude 4
  • Anthropic 推出 Claude Opus 4 和 Sonnet 4,主打长时 AI 代理与顶级编码能力,Opus 4 被宣传为“世界最强编码模型”之一,Sonnet 4 面向免费用户开放。

  • 3–8 月:DeepSeek 开源家族迭代
  • 3月24日发布 V3‑0324 版本,5月28日推出 R1‑0528,8月21日上线 V3.1 等升级,在推理和编程基准上持续逼近闭源旗舰,同时保持 MIT 许可和极低使用成本。

  • 4–9 月:QWen3 持续更新
  • 04月29日/07月23日/09月24日:阿里开源 Qwen3(“混合推理”思考/非思考模式),并推出面向编程的 Qwen3‑Coder、超大参数 Qwen3‑Max(>1T)。

  • 8 月 7 日:OpenAI GPT‑5
  • OpenAI 正式发布多模态 GPT‑5,将推理与非推理统一在一套接口下,取代 4.x 和部分 o 系成为新一代通用旗舰模型。

  • 11–12 月:Gemini 3 系列
  • 11月18日 Google 发布 Gemini 3 Pro 和 Pro DeepThink,12月17日再推低成本的 Gemini 3 Flash,并将其设为 Gemini 应用默认模型,主打百万上下文、编码代理与更高性价比。

  • 11 月 24 日:Claude Opus 4.5
  • Anthropic 上线 Claude Opus 4.5,进一步提升软件工程、agent 与电脑操作能力,外部评测称其在编码场景中可与甚至超越 GPT‑5.1 与 Gemini 3。

  • 11–12 月:OpenAI GPT‑5.1 / 5.2 与开源权重
  • 11月推出 GPT‑5.1 家族及面向长时自动编码的 5.1‑Codex‑Max,12月11日再发 GPT‑5.2/5.2 Pro,区分 instant / thinking 模式;同时发布 gpt‑oss‑120b/20b 等开源权重模型,强调更“有个性”的对话体验和“可在本地运行”的开放生态。

而基于AI的产品更如泉水般涌现,极大提高了日常效率。从“模型竞赛”转向“生态融合与垂类爆发”。

  • 1月:DeepSeek App全球爆火
  • DeepSeek-R1模型上线 DeepSeek App(iOS/Android),免费提供“深度推理”功能,用户可见AI思考链条。1月底登顶中美App Store,新增“推演模式”解数学/编程题,逼迫竞品跟进。

  • 2-3月:字节“豆包+即梦”视频生态
  • 豆包 App 接入PixelDance视频生成,一键文字转5-10秒高清视频,并无缝剪映编辑。即梦AI 网页/移动版推协作3D建模,设计师用AI草图实时渲染,月活破千万。

  • 4月:Kimi“探索版”长任务Agent
  • 月之暗面 Kimi App/插件 升级为研究Agent,拆解复杂任务(如财报分析),后台联网/PDF阅读生成图表报告。浏览器版支持“边读边问”。

  • 5-6月:阿里腾讯办公超级App
  • 阿里 通义App 嵌入钉钉/夸克,“AI助理2.0”群聊抓待办、SaaS执行。腾讯元宝App打通微信搜一搜“深度回答”,腾讯会议AI同传/纪要分发。

  • 8月:MiniMax海螺“视频通话”
  • 海螺AI App首创实时视频聊天,AI虚拟角色表情/动作同步生成,情感陪伴类月下载量飙升。

  • 10-12月:WPS垂类办公+教育
  • WPS AI “Text-to-Office”一键生成PPT/演讲/Excel。网易有道AI家教纸质作业实时批改/语音讲解,覆盖K12教育。

AI辅助编程工具从“补全”进化为“全栈Agent”,强调多文件/云端执行与治理。

  • Qoder(新兴全栈Agent IDE)

    1月Beta,4月GA,支持“自然语言项目生成”(如“建电商后端”自动拉栈/代码/PR)。10月推企业版,集成Slack审计,月活开发者超50万。

  • Trae(字节海外版MarsCode)

    2月上线云IDE,6月v2强化Python/Go重构,一键GitHub复刻+AI优化。12月加MCP自定义工具,攻占中小团队市场。

  • Codebuddy(Anthropic生态CLI/Web代理)

    3月从Claude扩展,7月Web版管多Agent,10月Claude 3.5集成“代码审计+修复”。11月企业Skills包,金融安全扫描领先。

  • Antigrivaty(反重力代码优化器,专注性能)

    5月公测,专攻遗留代码迁移/优化(如Java→Rust),8月Cursor插件版流行。12月开源MoE模型,边缘设备部署火爆。

  • Cursor(市场龙头)

    1月Copilot Edits GA,4月Agent默认+Web搜索,7月Bugbot GitHub集成,10月1M token上下文+规则自定义。12月团队协作SDK,占AI IDE份额40%。

[AD] -- 下方为内容广告,点击支持作者,想过滤广告? -- [AD]