豆包使用的是字节跳动自研的云雀大语言模型,该模型基于Transformer架构,具备多模态能力与商业化落地优势,日均处理超4万亿Tokens,并衍生出深度思考、文生图、视频生成等创新功能。
- 核心模型架构:云雀模型采用Transformer结构,通过大规模数据训练实现文本生成、知识问答等任务,后续升级为MoE架构(如豆包1.5深度思考模型),激活参数仅20B,兼顾性能与成本效率。
- 多模态扩展:除基础语言模型外,豆包陆续推出Seedream 2.0文生图模型、PixelDance视频生成模型等,支持图像理解、音乐创作等跨模态应用,技术覆盖从文本到视频的全链条生成。
- 商业化与开源:模型定价0.0008元/千Tokens,成本仅为行业1%,同时开源SuperGPQA评测基准,推动跨学科推理能力标准化,体现技术透明性与生态共建意识。
豆包通过持续迭代云雀模型家族,已覆盖聊天、创作、企业服务等场景,其技术路线与落地实践为AI大模型发展提供了重要参考。