DeepSeek目前可通过腾讯元宝实现图生文功能,支持上传图片并基于内容分析解答,但独立版本仍以文本处理为主。
-
核心功能升级
结合腾讯混元多模态技术后,用户可在腾讯元宝上传图片,由DeepSeek解析图像中的文字、物体及简单逻辑关系,例如解答数学题或描述场景。 -
当前技术限制
对无文字描述的复杂图像(如抽象艺术或剧情截图),分析能力仍依赖基础推理,难以实现深度情节解读或创意生成。 -
使用场景建议
适合需要提取图片文字、解答图表类问题的场景,但需注意独立版DeepSeek暂不支持直接识图,建议通过文本转换处理图像需求。
未来随着技术迭代,多模态能力或进一步扩展至视频、语音领域,建议关注官方更新以获取最新功能。