大模型有哪几类

大模型的分类主要依据应用领域、模型架构、输入数据类型及训练方式,具体可分为以下五类:

一、按应用领域划分

  1. 通用型大模型

    适用于多种任务,如GPT系列、PaLM,具备跨领域的语言理解与生成能力。

  2. 垂直型大模型

    针对特定领域优化,例如医疗、金融、法律等,如百川智能的医疗大模型。

  3. 多模态大模型

    融合文本、图像、语音等多种输入形式,如DeepSeek的多模态版本。

二、按模型架构划分

  1. 密集模型(Dense Models)

    全连接参数结构,如GPT-3、BERT。

  2. 稀疏模型(Sparse Models)

    通过动态激活部分参数提升效率,如混合专家模型(MoE)、DeepSeek、Kimi。

  3. Transformer模型

    基于自注意力机制,适用于NLP任务(如BERT、GPT),也拓展至CV(如ViT)。

三、按输入数据类型划分

  1. 自然语言处理(NLP)

    处理文本,如GPT系列、BERT,用于文本生成、分类等。

  2. 计算机视觉(CV)

    处理图像和视频,如Inception、ResNet,用于目标检测、语义分割等。

  3. 语音识别(ASR)

    专注语音信号处理,如WavNet,实现语音转文本与合成。

四、按训练方式划分

  1. 监督学习模型

    通过标注数据训练,如BERT、GPT。

  2. 自监督学习模型

    无标注数据训练,如SimCLR、MoCo。

  3. 强化学习模型

    通过交互优化策略,如AlphaGo。

五、按推理能力划分

  1. 理解型模型

    侧重语义分析,如BERT。

  2. 推理型模型

    具备复杂逻辑推理能力,如DeepSeek通过长思维链优化。

:不同分类标准可能存在交叉,例如通用型模型可包含Transformer架构,垂直型模型可能使用稀疏模型等。

本文《大模型有哪几类》系辅导客考试网原创,未经许可,禁止转载!合作方转载必需注明出处:https://www.fudaoke.com/exam/2420463.html

相关推荐

人体图形及各部位名称

人体图形及各部位名称是人体解剖学的基础知识,了解它们有助于我们认识身体的结构和功能。以下将详细介绍人体主要部位的名称及其功能。 1. 头部 头部是人体的感知中心,包括脑、眼、耳、鼻和口。 脑 :控制身体的所有功能,包括思考、感觉和运动。 眼 :负责视觉感知,捕捉光线并传递信息给大脑。 耳 :用于听觉和平衡,帮助身体感知声音和保持姿势。 鼻 :嗅觉器官,同时协助呼吸。 口 :进食和发声的主要器官。

2025-05-02 人工智能

财中金控是什么公司

​​财中金控是一家专注于为企业提供一站式资本价值服务的国际精品产业投资银行,其核心优势在于全链条资本赋能、产业投资银行生态系统以及多领域深度服务能力,服务覆盖企业战略规划、资源整合、资本对接及合规管理全过程。​ ​ 财中金控由投资银行、金融、法律等领域的实战专家组成,致力于为高成长企业提供资本导航综合解决方案。自2006年成立以来,公司通过联合培训、走访与咨询,帮助企业树立正确资本价值理念

2025-05-02 人工智能

金控集团是国企吗

​​金控集团不一定是国企,但国内主流金控集团多为国有性质​ ​,其所有权取决于控股股东类型。​​关键亮点​ ​包括:① 国内金控集团主要分为央企系、地方国资系、民营系三类,其中国资控股占主导;② 北京、辽宁等地方金控集团由地方政府100%控股,属于典型国企;③ 部分民营资本控股的金控集团(如复星、蚂蚁)则不属于国企范畴。 根据控股主体差异,金控集团的性质可分为三类: ​​国有独资或控股型​ ​

2025-05-02 人工智能

人体模型属于实物直观吗

‌人体模型属于实物直观的范畴 ‌,它是通过三维立体形式直接呈现人体结构,具有‌可触摸、可观察、可拆解 ‌的特点,能帮助学习者快速建立对解剖学或生理结构的具象认知。 ‌实物直观的核心特征 ‌ 实物直观强调通过真实物体或高度仿真的模型传递信息。人体模型以‌等比还原 ‌的骨骼、器官或肌肉系统为载体,提供视觉、触觉等多感官刺激,比平面图像或文字描述更直观。例如,医学教学中使用的可拆卸心脏模型

2025-05-02 人工智能

资本界金控主营业务

资本界金控集团有限公司(原名:中国投资开发有限公司)主营业务为投资控股,专注于通过上市及非上市证券实现中长期资本增值 ,核心领域覆盖金融服务与高成长性项目投资。以下是其业务模式的详细解析: 投资控股架构 公司通过单一业务部门(投资控股分部)运营,战略重心在于金融服务的全链条布局,包括对上市公司和非上市企业的股权投资,尤其侧重中国及中华文化圈内的高潜力项目。 中长期资本增值策略

2025-05-02 人工智能

人体简化模型有哪些

人体简化模型主要包括以下两类: 质点模型 将人体视为无大小、形状可忽略的质点,通过坐标轴描述其运动轨迹(直线或曲线)。适用于初步分析运动状态,但无法体现人体各部分的相互作用。 刚体模型 假设人体或人体环节在受力后保持大小和形状不变,分为平动、转动和复合运动。该模型简化了实际的人体复杂性,是运动生物力学研究中的基础工具。 补充说明 : 人体简化模型还包括多刚体模型(如松井秀治模型、汉纳范模型等)

2025-05-02 人工智能

人体名称大全

​​人体名称大全涵盖了人体各部位、方位术语、切面以及体表标志等专业知识,以下为您详细介绍。​ ​ 人体常用方位术语以身体直立、两眼平视、两脚跟靠拢等标准解剖姿势为依据,有上(接近头部)、下(接近足底)、前(接近腹侧)、后(接近背侧)、内侧(接近身体正中线)、外侧(远离身体正中线)、近侧(接近肢体根部)、远侧(远离肢体根部)、尺侧(前臂内侧)、桡侧(前臂外侧)、胫侧(小腿内侧)、腓侧(小腿外侧)

2025-05-02 人工智能

金控集团简介

​​金控集团(金融控股集团)是以控股形式整合银行、证券、保险等跨金融业态的综合金融平台,核心价值在于​ ​资源协同、风险隔离与服务实体​​。其通过股权架构实现分业经营下的混业布局,兼具规模效应与监管合规性,是现代金融体系的重要组成。​ ​ ​​定义与特征​ ​ 金控集团需满足至少控股两类以上金融机构(如银行+证券),且金融资产占主导。国际通行的纯粹型(仅投资)与事业型(兼营业务)模式

2025-05-02 人工智能

中国民生银行股东持股比例

中国民生银行(600016)的股东持股比例具有多元化的特点,其中香港中央结算(代理人)有限公司以18.93%的持股比例位居榜首,大家人寿保险股份有限公司-万能产品以10.30%的比例紧随其后。 主要股东及其持股比例 香港中央结算(代理人)有限公司 持股比例:18.93% 股东性质:其他。 大家人寿保险股份有限公司-万能产品 持股比例:10.30% 股东性质:境内法人。 其他主要股东

2025-05-02 人工智能

deepseek在生活中的应用

DeepSeek在生活中的应用广泛且实用,以下是具体场景的 一、学习与自我提升 学科辅导 解答数学难题、物理概念、文学分析等,提供详细解题思路和步骤。 例如:通过输入“如何证明三角形全等”,获取多种证明方法及图形辅助说明。 语言学习 支持翻译、语法纠正、词汇扩展,适合外语学习或母语优化。 实际应用:将复杂句子“Please explain the quantum entanglement

2025-05-02 人工智能

金控公司是什么意思

‌金控公司是指以控股方式管理多家金融机构的综合性金融集团,核心特点是 ‌跨行业经营‌、 ‌风险隔离‌和 ‌协同效应‌。 ‌它通过控股银行、证券、保险等不同领域的子公司,实现资源整合与业务互补,同时需接受严格的‌穿透式监管 ‌。 ‌跨行业经营 ‌ 金控公司通常持有银行、证券、保险、信托、基金等金融牌照,形成全链条服务。例如,母公司不直接开展业务,而是通过子公司覆盖存贷、投资、保障等需求

2025-05-02 人工智能

金控集团是什么级别

金控集团的级别通常与其资本来源和监管背景相关,主要分为央企级(正部/副部)、省属国企级(正厅)、市属国企级(副厅/正处)及民营金控(无行政级别) 。这类集团通过控股银行、证券、保险等金融机构实现综合经营,其级别直接影响资源调配能力和监管要求。 央企级金控集团 由国务院国资委直接管理,如中信集团、光大集团,属于正部或副部级单位。这类集团资产规模超万亿,业务覆盖全国,需接受中央金融监管部门严格审查

2025-05-02 人工智能

大模型的定义

​​大模型是由海量数据训练的人工智能系统,具有参数量大、计算资源需求高、通用性强等特点​ ​,可分为语言、视觉、多模态及基础科学等类别,并已渗透至搜索引擎、自动驾驶等领域。 大模型的核心是通过自监督或半监督学习在海量数据上预训练,早期技术起源于20世纪末的统计语言模型,如IBM的对齐模型和2001年的n-gram模型。随着技术迭代,2017年Transformer架构的提出加速了发展

2025-05-02 人工智能

ccr模型介绍

CCR模型(数据包络分析中的CCR模型)是用于评价多投入多产出决策单元(DMU)相对效率的经典方法,其核心特点如下: 一、基本定义与背景 提出时间与背景 CCR模型由A.Charnes、W.W.Cooper和E.Rhodes于1978年首次提出,是数据包络分析(DEA)的奠基模型,用于衡量相同类型DMU的相对效率。 核心假设 假设DMU处于 固定规模报酬 情形下,即技术水平不变

2025-05-02 人工智能

bge模型是哪家公司的

​​BGE模型是由北京智源人工智能研究院(BAAI)研发的开源通用向量模型,专为信息检索及大语言模型检索增强(RAG)应用设计。​ ​其核心亮点包括:​​国产首个登顶Hugging Face月榜的AI模型​ ​、​​总下载量超4亿次​ ​、​​支持多语言/多模态/多功能一体化技术生态​ ​,并被业界誉为RAG领域的“瑞士军刀”。 BGE模型自2023年8月发布首版以来,历经多次迭代

2025-05-02 人工智能

cge模型用什么软件

CGE模型(可计算一般均衡模型)的构建和求解主要依赖于以下几款软件:GAMS 、GEMPACK 和MATLAB 等。这些软件因其强大的数学建模和求解能力,成为CGE模型研究和应用的主流工具。 1. GAMS(General Algebraic Modeling System) GAMS是一款功能强大的数学建模语言和求解器,广泛应用于经济学领域。它支持多种优化算法,能够高效处理复杂的CGE模型

2025-05-02 人工智能

bgem3是什么模型

‌BGem3是百度最新推出的多模态大语言模型(Multimodal LLM),具备 ‌文本理解与生成、跨模态交互(图文/音视频)、行业场景深度适配三大核心能力。该模型通过百亿级参数训练,在语义理解、逻辑推理和创意生成等任务中表现突出,尤其擅长中文场景下的复杂需求处理。 ‌核心技术架构 ‌ 采用混合专家(MoE)架构动态激活参数,在保持模型规模的同时提升计算效率 融合视觉、语音、文本多模态编码器

2025-05-02 人工智能

ccr模型公式

CCR模型(恒定变化率模型)的核心公式为效率值计算: θ ∗ = min ⁡ θ s.t. ∑ j = 1 n λ j x i j ≤ θ x i 0 , ∑ j = 1 n λ j y r j ≥ y r 0 , λ j ≥ 0 \theta^* = \min \theta \\ \text{s.t.} \sum_{j=1}^n \lambda_j x_{ij} \leq \theta

2025-05-02 人工智能

cae模型是什么

计算机辅助工程模型 CAE模型是计算机辅助工程(CAE)中的核心组成部分,是用于模拟和分析工程系统性能的数学模型。以下是关于CAE模型的综合解析: 一、基本定义 CAE模型通过数学公式和离散化方法,将复杂的工程结构或物理场转化为可计算的有限元组合体,从而实现力学性能分析、优化设计等功能。其核心思想包括: 离散化 :将连续体结构划分为有限个规则单元(如梁、板、壳等); 数学建模 :结合材料力学

2025-05-02 人工智能

微信上如何使用deepseek

在微信上使用DeepSeek主要有​​四种主流方式​ ​:通过微信AI搜索功能(需灰度测试资格)、官方小程序、公众号菜单入口或网页版浮窗快捷访问。​​关键优势​ ​包括直接调用联网数据、支持社交分享、多场景智能辅助,且无需额外下载应用。 ​​微信AI搜索(**体验入口)​ ​ 若账号被灰度覆盖,微信首页搜索框会出现“AI搜索”按钮,选择“深度思考-R1”模式即可提问。该入口响应速度最快

2025-05-02 人工智能
查看更多
首页 顶部