预训练模型

来自通约智库
江南仁讨论 | 贡献2023年9月17日 (日) 13:24的版本 (创建页面,内容为“{{4}} 预训练模型是一种预先在大量数据集上训练过的神经网络模型,这种模型已经过训练以执行特定任务,如识别图片中的分...”)
(差异) ←上一版本 | 最后版本 (差异) | 下一版本→ (差异)
跳转至: 导航搜索

预训练模型是一种预先在大量数据集上训练过的神经网络模型,这种模型已经过训练以执行特定任务,如识别图片中的分类问题。这种方法利用大规模数据的信息来初始化模型参数,然后通过微调或迁移学习,将模型适应到特定的目标任务上。
预训练模型无需标签就可以从数据中学习有用的特征,而且其预训练方法多样,包括自编码器、语言模型和图像特征提取等。这些模型适用于多种通用任务,如分类、回归和语音识别等。
在具体使用中,人们通常会选择在大型公开数据集(如ImageNet)上预训练的模型,这些模型已经经过了深度训练,可以作为新模型的起点,从而避免从头开始训练模型并节省时间和计算资源。