【NLP基础知识-bert向量化】BERT模型输出pooler_output和last_hidden_state详解和用法_stm32

【nlp基础知识-bert向量化】bert模型输出pooler_output和last_hidden_state详解和用法

本次修炼方法请往下查看
在这里插入图片描述

🌵文章目录🌵

🎯 1. 基本介绍
- 1.1 bert的关键特点
- 1.2 bert模型的输出
💡 2. bert向量化使用方法
- 2.1 bert模型输出介绍
- 2.2 输出的具体用法
🔍 3. 注意事项

下滑查看解决方法

🎯 1. 基本介绍

bert（bidirectional encoder representations from transformers）是一种预训练语言表示模型，由google在2018年提出。它通过使用transformer架构的编码器部分，能够捕捉到文本的双向上下文信息。bert模型在自然语言处理（nlp）领域取得了革命性的进展，为各种下游任务提供了强大的基础。

1.1 bert的关键特点

双向上下文理解：与传统的单向语言模型不同，bert能够同时考虑左右两边的上下文。
预训练任务：bert通过masked language model（mlm）和next sentence prediction（nsp）任务进行预训练。

1.2 bert模型的输出

pooler_output：这是通过将最后一层的隐藏状态的第一个token（通常是[cls] token）通过一个线性层和激活函数得到的输出，常用于分类任务。
last_hidden_state：这是模型所有层的最后一个隐藏状态的输出，包含了整个序列的上下文信息，适用于序列级别的任务。

💡 2. bert向量化使用方法

2.1 bert模型输出介绍

加载bert模型输出解释如下所示，相关的代码实践如下所示：

	import tensorflow as tf
	from transformers import berttokenizer, tfbertmodel, bertmodel
	# 加载berttokenizer和bertmodel
	tokenizer = berttokenizer.from_pretrained('bert-base-chinese')
	bert_model = tfbertmodel.from_pretrained('bert-base-chinese')
	# 定义输入文本
	text = '这是一个测试句子'
	# 对输入文本进行分词和填充
	encoded_input = tokenizer(text, padding=true, uncation=true, return_tensors='tf')
	# 获取bert模型的embedding结果
	output = bert_model(encoded_input, output_hidden_states=true, output_attentions=true)
	# 输出结果
	print(output)
	# print(output.get_shape())

其中每个输出部分的解释如下所示：

2.2 输出的具体用法

last_hidden_state的输出如下所示，其中第一个红色圈就是cls的embedding，最后一个就是seq的embedding，
在这里插入图片描述

取用cls的embedding可以用：output[0][:,0,:]
用来做分类的向量具体操作方法如下所示， output[1]，取到的东西是pooler_output
通常取到的bert的embdedding向量的方法如下所示， output[0]，其中一般在后面接一个池化层将其转为[batch_size, 768]的数据shape:

🔍 3. 注意事项

根据任务的需求选择适合的bert模型版本，例如bert-base-uncased或bert-large-cased。
在使用bert时，注意[cls]和[sep]等特殊标记的使用，它们在模型的输入和输出中扮演重要角色。
bert模型计算量大，对于大规模数据集或实时应用，可能需要使用gpu加速。

【STM32-DSP库的使用】基于Keil5 + STM32CubeMX + CMSIS-DSP 手动添加、库添加方式

CMSIS-DSP库在工程中应用遇到的所有问题进行归纳终结…

2024年08月06日 • 硬件开发

视觉巡线小车——STM32+OpenMV（三）

通过本文，使用OpenMV得到中心线偏离黑线的像素点偏差和角度偏差，再将数据打包通过串口发送给STM32，最后在STM32上将数据解析出来，以便后续控制运用。 [阅读全文]


验证码：

验证码：

【NLP基础知识-bert向量化】BERT模型输出pooler_output和last_hidden_state详解和用法

2024年08月05日 • stm32 •我要评论

🌵文章目录🌵

🎯 1. 基本介绍

1.1 bert的关键特点

1.2 bert模型的输出

💡 2. bert向量化使用方法

2.1 bert模型输出介绍

2.2 输出的具体用法

🔍 3. 注意事项

相关文章:

【STM32-DSP库的使用】基于Keil5 + STM32CubeMX + CMSIS-DSP 手动添加、库添加方式

STM32 proteus + STM32Cubemx仿真教程（第五课ADC光敏电阻采样教程）

STM32 CUBEMX主从定时器配置PWM任意相位可调，占空比以及频率可调（学习记录）

第一二章小车硬件介绍-(全网最详细)基于STM32智能小车-蓝牙遥控、避障、循迹、跟随、PID速度控制、视觉循迹、openmv与STM32通信、openmv图像处理、smt32f103c8t6

探索STM32与OLED显示屏：SSD1306库使用指南与实战

发表评论

【NLP基础知识-bert向量化】BERT模型输出pooler_output和last_hidden_state详解和用法

2024年08月05日 • stm32 •我要评论

🌵文章目录🌵

🎯 1. 基本介绍

1.1 bert的关键特点

1.2 bert模型的输出

💡 2. bert向量化使用方法

2.1 bert模型输出介绍

2.2 输出的具体用法

🔍 3. 注意事项

相关文章:

【STM32-DSP库的使用】基于Keil5 + STM32CubeMX + CMSIS-DSP 手动添加、库添加方式

STM32 proteus + STM32Cubemx仿真教程（第五课ADC光敏电阻采样教程）

STM32 CUBEMX主从定时器配置PWM任意相位可调，占空比以及频率可调（学习记录）

第一 二章 小车硬件介绍-(全网最详细)基于STM32智能小车-蓝牙遥控、避障、循迹、跟随、PID速度控制、视觉循迹、openmv与STM32通信、openmv图像处理、smt32f103c8t6

探索STM32与OLED显示屏：SSD1306库使用指南与实战

发表评论

第一二章小车硬件介绍-(全网最详细)基于STM32智能小车-蓝牙遥控、避障、循迹、跟随、PID速度控制、视觉循迹、openmv与STM32通信、openmv图像处理、smt32f103c8t6