一、keras 与 tensorflow keras 的关系
keras 是一个独立的高级神经网络api,而 tf.keras 是 tensorflow 对 keras api 规范的实现。自 tensorflow 2.0 起,tf.keras 成为 tensorflow 的官方高级api。
二、核心模块和组件
1.模型构建模块
sequential api(顺序模型)
from tensorflow.keras import sequential
from tensorflow.keras.layers import dense, flatten, conv2d
model = sequential([
conv2d(32, 3, activation='relu', input_shape=(28, 28, 1)),
flatten(),
dense(128, activation='relu'),
dense(10, activation='softmax')
])
functional api(函数式api) - 更灵活
from tensorflow.keras import model, input from tensorflow.keras.layers import dense, concatenate inputs = input(shape=(784,)) x = dense(64, activation='relu')(inputs) x = dense(32, activation='relu')(x) outputs = dense(10, activation='softmax')(x) model = model(inputs=inputs, outputs=outputs)
model subclassing(模型子类化) - 最大灵活性
from tensorflow.keras import model
from tensorflow.keras.layers import dense
class mymodel(model):
def __init__(self):
super(mymodel, self).__init__()
self.dense1 = dense(64, activation='relu')
self.dense2 = dense(10, activation='softmax')
def call(self, inputs):
x = self.dense1(inputs)
return self.dense2(x)
2.层(layers)模块
from tensorflow.keras import layers # 常用层类型 # - dense: 全连接层 # - conv2d/conv1d/conv3d: 卷积层 # - lstm/gru/simplernn: 循环层 # - dropout: 丢弃层 # - batchnormalization: 批量归一化 # - embedding: 嵌入层 # - maxpooling2d/averagepooling2d: 池化层 # - layernormalization: 层归一化
3.损失函数(losses)
from tensorflow.keras import losses # 常用损失函数 # - binarycrossentropy: 二分类交叉熵 # - categoricalcrossentropy: 多分类交叉熵 # - meansquarederror: 均方误差 # - meanabsoluteerror: 平均绝对误差 # - huber: huber损失(回归问题) # - sparsecategoricalcrossentropy: 稀疏多分类交叉熵
4.优化器(optimizers)
from tensorflow.keras import optimizers # 常用优化器 # - sgd: 随机梯度下降(可带动量) # - adam: 自适应矩估计 # - rmsprop: 均方根传播 # - adagrad: 自适应梯度 # - nadam: nesterov adam
5.评估指标(metrics)
from tensorflow.keras import metrics # 常用指标 # - accuracy: 准确率 # - precision: 精确率 # - recall: 召回率 # - auc: roc曲线下面积 # - meansquarederror: 均方误差 # - meanabsoluteerror: 平均绝对误差
6.回调函数(callbacks)
from tensorflow.keras import callbacks # 常用回调 # - modelcheckpoint: 模型保存 # - earlystopping: 早停 # - tensorboard: tensorboard可视化 # - reducelronplateau: 动态调整学习率 # - csvlogger: 训练日志记录
7.预处理模块
from tensorflow.keras.preprocessing import image, text, sequence # 图像预处理 # - imagedatagenerator: 图像增强(tf 2.x 风格) # - load_img, img_to_array: 图像加载转换 # 文本预处理 # - tokenizer: 文本分词 # - pad_sequences: 序列填充
8.应用模块(预训练模型)
from tensorflow.keras.applications import (
vgg16, resnet50, mobilenet,
inceptionv3, efficientnetb0
)
# 加载预训练模型
base_model = resnet50(weights='imagenet', include_top=false)
9.工具函数
from tensorflow.keras import utils # 常用工具 # - to_categorical: 类别编码 # - plot_model: 模型结构可视化 # - normalize: 数据标准化
三、完整使用流程示例
示例1:图像分类
import tensorflow as tf
from tensorflow.keras import layers, models
# 1. 数据准备
(x_train, y_train), (x_test, y_test) = tf.keras.datasets.mnist.load_data()
x_train = x_train.reshape(-1, 28, 28, 1).astype('float32') / 255.0
x_test = x_test.reshape(-1, 28, 28, 1).astype('float32') / 255.0
# 2. 构建模型
model = models.sequential([
layers.conv2d(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
layers.maxpooling2d((2, 2)),
layers.conv2d(64, (3, 3), activation='relu'),
layers.maxpooling2d((2, 2)),
layers.flatten(),
layers.dense(128, activation='relu'),
layers.dropout(0.5),
layers.dense(10, activation='softmax')
])
# 3. 编译模型
model.compile(
optimizer='adam',
loss='sparse_categorical_crossentropy',
metrics=['accuracy']
)
# 4. 训练模型
history = model.fit(
x_train, y_train,
epochs=10,
batch_size=32,
validation_split=0.2,
callbacks=[
tf.keras.callbacks.earlystopping(patience=3),
tf.keras.callbacks.modelcheckpoint('best_model.h5')
]
)
# 5. 评估模型
test_loss, test_acc = model.evaluate(x_test, y_test)
# 6. 使用模型预测
predictions = model.predict(x_test[:5])
示例2:文本分类
from tensorflow.keras.preprocessing.text import tokenizer
from tensorflow.keras.preprocessing.sequence import pad_sequences
# 1. 文本预处理
tokenizer = tokenizer(num_words=10000)
tokenizer.fit_on_texts(texts)
sequences = tokenizer.texts_to_sequences(texts)
padded_sequences = pad_sequences(sequences, maxlen=200)
# 2. 构建文本分类模型
model = models.sequential([
layers.embedding(10000, 128, input_length=200),
layers.bidirectional(layers.lstm(64, return_sequences=true)),
layers.globalmaxpooling1d(),
layers.dense(64, activation='relu'),
layers.dense(1, activation='sigmoid') # 二分类
])
四、高级特性
1.自定义层
class customlayer(layers.layer):
def __init__(self, units=32):
super(customlayer, self).__init__()
self.units = units
def build(self, input_shape):
self.w = self.add_weight(
shape=(input_shape[-1], self.units),
initializer='random_normal',
trainable=true
)
self.b = self.add_weight(
shape=(self.units,),
initializer='zeros',
trainable=true
)
def call(self, inputs):
return tf.matmul(inputs, self.w) + self.b
2.自定义损失函数
def custom_loss(y_true, y_pred):
mse = tf.keras.losses.mean_squared_error(y_true, y_pred)
penalty = tf.reduce_mean(tf.square(y_pred))
return mse + 0.01 * penalty
3.多输入多输出模型
# 多输入 input1 = input(shape=(64,)) input2 = input(shape=(128,)) # 多输出 output1 = dense(1, name='regression')(merged) output2 = dense(5, activation='softmax', name='classification')(merged) model = model(inputs=[input1, input2], outputs=[output1, output2])
五、主要应用场景
- 计算机视觉:图像分类、目标检测、图像分割
- 自然语言处理:文本分类、机器翻译、情感分析
- 时间序列:股票预测、天气预报、异常检测
- 推荐系统:协同过滤、深度学习推荐
- 生成模型:gan、vae、风格迁移
- 强化学习:深度q网络、策略梯度
六、最佳实践建议
数据管道优化:使用 tf.data api 提高数据加载效率
混合精度训练:使用 tf.keras.mixed_precision 加速训练
分布式训练:支持多gpu、tpu训练
模型保存与部署:
# 保存整个模型
model.save('my_model.h5')
# 保存为savedmodel格式(用于tf serving)
model.save('my_model', save_format='tf')
# 转换为tensorflow lite(移动端)
converter = tf.lite.tfliteconverter.from_keras_model(model)
tflite_model = converter.convert()
性能优化:
- 使用
model.predict()时设置batch_size - 使用缓存和预取优化数据管道
- 合理使用gpu内存
七、常见问题和解决方案
- 过拟合:添加dropout、正则化、数据增强
- 梯度消失/爆炸:使用batchnorm、梯度裁剪、合适的激活函数
- 训练不稳定:调整学习率、使用学习率调度器
- 内存不足:减小批次大小、使用梯度累积
tf.keras 提供了一个完整、灵活且高效的深度学习框架,适用于从研究原型到生产部署的整个开发流程。其设计哲学强调用户友好性、模块化和可扩展性,是大多数深度学习项目的理想选择。
到此这篇关于tensorflow中tf.keras模块的实现的文章就介绍到这了,更多相关tensorflow tf.keras模块内容请搜索代码网以前的文章或继续浏览下面的相关文章希望大家以后多多支持代码网!
发表评论