机器之心|使用AmazonSageMaker运行中文命名实体识别( 六 )


estimator = TensorFlow(entry_point='albert_ner.py',
source_dir='.',
git_config=git_config,
train_instance_type='ml.p2.xlarge',
train_instance_count=1,
hyperparameters=hyperparameters,
role=role,
framework_version='1.15.2',
py_version='py3',
script_mode=True)
estimator.fit({'training': inputs})
但是 , 由于本文所用代码需要ALBERT预训练数据 , 而该数据不包含在git内 , 所以我们需要对代码进行改造 , 以使得在代码内下载并解压数据 , 才能够正常训练 。 这里我们不再展示如何操作 , 感兴趣的读者可以自行尝试 。
四、结论
本文讲解了如何使用Amazon SageMaker运行基于TensorFlow的中文命名实体识别 , 其中算法部分是使用预训练语言模型ALBERT做中文命名实体识别 。
本文展示了如何把一个已有项目快速运行到Amazon SageMaker上 , 如果您想使用到Amazon SageMaker的更多高级用法 , 需要对已有项目进行改造 , 比如支持实时推理、批量推理、断点重新训练等 , 具体可以查看Amazon SageMaker的文档 。
本文所演示的使用方法是基于单机单卡的 , Amazon SageMaker 提供基于 Docker 的简化分布式 TensorFlow 训练平台 , 如果要将程序扩展到多机多卡进行训练 , 可以参考其他相关博客 。
本篇作者
机器之心|使用AmazonSageMaker运行中文命名实体识别
本文插图
【机器之心|使用AmazonSageMaker运行中文命名实体识别】


推荐阅读