ai|明年,我要用 AI 给全村写对联

内容提要:到了腊月二十九、三十 , 家家户户都要开始贴春联了 。 今年 , 各种 AI 写春联应用都纷纷上线 , 帮大家写春联 , 要试试吗?
关键词:AI;写春联;NLP
春节接近尾声 , 你是否还沉浸在年味里?
到腊月二十九、三十 , 家家户户贴上了 红红的春联 , 春节就正式拉开了序幕 。
春联也称为「对联」、「门对」、「楹联」 , 是汉语所独有的一种艺术形式 , 有着悠久的历史 。 2005 年 , 中国国务院把楹联习俗 , 列为第一批国家非物质文化遗产名录 。
对联对联 , 讲究的就是「成对」 , 要对仗工整 , 平仄协调 。 不过现代人的对对联技能 , 已经远不如古代的文人墨客 , 甚至有时候可能连上下联都傻傻分不清楚 。 而聪明的 AI 已经学会自己写对联了 。
70 万条对联数据
教会 AI 对对子
在现有公开的对联数据集中 , 以冯重朴_梨味斋散叶_的博客所发布的 couplet-dataset 数据最为庞大、使用也最为广泛 。
ai|明年,我要用 AI 给全村写对联
文章插图

ai|明年,我要用 AI 给全村写对联
文章插图

ai|明年,我要用 AI 给全村写对联
文章插图

ai|明年,我要用 AI 给全村写对联
文章插图

左右滑动查看数据集节选内容
前两张分别为训练集的上联和下联
后两张分别为测试集的上联和下联
这份数据集共包含 70 余万条对联数据 , 按字切分 。
数据集分为训练集、测试集以及词汇表 。
其中 , 如上图节选内容所示 , 训练集分输入、输出两部分 , 分别为对联的上联与下联 , 按次序一一对应 , 测试集同理 。
数据集详细信息如下:
couplet-dataset
对联数据集
数据来源:冯重朴_梨味斋散叶
包含数量:70 万条对联
数据格式:.txt
数据大小:59.7 MB(压缩文件 27.4 MB)
地址:https://hyper.ai/datasets/14547
这个数据集已经成为对联数据中的「团宠」 , 被众多 AI 工程师、团队用来作为写对联模型的训练数据集 , 华为的乐府春联亦是用该数据集训练而来 , 可通过以上地址下载该数据集 。 不过有一个小小的遗憾是 , 这一数据集中没有横批 , 还需要各位自己发挥 。
AI:没有我对不出来的对联
一位名叫王斌的程序员 , 爬取和使用该对联数据集 , 用 GTX 1080 Ti 训练了 4 天 , 得到了一个自动对对联模型 。 效果如何?我们来测试一下 。
ai|明年,我要用 AI 给全村写对联
文章插图

ai|明年,我要用 AI 给全村写对联
文章插图

ai|明年,我要用 AI 给全村写对联
文章插图

ai|明年,我要用 AI 给全村写对联
文章插图

【ai|明年,我要用 AI 给全村写对联】ai|明年,我要用 AI 给全村写对联
文章插图


    推荐阅读