内容提要:到了腊月二十九、三十 , 家家户户都要开始贴春联了 。 今年 , 各种 AI 写春联应用都纷纷上线 , 帮大家写春联 , 要试试吗?
关键词:AI;写春联;NLP
春节接近尾声 , 你是否还沉浸在年味里?
到腊月二十九、三十 , 家家户户贴上了 红红的春联 , 春节就正式拉开了序幕 。
春联也称为「对联」、「门对」、「楹联」 , 是汉语所独有的一种艺术形式 , 有着悠久的历史 。 2005 年 , 中国国务院把楹联习俗 , 列为第一批国家非物质文化遗产名录 。
对联对联 , 讲究的就是「成对」 , 要对仗工整 , 平仄协调 。 不过现代人的对对联技能 , 已经远不如古代的文人墨客 , 甚至有时候可能连上下联都傻傻分不清楚 。 而聪明的 AI 已经学会自己写对联了 。
70 万条对联数据
教会 AI 对对子
在现有公开的对联数据集中 , 以冯重朴_梨味斋散叶_的博客所发布的 couplet-dataset 数据最为庞大、使用也最为广泛 。
文章插图
文章插图
文章插图
文章插图
左右滑动查看数据集节选内容
前两张分别为训练集的上联和下联
后两张分别为测试集的上联和下联
这份数据集共包含 70 余万条对联数据 , 按字切分 。
数据集分为训练集、测试集以及词汇表 。
其中 , 如上图节选内容所示 , 训练集分输入、输出两部分 , 分别为对联的上联与下联 , 按次序一一对应 , 测试集同理 。
数据集详细信息如下:
couplet-dataset
对联数据集
数据来源:冯重朴_梨味斋散叶
包含数量:70 万条对联
数据格式:.txt
数据大小:59.7 MB(压缩文件 27.4 MB)
地址:https://hyper.ai/datasets/14547
这个数据集已经成为对联数据中的「团宠」 , 被众多 AI 工程师、团队用来作为写对联模型的训练数据集 , 华为的乐府春联亦是用该数据集训练而来 , 可通过以上地址下载该数据集 。 不过有一个小小的遗憾是 , 这一数据集中没有横批 , 还需要各位自己发挥 。
AI:没有我对不出来的对联
一位名叫王斌的程序员 , 爬取和使用该对联数据集 , 用 GTX 1080 Ti 训练了 4 天 , 得到了一个自动对对联模型 。 效果如何?我们来测试一下 。
文章插图
文章插图
文章插图
文章插图
【ai|明年,我要用 AI 给全村写对联】
文章插图
推荐阅读
- 春天湿气重,多喝这碗糖水,祛湿清热又甘甜,我隔两天喝一次
- 这早餐我从3岁开始吃,三十多年了,从没吃腻过,晶莹剔透很好吃
- 这几道菜在我家太受欢迎, 做法还很简单!
- 我家一周的晚餐,7天不重样,荤素搭配,营养又美味
- 晒晒我家一周的晚餐,每天3个菜,每天都不重样,老公直夸真贤惠
- 虾别再煮着吃了,我换种做法外酥里嫩,老公一口气干掉一盘,佩服
- 宇宙|我们的宇宙是真实的吗?全息宇宙
- 猪血和此菜才是绝配,5块钱炒一盘,补铁助消化,我家一周吃2次
- 丸子这样做最好吃,不放面粉不加水,鲜嫩又营养,我家2天做一回
- 天暖了,趁着这个功夫我们做一个芝麻馅,不煎不炸,蒸熟后包上芝麻糖馅,糯糯甜甜,真好吃