诗歌|AI也能写高考作文?我们用清华刚刚开源的「九歌」试了试( 三 )


CCPC是 中国古典诗歌语料库 , 收纳了从隋朝到明朝的所有古诗 , 每首诗都附带作者姓名、朝代、标题以及自动提取的关键词 。
比如:

{“dynasty”: “Tang”, “author”: “杜牧”, “content”: “李白题诗水西寺|古木回岩楼阁风|半醒半醉游三日|红白花开山雨中”, “title”: “念昔游三首 其三”, “keywords”: “题诗 花开 楼阁 山雨”} 其次是学习诗歌的声律 。
CRRD是 古诗音律数据集 , 将汉字按照古代的 平仄声进行分类 。 古诗不仅要押韵 , 也要符合平仄规律 。 例如诗的第一句是「仄仄平平仄」 , 那么第二句就应该是「平平仄仄平」 。
诗歌|AI也能写高考作文?我们用清华刚刚开源的「九歌」试了试
本文插图

然后是学习诗歌中表达的情感 , 给AI加上一点人文气息 。
FSPC是 细腻情感诗歌语料库 , 将每首诗、每行注释都分为5类情感 , 即否定、隐含否定、中性、隐含肯定和肯定 。
诗歌写得好不好 , 最终还需要人类判定 。
PQED是 手动注释的诗歌质量数据集 , 按照以下四个标准对诗歌评分 , 每项得分为1到5分:
诗歌|AI也能写高考作文?我们用清华刚刚开源的「九歌」试了试
本文插图

给文科生一个报考清华的理由
你觉得 , 如果李白杜甫白居易们的作诗水平是满分10分 , 九歌的作诗水平能打几分?
「九歌」虽然只是一个实验研究性项目 , 但其实 , 背后的自然语言处理(NLP)技术 , 才是大有用途的AI领域 。
你可以「调戏」的小爱同学、Siri、天猫精灵们 , 需要NLP技术支撑 , 才能听懂人类的语言;
无论是在百度还是在淘宝 , 要靠NLP技术拆解你输入的文字 , 才能搜索出你需要的资料或商品;
还有谷歌翻译、翻译笔、微信聊天中的自动翻译 , 背后都要依靠NLP技术;
……
人类和语言相关的工作 , 都可以自动完成 。
而这些技术的开拓 , 并非只靠程序员写代码、跑数据、调参数就可以完成 , 同样需要语言文学方面的专家支持 。
(准备)学中文的朋友们 , 你们以后可能不只能够当人类学生们的语文老师了 , 说不定毕业后就可以进入NLP方面的实验室 , 当AI的语文老师 。
虽说「文科选北大 , 理科选清华」 , 九歌也是给文科生报考清华找到了一个理由吧 。
最后祝愿所有考生高考顺利!
诗歌|AI也能写高考作文?我们用清华刚刚开源的「九歌」试了试
本文插图

传送门
论文链接:
https://arxiv.org/pdf/2003.06094.pdf
代码链接:
https://github.com/THUNLP-AIPoet/MixPoet
参考链接:
https://mp.weixin.qq.com/s/uw7uDV94z3iQsn1v_NKiYw
http://nlp.csai.tsinghua.edu.cn/news/九歌多样化古典诗歌机器写作模型mixpoet开源/
本文系****?网易号特色内容激励计划签约账号【量子位】原创内容 , 未经账号授权 , 禁止随意转载 。
— 完—
报名 | 四场直播详解AI芯片所有知识点
7月8日—7月11日期间 , 燧原科技资深产品专家和软件架构师将为大家分别详细讲解:
  • 高端人工智能训练芯片的发展趋势
  • 剖析软件全栈的技术难点
  • 人工智能训练芯片在云计算中所面临的挑战和机遇
四场直播将讲透所有的芯片知识点 , 欢迎扫码报名~~
【诗歌|AI也能写高考作文?我们用清华刚刚开源的「九歌」试了试】量子位 QbitAI · ***签约作者
?'?' ? 追踪AI技术和产品新动态
喜欢就点「在看」吧 !


推荐阅读