【填词】以中国梦为中心主题写宋词填词软件,要求符合韵律

窥探中国梦文化延续和发展的历史文化内涵――以宋词多“梦”为例_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
2页免费1页免费9页免费5页¥3.006页免费3页免费24页5下载券1页免费1页免费2页免费
喜欢此文档的还喜欢2页免费6页免费16页免费12页2下载券6页2下载券
窥探中国梦文化延续和发展的历史文化内涵――以宋词多“梦”为例|每​个​人​都​有​一​个​梦​,​每​天​晚​上​都​会​有​梦​境​。​梦​的​话​题​无​止​境​,​梦​文​化​也​是​非​常​有​内​涵​的​。
把文档贴到Blog、BBS或个人站等:
普通尺寸(450*500pix)
较大尺寸(630*500pix)
你可能喜欢|||||||||||
最新播报:
“诗词中国梦”之“诗词就在我们身边”主题宣讲会在首都经济贸易大学举行
习近平同志说:“学诗可以情飞扬,志高昂、人灵秀。”
5月6日下午,我国著名剧作家、词作家阎肃先生莅临首都经济贸易大学,在博学楼学术报告厅作了一场题为“诗词就在我们身边”的主题宣讲。据悉,此次宣讲为“诗词中国梦”主题宣讲活动组委会在全国开展的系列活动之一。
经典诗词是中国传统文化的精髓,能助力中华民族的伟大复兴,推动中国梦的实现,是社会主义核心价值观的重要体现,是中国梦最好的文化诠释。 “诗词中国梦”主题宣讲活动,就是让诗走进机关、部队,走进企业、校园。近百位《诗词中国》专题片的文化名家现场讲述诗词带给人们的恬静和淡然,深入群众,了解问题。“问渠那得清如许,为有源头活水来”,与大众面对面探讨解决疑惑,与大师共同领略诗意生活,营造更加健康的精神家园。 “诗词中国梦”宣讲主题: 1、 个人修养与诗词 2、 诗话人生追求 3、 爱国情怀诗中来 4、 读诗品词正能量 5、 诗心共筑中国梦 6、 用诗意探寻人生价值
阎肃先生谈到“诗歌现在看上去被束之高阁,不是主流的文学形式,但事实上它是我们生活中都需要的。可能我们自己都没有意识到,但我们走到哪儿都会想起一句唐诗,也可能是一句流行歌词,这其实都是诗歌的一部分,不管是古老的,还是很通俗化的。
宣讲互动环节,阎肃先生耐心地回答了同学们提出的问题,现场师生纷纷表示受益匪浅,享受了一场经典文化的视听盛宴,整场活动在热烈地掌声中顺利结束。
[责任编辑:请问:按宋词的词牌子填词时,除了要对应字数多少、平仄韵律外,是否还要词性的相对?_百度知道
请问:按宋词的词牌子填词时,除了要对应字数多少、平仄韵律外,是否还要词性的相对?
提问者采纳
有要求的才要没有要求的就不用
其他类似问题
按默认排序
其他3条回答
必须相邻两句的字数相同才有对仗的可能,一枝春雪冻梅花”。因此词的对仗视词调的具体情况而定,浣溪沙下片的开头两句就多用对仗。词谱中一般都会加以说明。但也有不用的。比如,晏殊的“无可奈何花落去,似曾相识燕归来”便是传颂不衰的例子,如韦庄“暗想玉容何所似。踏莎行上下片,开头的两个四字句也多用对仗词是长短句,多数句式不适宜对仗
宋词一般不要求对仗。
正如上几位所说,词的对仗并没有硬性要求,且必须相邻两句的字数相同才有对仗的可能。某处内容是否要对仗,一般而言可以参照前世名家所作作品,依照惯例而行。
下载知道APP
随时随地咨询
出门在外也不愁计算机也能写宋词! | 科学人 | 果壳网 科技有意思
计算机也能写宋词!
计算机电脑机器人作诗写宋词 计算机怎么写诗?计算机真的会写诗吗?
点绛唇:人静风清,兰心蕙性盼如许。夜寒疏雨,临水闻娇语。佳人多情,千里独回首。别离后,泪痕衣袖,惜梦回依旧。
——一台计算机
计算机也能写宋词?这是怎么做到的?其实如果仔细观察,你会发现这篇大作中每个意象也经常出现在“正品宋词”中。没错,实际上它正是通过分析《全宋词》,把句子打碎成词语,并归纳出宋词中的高频词汇,再按宋词格式“创作”而成。
显然,其中极为重要的是第一步,这种逆向操作叫做分词,分词的方法有很多,并且被广泛研究,然而它却不仅仅限于用在自动作词上。分词有哪些方法,又有什么用呢?
分词:究竟有多简单?或者多难?
在英语中,分词是一项相对比较简单的工作,因为词与词之间有天然的分隔符,只需要照顾到单复数(比如 apple / apples, bus / buses, woman / women )、时态(比如 write / wrote / writing )等词类变形,就能将有相同指代的词语汇总成同一个单元。此外要注意同形异义词,如 lay (躺下/位于/下蛋),但总的来说词与词之间还是有很明显的界限的。
而中文则有显著不同,由于汉语比较奇妙,同一个句子有可能会有不同的词语划分方式,比如 “乒乓球/拍卖/完/了” 和 “乒乓/球拍/卖/完/了”,所以中文的分词是一项艰巨而复杂的工程。
虽然如此,也存在一种简单暴力的划分办法,那就是穷举句子的所有连续二字组合,然后整体统计频率。这种办法对于宋词来说比较取巧,这是因为宋词本身句子较短,而且词语的长度有限;对于更一般化的文本,这种暴力拆解就并不适用了,一方面是计算量太大,另一方面是精度太低。
那么,对于一般的情况而言,词语的切分都有哪些办法?在此向大家简单介绍两种较容易理解和常用的方法。
最大匹配法
在诸多复杂的分词方法中,最大匹配法(Maximum Matching,简称MM)是最简单直接的一种。它需要事先给定一个词库作为词典,然后从左到右匹配尽可能长的词语。举个例子,假设我们的词典里只有“计算机、超越、人脑”这三个词,对于“计算机会超越人脑吗”这句话,最大匹配法的计算过程是这样的:
1、 创建指针 A 并将它置于句子的最开始位置:A计算机会超越人脑吗;
2、 由于词典中最长的词语长度为3,所以创建新指针 B,置于 A 后的三个单位:A计算机B会超越人脑吗;
3、 检验 A 和 B 之间的字符串是否在词典中,如果在,就将 A 移动到 B 的位置, B 相应地往后移(直至移到句子末尾):计算机/A会超越B人脑吗;
4、 而如果A 和 B 之间的字符串不在词典中,就将 B 不断左移,直到能够有词语匹配或与 A的距离为 1 (也就是 A、B 之间没有匹配的词语,用单字切分),我们的例子在第一次切分后就属于这种情况,所以再次操作的结果就是:计算机/A会B超越人脑吗;
5、 重复步骤 3 或 4,直到 A 移动到句子末尾:计算机/会/超越/人脑/吗。
这种算法非常高效和简便,同时可以避免“计算/机会/超越/人脑/吗”这种切分方式(即便计算机和机会两个词同时在词典中)。但它的缺点也是很明显的,比如之前的“乒乓球拍卖完了”,就很可能被切分成“乒乓球/拍卖/完了”。为了消除这种歧义,人们也不断提出了一些改进算法,比如逆向匹配法,双向匹配法等等。
最大概率法
但是我们可以换一个角度来看待这种歧义问题。对于两种切分方式,“乒乓/球拍/卖/完/了”和“乒乓球/拍卖/完/了”,我们会认为前者更合理,因为通常乒乓球和拍卖不太可能联系在一起。也就是说,后者在语料库中出现的概率会比较小。所以,如果同一个句子出现若干种不同的划分,我们就希望找到可能出现概率最大的那个。
为了表述简便,这里用 {A1, A2, A3, A4, A5} 和 {B1, B2, B3, B4} 来分别表示 {乒乓,球拍,卖,完,了} 和 {乒乓球,拍卖,完,了} ,我们的任务是比较 P(A1, A2, A3, A4, A5) 和 P(B1, B2, B3, B4) 的大小。
根据条件概率公式,有
P(A1, A2, A3, A4, A5) = P(A1) P(A2|A1) P(A3|A1, A2) P(A4|A1, A2, A3) P(A5 | A1, A2, A3, A4)
其中 P(A1) 表示 A1 在语料库中出现的概率,P(A2|A1) 表示当上一个词语是A1时,在它后面 A2 出现的概率,类似的, P(A3|A1, A2) 表示当前面两个词语是 A1 和 A2 时下一个词语是 A3 的概率,等等……
但是我们发现,当句子很长时,这个概率表达式的尾巴会越来越长,给计算带来很大的麻烦,所以一般采用
(Markov Chain)的假设。
在马尔可夫链假定下,我们认为下一个词出现的概率只与前一个词有关,也就是说,在给定前文时,“卖”出现的概率只与紧接着的“球拍”有关,而与“乒乓”无关。有了这个假定,之前的概率就简化为
P(A1, A2, A3, A4, A5) = P(A1) P(A2|A1) P(A3|A2) P(A4|A3) P(A5|A4)
这就大大减小了计算量。在利用这个模型时,需要先对一个很大的语料库进行分析,这被称为“训练”的过程,其意义就在于把任意两个词语之间关联的概率都计算出来。当然在实际操作中,还牵涉到很多其他非常复杂细节,在此就不一一细说了。
自动作词:离我们有多遥远?
分词完成后,词频的统计就是小事一桩了。之前有人把宋词的高频词语统计表
,一时间几乎每个理科生都能写宋词了。就技术层面而言,大部分自动作诗词的尝试都是在“高频——关联”这样的框架下完成的。即给定一个词语,搜索与之关联度较大的另外一批词作为候选集合,再通过预先设定好的准则进行筛选。
但这样的方法显然比较简陋。相比之下,有人研究了更高级的方法,例如有一篇名为
的论文就采用填词的思想:给定一个词牌,就相应地给出了格律、押韵和平仄等硬性要求,将满足要求的词语填入相应的句法中,再通过一系列评价指标计算每个填词组合的“得分”,最后利用
计算出“得分”最高的填词方案。
以“清平乐”这个词牌为例,其填词约束为
*0 / *1, *1 / 0 / 01.
*1 / *0 / 0 / 11, *1 / *0 / *1.
*0 / *1 / 00, *0 / *1 / 00.
*1 / *0 / *1, *0 / *1 / 00.
其中 0 表示平声, 1 表示仄声, * 表示两者皆可, / 是词语的分割。可以看到,对于“清平乐”这个词牌,实际上就是要将 24 个词填入相应的空档中,其中第一个词以平声结尾,第二个词以仄声结尾,第四个词是一个平声单字……此外如果再考虑押韵,那么搜索的词语空间又会进一步减小。
在给定了一种填词方案后,就可以构造这种方案的评分体系。上述的论文从四个方面(句法合法性、主题相关性、词句搭配的适当性、风格和情感统一性)考虑,最后得到一个综合加权的指标。因此,自动作词的过程就抽象为了一个高维的最优化问题,即试图找到一种填词的组合,使得最终这个加权指标达到最大。
这篇论文的一个亮点在于使用了遗传算法作为主要的优化方法。遗传算法的细节比较复杂,在自动作词这一特定问题中,其主要思想是:
1、 随机生成若干个满足约束条件(格律、押韵等)的填词方案;
2、 选取其中较优的一些结果作为父代,然后利用遗传算法中的交叉和变异操作,从父代来生成子代。换言之,就是在已有的填词方案基础上生成新的填词方案;
3、 不断进行评判和迭代,直到跳出循环。
遗传算法的好处在于其算法的不确定性和可变异性,这是受生物的进化得到启发而发展起来的。虽然遗传算法作出的算词像模像样(例如本文开头的例子),但需要说明的是,遗传算法本质上是一个最优化算法,因此填词的好坏仍然与词库和评价指标直接相关。从某种意义上说,计算机作词实际上是利用已有的词库进行组合,而不是创造。
无论如何,一个丰富而优秀的词库仍然是有意义的——对于电脑来说,这是它进行“创作”的基石;对于人来说,它至少能告诉读者以往词人常用的意象是什么,从而提供一些创作上的灵感(当然不应该是词作本身)。
词频统计:另有他用
分词和词频统计的作用当然不只“自动作词”这么局限。举个简单的例子,大家几乎每天都要用到的搜索引擎就是分词的直接应用者。当你输入一串连续的词语时,搜索引擎就是先将它打碎然后再进行匹配的。
事实上,分词只是万里长征的第一步。在
领域,我们经常用“文本挖掘”这个术语来指代文本数据提取、分析以及得出有用结论的过程,其操作的基本单元往往是一篇完整的文档,比如一个页面、一份报告等。在取得了文本的分词之后,我们就可以构造“文档——词频”矩阵,找出每篇文档对应的各个词语的词频,然后利用这个矩阵进行文档的分类、聚类等操作。例如,虽然Google本身不提供新闻,但是它可以从网络上自动抓取,然后根据文档的特征划分到适当的类别中。
文档分类的另外一个应用是文本作者的鉴定。例如日本同志社大学的金明哲教授曾利用文档分类方法来辨别若干有争论的小说的作者,甚至还在日本一起刑事案件中对“匿名信是否是犯罪嫌疑人所写”为警方提供了参考证明。
本文作者半年前在
中就统计了宋词中常用的意象。类似有趣的统计学研究,作者和他的朋友们一直在
这个网站上不断进行着,有兴趣尤其是相关专业的朋友,快来
参考资料:
[2] lewutian:
[4] 李舰,第三届R语言会议:
[5] 《文本数据统计科学的现状与展望》,金明哲,学术讲座
你可能感兴趣
是不是音乐也可以这么干?!
看到题目我就想起了诗云
这个跟前几天的人人的可以消灭文科生了什么的很相近嘛
我去,真给力才9分钟就到地幔了么?
更新了文章计算机也能写宋词?但是标题是:计算机也能写宋词!感觉可能是标点弄错了,但是错得更有意思了OvO
尼玛,又来晚了。。。以后文科生岂不要灭绝了?
也就是用公式计算出来怎么断句么?
壮大我理科
我想知道如果一直这样怎么创新
理论物理博士,科学松鼠会成员
有机化学博士,法学学士
好强大的算法。归根结底,真.量子计算姬到底有多强大,取决于硬件,还取决于程序猿。
录音爱好者,万有青年养成计划入围选手
嗯,这个是基于现有元素(高频词)以一定规则组成集合的算法,并未涉及到真正的原创,文科生们大可不必惊炸,只要搞出更多以前木有的、歧义众多的、不合逻辑的组合便能生成足够的意象,理科生们就暂时木有办法继续实施规律挖掘狂的工作了
物理学博士生
的回应:这个跟前几天的人人的可以消灭文科生了什么的很相近嘛那个就是从果壳来的。
音乐也可以,记得看过
啊哈,最近就在做这些东西呢..
看见标题就想起大刘的《诗云》有木有!!
早前看过这个报道,想着果壳肯定会出来说说话。真出来了。顶!!
的回应:那个就是从果壳来的。抄果壳的还不注明,鄙视一下
理科生推导文妹纸...
的回应:好强大的算法。归根结底,真.量子计算姬到底有多强大,取决于硬件,还取决于程序猿。
有个建议:把这些意象用DNA片段表达,并且把平仄关系韵脚什么的也编码进去,使得违背宋词规则的拼接方式成为小概率事件。放在一起让其自由拼接,然后选一段二级结构最漂亮的DNA链,读读看是什么……估计这个DNA计算比量子计算的结果要靠谱一些吧!
统计与精算学硕士生,useR
的回应:有个建议:把这些意象用DNA片段表达,并且把平仄关系韵脚什么的也编码进去,使得违背宋词规则的拼接方式成为小概率事件。放在一起让其自由拼接,然后选一段二级结构最漂亮的DNA链,读读看是什么……估计这个DNA计算比量子计算的结果要靠谱一些吧!这就是遗传算法啊!
果壳网主编,科学松鼠会成员
的回应:这就是遗传算法啊!遗传算法神马的,就是可爱啊。。小方以前还写过一篇用随机三角形演化出ff的logo的文章。。
世界果然是属于理科生的!这让文艺青年们情何以堪?
理科拯救世界~~
唔 隐马尔可夫
有一种哭泣滴冲动…………终于正式提到语料库三个字了…………还有分词…………下一步聊词性标注嘛亲~~~
显示所有评论
(C)2013果壳网&京ICP备号-2&京公网安备主题“新区梦 中国梦”可以写什么软笔?就是那种向往新生活,美好的古诗词。_百度知道
主题“新区梦 中国梦”可以写什么软笔?就是那种向往新生活,美好的古诗词。
希望能快一点?因为很紧急,有没有什么符合主题的,要是古诗要求不能是对联
提问者采纳
怒发冲冠;臣子恨,白了少年头,八千里路云和月。莫等闲。待从头?驾长车。抬望眼,笑谈渴饮匈奴血,何时灭,收拾旧山河,仰天长啸,潇潇雨歇,踏破贺兰山缺,犹未雪。三十功名尘与土,壮怀激烈! 靖康耻,空悲切,朝天阙表达收复失地不如岳飞《满江红》符合主题。壮志饥餐胡虏肉,凭阑处
提问者评价
低调,发呆ING,晒不黑,幸福008,囧,幸福,喜欢画花,外貌协会,美食
其他类似问题
按默认排序
其他2条回答
庄严和激昂写改革开放春风“喜” 卷神州大地十八大春潮涌动正能量全面释放十三亿人民意志坚定一个伟大民族大步走进小康以英文拉丁文阿拉伯文写你大步走向世界坚韧、踏实的脚步写你在人类文明智慧起源地上举起璀璨的火种高高举起在世界东方 写伟大的复兴之路今日谱写快速发展的篇章写中国梦筑起时代的辉煌日出东方,美丽中国美丽中国,日出东方
忽如一夜春风来,千树万树梨花开
古诗词的相关知识
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁}

我要回帖

更多关于 中国梦想秀第八季 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信