Home

Awesome

Lyricist

基于Tensorflow、Seq2Seq、Bahdanau注意力机制的 中文歌词生成研究

训练数据集来自我收集整理的中文歌词数据库: https://github.com/dengxiuqi/ChineseLyrics
基于Pytorch和Luong注意力的另一个项目: https://github.com/dengxiuqi/Lyricist-torch

方法

工程

Lyricist-tensorflow
│── data 数据集
│  │── songs_cut.json 分词后的歌词数据
│  │── words.json 歌词数据库词典
│  ` ── word2vec.txt word2vec数据, 请从 https://pan.baidu.com/s/1h_7P7Iypv9HAQAJPayCkWw 下载
│── model 存放训练好的模型
│  ` ── ......
│── config.py 数据集合网络结构的一些参数
│── data.py 数据集处理
│── network.py 网络结构
│── train.py 训练
` ── test.py 测试

效果

根据不同上句生成下句单个词语的阶段
1
上句: 迎接早晨灿烂的阳光   
下句: 我的……  
上句迎接早晨灿烂阳光
注意力0.203607620.31916960.140182470.092435810.24460447
生成的候选词: ['祖国', '阳光', '太阳', '新疆', '家庭']    
2
上句: 眼角留着你给的泪水  
下句: 我的……  
上句眼角泪水
注意力0.296178220.04012110.098771140.153658750.070165960.126431870.21467307
生成的候选词: ['眼角', '眼泪', '心里', '心碎', '泪水']    
3
上句: 我在黑夜之中寻找出口  
下句: 我的……  
上句黑夜之中寻找出口
注意力0.1292620.085185990.467157330.099632580.094448490.12431359
生成的候选词: ['迷惘', '孤独', '寂寞', '黑夜', '星光']    
4
上句: 给我甜蜜笑容  
下句: 我的……  
上句甜蜜笑容
注意力0.158716770.165071870.327448130.34876317
生成的候选词: ['爱人', '人生', '快乐', '美梦', '小']