AI人声模拟

相遇皆是缘分

可以模拟真人声音，不过需要大量训练模型（请勿乱用）

1	python demo_toolbox.py

videosrt（音频识别文字）

将多个音频识别成文字，并输出到txt文本

2.存放音频和文本

2.1音频

2.2文本

3.生成音频文字

1	python long_file_cut_by_srt.py

4.听音频校对文本

文本与相应的音频不对就更改，音频不清楚导致文本差错大，可以把该行文本删除，保证几百行没大问题

5.校对完毕，移植

6.生成模型命令

1
2
3

python pre.py <datasets_root> -d {dataset} -n {number}

python pre.py E:\制作数据集 -d aidatatang_200zh -n 6

1
2
3

python synthesizer_train.py mandarin <datasets_root>/SV2TTS/synthesizer

python synthesizer_train.py meng E:\制作数据集\SV2TTS\synthesizer

数据小，执行命令几分钟后，ctrl+c 终止

用原作者公开的已有模型，改成自己模型的名称，代替，并再次执行命令，执行几个小时后，查看plots文件是否有音频图，有，证明有效果，运行完数据量太大，几个小时后，终止即可

6.将自己的模型放入模型库

7.运用自己的模型（详细查看基本用法）