打印

[教程]教你如何提取视频中的中文字幕

0

[教程]教你如何提取视频中的中文字幕


你是否正为大量AVI格式的影片没有中文字幕而惋惜呢,那么请看此文,或许将带给你一些启发。

重要前提:必须要有RMVB小格式带有中文字幕的相同影片,而且影片字幕最好是黑体,好识别。

字幕提取所需要用的软件:esrXP,尚书7号,word等。

一、esrXP软件的使用
首先点“Option”下的“Language”打开“Simplified Chinese”改为简体中文版。


    打开影片(工具栏第2个)《以诱惑女教师第一章穗花为例》,点“字幕过滤器”(工具栏第6个)视频在“字幕过滤器”里面显示,拉一下最下面进度栏,找到有字幕的地方进行调整。“完整宽度”请勾选上,“启动过滤器”请勾上,这样我们才能调整一些参数便于识别出完美的字幕。请选择“颜色和边线”。
    “字幕颜色”设置成和片中字幕的主颜色的同色(如何正确知道字幕的颜色:可以把鼠标移动到字体上,在设置的左下角会出现当前鼠标所在处的RGB值)
    “边线颜色”设置成和片中字幕的边线颜色的同色(一般都是白色字体,其他的边线颜色都可以用黑色来代替)


    “进阶设置”(此处很重要,为识别的核心部分,识别出来的字幕完不完美就靠它了)点击如下图所示,大家可参考图中的设置。


说明:没有打勾的不生效,意味着随便什么数值都可以(软件自动默认为最高或者最低)
    需要调整的地方有2个:边线里的最高光度和最后阶段的RGB差距(图中2处的数值无参考意义,需自行根据影片设置)
    最高光度需要根据不同的rmvb设置不同的值,调整到识别出来的字幕不丢字,也无太多的杂点即可。当然最好识别出来和我图中的字幕那样完美..
   RGB差距为字幕的清晰度,越高越清晰,但是也同时会带来非字幕地方出现杂点,影响到后面的OCR识别。所以我们的原则是:只要能看了比较清楚,OCR软件能够顺利识别就可以了。
   此处设置的时候可以拖动进度栏,观察总体字幕识别情况,不要总是盯着一出字幕来设置。那样容易会出现本处字幕识别了完美,其他时间字幕出现丢字或者杂点太多的情况
“后处理设置”如下图。


    设置完毕后我们可以开始识别了,返回到软件的主界面。点左下角的开始,让软件自己开始识别吧。识别时间需要看机器的配制和字幕的多与少。为了节约时间,本文中只识别的影片的前几分钟。


    现在我们会发现识别出来会多很多无用的字幕(到底会多多少,这个要看你设置的情况了一般设置了比较好的话,基本没有太多的无用字幕)我们需要手动删除他们。
    依次点“字幕”“字幕管理”(工具栏第8个)出现如下界面


    无用字幕选择好之后,我们点字幕管理中的删除(红叉)。
    关闭字幕管理,返回软件主界面。现在我们开始输出OCR所需要使用的bmp图片。
    依次打开“文件”“保存OCR影像”(工具栏第5个)
    说明:请按照本图设置,每张图片不宜太大,否则OCR软件无法识别


输出图片结束后,我们需要把刚才提供的esr文件另存为一下。这个习惯要养成。

二、OCR软件:尚书7号的使用
打开软件,打开图片。(注意打开图片的顺序)


图片全部打开之后,我们先点全选图片(工具栏第5个)
然后开始识别(工具栏第6个)识别很快,几秒一个图片。
识别结束后,再按一次全选(工具栏第5个)然后依次点“输出”“输出到指定文件”(把识别出来的文字存为一个txt文件)
三、Word的用处
    到了这里我们会发现,文中提示所需要的word还没派上用场,这个时候我们就需要用上它了。因为识别出来的文字,偶尔有几个会有识别错误,而且是批量的,我们需要用到word的全部替换功能,把一些常用字的识别错误给修正(不要问我有哪些常用字会识别错误,基本很少。做过这么一两个字幕后你就会知道那些字需要全部替换下)然后在word里面全选文字,使用“居中”。
    现在我们所需要做的是把word里调整过文字复制到esrxp软件的左边的文字框里去。
    然后开始我们最为辛苦的校对过程,结束后如下图


注:一行对应一行。

现在我们的工作差不多结束了…可以输出为了srt ssa等格式的字幕了(推荐srt)。
具体方法是另存为的时候选择 srt类型。


(不一定需要)最后还有需要做的是断句了,用记事本打开srt或者ssa文件把一行显示过长的字幕分成2行显示(简单的回车一下)然后保存。

OCR软件:尚书7号请自行搜索。

提供《诱惑女教师第一章穗花》《苍井空淫乱巨乳女教师SOE-224)这两部影片的中文字幕给大家,大家使用暴风影音打开上述影片后,手动载入字幕即可。


[ 本帖最后由 A4Y 于 2009-12-9 17:09 编辑 ]
附件: 您所在的用户组无法下载或查看附件

TOP

0
谢谢拉!感恩感恩!!!希望可以多发一点这种让我门学的给我门看^^

TOP

0
学习一下,我本人是比较喜欢有中文字幕的,谢谢了

TOP

0
技术很好,但有点搞不懂提取字幕来干什么啊,现成的用不就行了?

TOP

0
今天终于知道怎么搞字幕了,多谢多谢,家里好多片子准备配呢

TOP

0
好东西!!!支持!支持!!支持!!!谢谢搂主分享!!!
向楼主致敬!!!!!!!!!!!!!!!!!!

TOP

0
很多片就是没字幕,郁闷啊,听不懂在说什么

TOP

0
真是很好的办法,又学啦一招,以后就能看到中文字幕啦,太好啦

TOP

0
很难得的好教程啊,就是LZ的图片挂掉几张了 如果能补上就更好了

TOP

0
多谢了,长了不少知识,先去试一下,呵呵 以后能看中文字幕了

TOP

当前时区 GMT+8, 现在时间是 2024-5-22 12:45