国语视界

 找回密码
 立即注册
楼主: zsh月夜苍狼

[字幕技术] SUP和SUB字幕OCR教程之百度OCR篇

  [复制链接]

6

主题

169

帖子

185

积分

班长

大洋
68
阅读权限
20
发表于 21-10-23 20:57 | 显示全部楼层
这个软件是需要VideoSubFinder来配合的,最基本的,楼主连提也没提...

点评

你看完了?你进群了?你更新了软件?  发表于 21-10-24 05:47
回复 支持 反对

使用道具 举报

10

主题

763

帖子

105

积分

班长

大洋
950
阅读权限
20
发表于 21-10-25 10:29 | 显示全部楼层

谢谢楼主分享
回复 支持 反对

使用道具 举报

79

主题

5597

帖子

5785

积分

团长

大洋
31190
阅读权限
60
发表于 21-10-25 16:20 | 显示全部楼层
感谢,这个要学习一下
回复 支持 反对

使用道具 举报

3

主题

340

帖子

501

积分

连长

大洋
1366
阅读权限
40
发表于 21-10-27 14:47 | 显示全部楼层
学习学习
回复

使用道具 举报

5

主题

1875

帖子

554

积分

连长

大洋
12140
阅读权限
40
发表于 21-10-28 08:38 | 显示全部楼层
这个很不错的,多谢分享,好好研究学习下~
回复 支持 反对

使用道具 举报

3

主题

340

帖子

501

积分

连长

大洋
1366
阅读权限
40
发表于 21-10-28 16:59 | 显示全部楼层
问题描述:按照教程操作OCR日文sub后无法生成srt文件,同视频的中文sub运行倒是一切正常。exe运行日文OCR后在最后一步生成srt时出现错误直接闪退,截不到错误信息图片。识别结果中完整生成所有txt,参数设置中仅改变ocr_lang = 'JAP'。
测试:将日文OCR图片文件夹删除一部分后剩余600条左右运行exe,能正常生成srt,但完整1718条则出错。原因不明
附上日文OCR图片包及日文sub链接
链接:https://pan.baidu.com/s/1j0M8u7UBJk95gc4KkKPOtg
提取码:0000
回复 支持 反对

使用道具 举报

376

主题

1476

帖子

9070

积分

养老族

大洋
271163
阅读权限
110
 楼主| 发表于 21-10-29 02:05 | 显示全部楼层
本帖最后由 zsh月夜苍狼 于 21-10-29 02:09 编辑
space77or 发表于 21-10-28 16:59
问题描述:按照教程操作OCR日文sub后无法生成srt文件,同视频的中文sub运行倒是一切正常。exe运行日文OCR后 ...




日文SUP有很多竖起来的字幕,影响叠图识别,选择2,软件会单独识别竖起来的字幕
但是这个需要很多额度,像你发的这个需要286次额度



这是软件叠图识别的原理,日文SUP有竖的字幕影响叠图

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复 支持 反对

使用道具 举报

3

主题

340

帖子

501

积分

连长

大洋
1366
阅读权限
40
发表于 21-10-29 10:05 | 显示全部楼层
本帖最后由 space77or 于 21-10-29 10:10 编辑
zsh月夜苍狼 发表于 21-10-29 02:05
日文SUP有很多竖起来的字幕,影响叠图识别,选择2,软件会单独识别竖起来的字幕
但是这个需要很多额度 ...


感谢解答,一直选的2,过高图片后面查看也只有两个竖排字幕,额度倒是足够。后面整合了一下txt,时间轴和中文字幕一样倒也可以编辑了,就是百度OCR日文的错误还是蛮多的,几乎每句都有漏字,可能是叠图默认6张太多了,这几天尝试一下叠图识别1。
回复 支持 反对

使用道具 举报

376

主题

1476

帖子

9070

积分

养老族

大洋
271163
阅读权限
110
 楼主| 发表于 21-10-29 11:43 | 显示全部楼层
space77or 发表于 21-10-29 10:05
感谢解答,一直选的2,过高图片后面查看也只有两个竖排字幕,额度倒是足够。后面整合了一下txt,时间轴和 ...

本人不懂日语,没有办法校正,也不知道正确率如何。识别的接口必须使用高精度接口,如果错误率太高可以降低叠图数量。百度识别有个缺陷,无法识别空格还有【一】字,或者整行字幕只有单独的一个简单的字.
回复 支持 反对

使用道具 举报

67

主题

4277

帖子

3177

积分

团长

大洋
112602
阅读权限
60
发表于 21-10-31 10:29 | 显示全部楼层
不错,不错值得学习!
回复 支持 反对

使用道具 举报

13

主题

1487

帖子

1112

积分

营长

大洋
5703
阅读权限
50
发表于 21-10-31 11:16 | 显示全部楼层
感谢楼主编写教程。
回复 支持 反对

使用道具 举报

0

主题

983

帖子

123

积分

班长

大洋
11266
阅读权限
20
发表于 21-11-6 01:17 | 显示全部楼层
谢谢分享
回复

使用道具 举报

27

主题

3812

帖子

474

积分

排长

大洋
7387
阅读权限
30
发表于 21-11-7 13:53 | 显示全部楼层
感谢楼主帮我解惑,一直卡在ORC上
回复 支持 反对

使用道具 举报

27

主题

3812

帖子

474

积分

排长

大洋
7387
阅读权限
30
发表于 21-11-7 13:55 | 显示全部楼层
感谢楼主帮我解惑,一直卡在ORC上
回复 支持 反对

使用道具 举报

96

主题

3358

帖子

473

积分

排长

大洋
8151
阅读权限
30
发表于 21-11-12 12:58 | 显示全部楼层
感谢分享,有点提取硬字幕的冲动!
回复 支持 反对

使用道具 举报

2

主题

1791

帖子

1506

积分

营长

大洋
2618
阅读权限
50
发表于 21-11-13 15:07 | 显示全部楼层
认真学习一下教程
回复 支持 反对

使用道具 举报

15

主题

864

帖子

1014

积分

营长

大洋
32966
阅读权限
50
发表于 21-11-17 13:55 | 显示全部楼层
看评论说准确率达到99.99%,还是挺厉害的
回复 支持 反对

使用道具 举报

4

主题

1220

帖子

506

积分

连长

大洋
8321
阅读权限
40
发表于 21-11-25 14:07 | 显示全部楼层
谢谢楼主分享字幕教程
回复 支持 反对

使用道具 举报

31

主题

1324

帖子

1813

积分

营长

大洋
107671
阅读权限
50
发表于 21-11-25 22:07 | 显示全部楼层
向大佬学习!
回复 支持 反对

使用道具 举报

4

主题

178

帖子

39

积分

列兵

大洋
179
阅读权限
10
发表于 21-11-29 02:05 | 显示全部楼层
谢谢分享
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表