技术,生活,随看 \随转
🏞 Image To Prompt:上传图片,自动生成 Prompt
🔗:Web
频道:@NewlearnerChannel
先把视频放到Google Drive,然后从Google Colab上运行代码,并且在Colab加载整个Whisper模型,这样并不受API请求限制的影响,可以快速完成转录。语音转字幕后,再借助ChatGPT的API对字幕逐行翻译,最后再人工校对就好了。
N46Whisper 是基于 Google Colab 的应用。开发初衷旨在提高乃木坂46(以及坂道系)字幕组的工作效率。但本应用也适于所有日语视频的字幕制作。此应用基于AI语音识别模型 Whisper,应用输出文件为ass或srt格式,内置指定字幕组的字幕格式,可直接导入 Aegisub 进行后续翻译及时间轴校正
使用方法:
点击这里在Google Colab中打开应用.
上传要识别的文件并运行应用
识别完成后ass文件会自动下载到本地.
目前发布的是StableLM-alpha 模型,有30亿参数和70亿参数两款。150亿参数和300亿参数的型号正在开发中。对中文的支持不怎么样。
许可协议是CC BY-SA-4.0(可商用,但衍生品必须同样是使用该协议)。
LLM 大模型的崛起让向量搜索(Vector Search)数据库焕发新的生命力,OpenAI Embedding 模型里面提到的几款向量数据库未来都有很多机会呀。
https://qdrant.tech/articles/seed-round/