07:25 · Mar 30, 2023 · Thu × × × × × 这是一个允许你从多个来源收集电影剧本的工具,并以.txt文件的形式创建一个包含2.5千多部电影剧本的数据库,同时还有电影的元数据。整个过程有四个步骤:从各种来源收集剧本 - 在网站上搜刮HTML、txt、doc或pdf格式的剧本收集元数据 - 从TMDb和IMDb获取关于剧本的元数据,以便进行额外处理查找不同来源的重复内容 - 自动分组并删除不同来源的重复内容。解析脚本 - 将脚本转换为只含人物和对话的行文The Movie Script Database | #工具 #剧本