Skip to main content

这是一个允许你从多个来源收集电影剧本的工具,并以.txt文件的形式创建一个包含2.5千多部电影剧本的数据库,同时还有电影的元数据

  1. 这是一个允许你从多个来源收集电影剧本的工具,并以.txt文件的形式创建一个包含2.5千多部电影剧本的数据库,同时还有电影的元数据。

    整个过程有四个步骤:
    从各种来源收集剧本 - 在网站上搜刮HTML、txt、doc或pdf格式的剧本
    收集元数据 - 从TMDb和IMDb获取关于剧本的元数据,以便进行额外处理
    查找不同来源的重复内容 - 自动分组并删除不同来源的重复内容。
    解析脚本 - 将脚本转换为只含人物和对话的行文

    The Movie Script Database | #工具 #剧本