Skip to main content

黑洞资源笔记

  1. AtomoVideo:阿里巴巴开发的高保真图像到视频生成开源模型 可以生成符合真实世界运动状态的视频

    主要功能:

    1、高保真视频生成:AtomoVideo可以从单一静态图像生成高保真的视频序列,视频中的内容不仅与原始图片保持高度一致,而且动作自然流畅。

    2、动作强度和连贯性:AtomoVideo生成的视频具有自然流畅的动作和良好的时间连贯性。视频中的运动看起来既自然又符合逻辑,没有突兀或不自然的过渡。

    为了让视频里的动作看起来自然,AtomoVideo引入了时间卷积和时间注意力模块,这些模块专门处理视频帧之间的时间关系,帮助模型预测下一帧画面的变化,从而实现连贯的视频动作。AtomoVideo会特别处理视频的时间信息,让图片中的物体像在真实世界那样随时间移动和变化。

    3、个性化适配:AtomoVideo能够与不同的个性化文本到图像(T2I)模型兼容,无需进行特定调整,这让它能够广泛适用于各种场景。AtomoVideo还能结合文字描述来生成视频。比如,你给它一张静态的海边图片,并告诉它“海浪轻轻拍打沙滩”,它就能根据这个描述生成一段海浪真的拍打沙滩的视频。
  2. MovieLLM: 用AI合成电影数据 用来训练AI对长视频理解

    MovieLLM 是由复旦大学和腾讯PCG的研究人员共同开发的一个新颖框架,能够从简单的文本提示中生成高质量、电影级别的视频数据。MovieLLM 能仅仅通过一个词或一个句子就能创作出一部完整的电影。

    MovieLLM 旨在为长视频创建合成的高质量数据。这个框架结合了GPT-4和文本到图像的模型,以生成详细的剧本和相应的视觉内容。

    通俗来讲就是:MovieLLM 通过合成电影数据为人工智能模型提供训练材料,使它们能够更好地理解和生成长视频内容。

    GitHub | MovieLLM | paper | #框架
    Media is too big
    VIEW IN TELEGRAM
  3. dockerc:将Docker镜像编译成独立的可执行文件,可以将Docker镜像转换为用户可以直接运行的可执行文件,无需进行Docker运行时的安装和配置
  4. 数据清洗指南,旨在为机器学习和人工智能项目提供基础清理步骤,包括标准化空值、移除重复记录、删除大部分缺失数据的列、缺失值填充以及使用机器学习算法进行数据插补
  5. oterm:Ollama的文本终端客户端

    -直观简单的终端用户界面,无需运行服务器、前端,只需oterm在终端中输入即可。
    -多个持久聊天会话,与 sqlite 中的上下文嵌入和模板/系统提示自定义一起存储。
    -可以使用你在 Ollama 中拉取的任何模型,或者自己的自定义模型。
    -允许轻松定制模型的模板、系统提示和参数。