Skip to main content

黑洞资源笔记

  1. 一个全面的4D人头数据集,用于推动头部头像研究的进步。它包含大量的数据资产,有243+百万个完整的头部帧,以及来自500个不同身份的超过800k个视频序列,由同步多视图摄像机以30 FPS捕获。

    RenderMe-360 | #数据集
  2. Gossip:在线快速创建精彩而有趣的PPT

    直观和高效的用户界面,解决了传统PPT的多个问题。在Gossip里,你有个专门的地方可以先把所有想到的点子记下来,然后形成大纲,大纲直接生成PPT。你可以像搭积木一样,把你的内容按照你想要的顺序排列好,不用像以前那样一个个拖动幻灯片。

    Gossip的用户界面很简单,包括“想法”、“大纲”、“元素”和“样式和变量”等面板。

    想法收集:在“想法”面板中,你可以输入和组织你的初步想法和内容。
    大纲创建:转到“大纲”面板,根据你的想法创建一个演示文稿的结构。
    内容添加:在“元素”和“主要”面板中,开始添加和组织你的文本、图片和其他元素。
    样式调整:使用“样式和变量”面板来调整每个幻灯片的外观和整体风格。
    预览和调整:在完成初步编辑后,使用预览功能来查看演示文稿的整体效果,并进行必要的调整。
    保存和分享:最后,保存你的演示文稿,还可以使用分享功能来与其他人共享。

    在线体验 | 使用教程 | GitHub
  3. 开源流媒体系统 Jellyfin 呼吁开发者加入

    Jellyfin 是一个开源的流媒体系统,是 Emby 和 Plex 的替代方案。你可以将电影、音乐等放进去,然后在所有的平台上串流播放。

    近期,Jellyfin 官方开始呼吁广泛的社区,希望帮助让 Jellyfin 变得更好。需要新贡献者、新鲜的想法来帮助该项目摆脱当前的困境并迈向更进一步的方向。

    在过去的几周里,Jellyfin 看到了一些与 Plex 相关的重大争议。认为现在是时候提出公开请求了。Jellyfin 反对商业。团队完全由志愿者组成,约有 30 名活跃开发人员,已经有一段时间没有新志愿者加入了。

    用户对 Jellyfin 最大的抱怨可能是没有客户支持以及粗糙/缺乏打磨,官方对此回应:“我们确实听到了。我们也希望这能改善这一点。”“所以,这是我们向世界发出的公开呼吁:Jellyfin 需要你!无论你是开发人员、作家、UI/UX 设计师、还是只是愿意提供帮助的爱好者,我们都希望获得额外的帮助。”
  4. Pymilo 是一个开源 Python 包,为用户提供了一种简单、高效、安全的方式以透明的方式导出预训练的机器学习模型。这样,导出的模型就可以在其他环境中使用,跨不同平台传输,并与其他人共享。

    Pymilo 允许用户导出使用 scikit-learn 等流行 Python 库训练的模型,然后在部署环境中使用它们,或者在不暴露底层代码或依赖项的情况下共享它们。导出模型的透明度确保了最终用户的可靠性和安全性,因为它消除了二进制或pickle格式的风险。
  5. CCEdit:一个多功能的视频编辑框架,可通过轻松改变视频的颜色、动作或位置等各个方面进行视频创意编辑。它不仅包括能够实现各种视觉效果和动态变化,还包括能够精确地控制这些变化的过程。

    CCEdit通过将视频的“结构”(例如物体的位置和动作)和“外观”(例如颜色和光照)分离,使用户能够在不影响其他方面的前提下,更灵活地进行编辑。

    CCEdit主要是通过用户界面和关键帧编辑来实现视频编辑的。用户可以在这些关键帧上应用各种编辑操作,如改变颜色、移动物体等。然后,这些改动会自动应用到整个视频上,从而实现连贯和自然的视频编辑。

    工作原理:

    CCEdit采用了一种创新的方法,将视频的结构(例如物体的位置、动作等)和外观(例如颜色、光线等)分离开来。这样做的好处是,用户可以更灵活地进行编辑,而不会影响到视频的其他方面。

    技术实现:

    ControlNet架构:CCEdit使用了基础的ControlNet架构来保持视频的结构完整性。这意味着,即使你对视频进行了大量的编辑,其基本结构(比如物体的相对位置)仍然会保持不变。

    时间模块: 此外,该框架还集成了与最先进的个性化文本到图像生成技术(如DreamBooth和LoRA)兼容的时间模块。

    关键帧编辑:最引人注目的是,CCEdit引入了所谓的“参考条件下的视频编辑”。简单来说,这就是通过编辑几个关键帧(视频中的重要画面)来控制整个视频的编辑过程。这样,用户就可以更容易地实现精确的创意控制。

    论文 | pdf | #框架
  6. evo.ninja:能够实时进化的AI代理

    给定目标后,它会搜索脚本库中的JS脚本,执行并完成目标。如果没有对应的脚本,会现编一个。提供的示例包括创建SVG图像、计算、读写文件、联网查询。
  7. Prompt Engineering 经验分享 | #经验

    “我这大半年来都在围绕 ChatGPT API 做事,积累了一些 Prompt 相关的经验,大部分跟编程有关。即拿到结果后,我们不直接输出,而是使用代码处理这些结果,然后再输出。Functional Calling 对编程当然有用,不过有时候,配合文中的一些方法,可以得到更好用的结果。”
  8. Vis Zone:数据可视化资源库,提供了非常全面的可视化图表类型供参考,还收集了很多实现可视化的代码、工具、课程、书籍。
  9. 面向开发者的 LLM 入门课程,适用于所有具备基础 Python 能力,想要入门 LLM 的开发者。| 在线阅读 | 英文原版 | PDF下载 | #电子书

    由吴恩达老师与 OpenAI 合作推出的大模型系列教程,从大模型时代开发者的基础技能出发,深入浅出地介绍了如何基于大模型 API、LangChain 架构快速开发结合大模型强大能力的应用。

    其中,《Prompt Engineering for Developers》教程面向入门 LLM 的开发者,深入浅出地介绍了对于开发者,如何构造 Prompt 并基于 OpenAI 提供的 API 实现包括总结、推断、转换等多种常用功能,是入门 LLM 开发的经典教程;

    《Building Systems with the ChatGPT API》教程面向想要基于 LLM 开发应用程序的开发者,简洁有效而又系统全面地介绍了如何基于 ChatGPT API 打造完整的对话系统;

    《LangChain for LLM Application Development》教程结合经典大模型开源框架 LangChain,介绍了如何基于 LangChain 框架开发具备实用功能、能力全面的应用程序:

    《LangChain Chat With Your Data》教程则在此基础上进一步介绍了如何使用 LangChain 架构结合个人私有数据开发个性化大模型应用。