Skip to main content

黑洞资源笔记

  1. 有推主(@tarantulae)吐槽最近99%的类ChatGPT模型,几乎都是来源Meta开源的LLaMA,然后拿ChatGPT的数据(来自ShareGPT插件,这是个快速分享ChatGPT AI 对话的浏览器插件)做了一些微调,然后改个名字就变成开源了新的ChatGPT模型,本质上是在营销而已。
  2. 使用 OpenAI 的 GPT API 抓取网站的实验库scrapeghost。该库提供了一种从 HTML 中抓取结构化数据的方法,而无需编写特定于页面的代码。| 传送门
  3. 使用 AI 在研究论文中寻找答案,基于 GPT-4 的科学总结。目前为beta版本。

    网站让你可以输入问题,然后它利用GPT-4来帮你找到最贴切的 5-10 篇论文里的答案。目前不支持中文输入。

    Consensus
  4. 这是一个允许你从多个来源收集电影剧本的工具,并以.txt文件的形式创建一个包含2.5千多部电影剧本的数据库,同时还有电影的元数据。

    整个过程有四个步骤:
    从各种来源收集剧本 - 在网站上搜刮HTML、txt、doc或pdf格式的剧本
    收集元数据 - 从TMDb和IMDb获取关于剧本的元数据,以便进行额外处理
    查找不同来源的重复内容 - 自动分组并删除不同来源的重复内容。
    解析脚本 - 将脚本转换为只含人物和对话的行文

    The Movie Script Database | #工具 #剧本
  5. NSA Ghidra 软件逆向工程框架。

    Ghidra是由美国国家安全局研究总局创建和维护的软件逆向工程(SRE)框架。该框架包括一套全功能的高端软件分析工具,使用户能够在各种平台上分析编译代码,包括Windows、macOS和Linux。其功能包括反汇编、汇编、反编译、图形化和脚本化,以及数百个其他功能。Ghidra支持各种处理器指令集和可执行格式,并可在用户交互和自动化模式下运行。用户还可以使用Java或Python开发自己的Ghidra扩展组件和/或脚本。

    为支持NSA的网络安全任务,Ghidra旨在解决复杂SRE工作中的可扩展性和团队协作问题,并提供可定制和可扩展的SRE研究平台。NSA已将Ghidra SRE能力应用于涉及分析恶意代码和为SRE分析师生成深入洞察力的各种问题中,以更好地了解网络和系统中潜在的漏洞。

    Ghidra | #框架
  6. TaxyAI:使用 GPT-4 的开源浏览器自动化

    Taxy使用GPT-4控制浏览器,并代表人来执行重复的操作。目前,它允许定义临时指令。将来,它还将支持保存和预定工作流。

    Taxy目前处于研究预览状态。许多工作流程失败或使代理程序混淆。如果想在Taxy上进行改进或在自己的工作流程上进行测试,请按照说明在本地运行。

    评论区有演示
  7. 有必要说几句解除误会的话:

    让你们加QQ群只是给不方便或者不常玩儿tg的人提供便利,也便于我继续提供售后服务,绝不是评论里说的要解散tg群。。。。我经营了四年多的群怎么可能说散就散。。。。

    我说的不想续费,说的是qq群,是qq的超级会员不想续费了,因为没什么用,硬要说有点用的话,就是能浪费钱,这个跟tg没什么瓜葛啊。。。。

    ps:看到底下这些表情的反馈,莫名想笑
  8. play.ht:这个项目可以从20秒的音频中快速生成克隆语音,并自动转换为英语。即便你不会说英语,也可以通过语音克隆的方式,立刻说出一口流利的英语。

    这里的技术采用了一个名为 Parrot 的模型,它能从几秒的音频克隆出声音,并基于文本,重新生成一段富有情感的语音。

    目前该模型只支持英语,不过技术团队已经在开始尝试支持更多语言。

    克隆声音的数据样本主要分两种:高保真(20 分钟)和零样本(20 秒),给的音频样本时间越长,其精度就更佳。

    未来,该工具将被应用到各类数字内容创作(如游戏、媒体、在线教育)等平台。
  9. 作为当下最受欢迎的开源 AI 大模型解决方案,GitHub 上一个开源项目 Colossal-AI 建立了一整套完整的 RLHF 流程,包括:监督数据集收集 -> 监督微调 -> 奖励模型训练 -> 强化学习微调。

    并且,技术团队以 LLaMA 为基础预训练模型,正式推出了 ColossalChat,这也是目前最接近 ChatGPT 原始技术方案的实用开源项目。

    该项目包括但不限于以下功能:

    - Demo:可直接在线体验模型效果,无需注册或 waitinglist;
    - 训练代码:开源完整 RLHF 训练代码,已开源至含 7B 和 13B 两种模型;
    - 数据集:开源 104K 中、英双语数据集;
    - 推理部署:4bit 量化推理 70 亿参数模型仅需 4GB 显存;
    - 模型权重:仅需单台服务器少量算力即可快速复现;
    - 更大规模模型、数据集、其他优化等将保持高速迭代添加。

    目前,相关代码已开源至 GitHub,感兴趣的同学可以看下。

    项目还有提供完整的中文教程,进一步降低学习门槛,让大家能更快上手开发。

    Colossal-AI | Paper | Docs | Forum | Blog | YouTube
    Media is too big
    VIEW IN TELEGRAM
  10. Ebook Translator 是书伴开发的一款 Calibre 插件,可以将不同格式不同语言的电子书翻译成指定语言(原文译文对照)指定格式的电子书,支持 Google、ChatGPT 和 DeepGL 翻译引擎。

    在日常的生活、工作或学习中,如果在阅读或翻译外文电子书的过程中需要频繁使用翻译软件,在内容和翻译软件之间来回切换,可能会成为一件颇为痛苦的事。Ebook Translator 插件借力 Calibre 对电子书的强大处理功能和翻译引擎对多种语言的翻译支持,可以轻松将译文添加到原文段落之后

    借助 Calibre 对多种电子书格式的灵活支持,进行翻译时,你可以自由地选择输入输出格式,比如把 TXT 翻译成为 TXT 或 EPUB,把 PDF 翻译成 PDF 或 DOCX。

    Ebook Translator 插件源代码使用 GPL v3 许可证。插件项目托管在 Github 上。

    Ebook Translator 插件主要包含如下功能:

    1.支持所选翻译引擎所支持的语言(如 Google 翻译支持 134 种)
    2.支持多种翻译引擎,包括 Google 翻译、ChatGPT 以及 DeepL
    3.支持所有 Calibre 所支持的电子书格式(输入格式 48 种,输出格式 20 种)
    4.支持批量翻译电子书,每本书的翻译过程同时进行互不影响
    5.支持缓存翻译内容,在请求失败或网络中断后无需重新翻译
    6.提供大量自定义设置,如将翻译的电子书存到 Calibre 书库或指定位置

    Ebook Translator 插件支持翻译的语言:

    Google 翻译支持的语言列表
    DeepL 翻译支持的语言列表
    ChatGPT 支持的语言未知

    Ebook Translator 插件支持的输入格式:

    EPUB, AZW3, AZW4, MOBI, PDF, DOCX, TXT, RTF, HTML, HTM, XHTML, XHTM, TXTZ, CB7, ODT, RAR, FBZ, CBC, SHTM, TEXT, SHTML, POBI, UPDB, OPF, TCR, PML, PDB, RECIPE, CHM, SNB, LRF, LIT, RB, DOWNLOADED_RECIPE, MARKDOWN, CBR, DJV, DJVU, MD, AZW, TEXTILE, DOCM, HTMLZ, PMLZ, CBZ, ZIP, PRC, FB2

    Ebook Translator 插件支持的输出格式:

    EPUB, AZW3, MOBI, KFX, PDF, DOCX, TXT, RTF, OEB, TCR, PDB, SNB, LRF, TXTZ, LIT, RB, HTMLZ, PMLZ, ZIP, FB2

    原文 | 插件下载:Github下载百度网盘本地下载Google Drive | #工具 #插件
  11. Portal是一款跨平台工具,旨在将ChatGPT的能力整合到用户的工作流程中。

    具体来说,他可以将任何选择的文本通过快捷键发送到ChatGPT,进行处理,然后返回到用户的剪切板,或者在光标处返回(实现打字机效果)。这意味着你可以在大部分没有接入ChatGPT能力的应用立即获得ChatGPT的加持。

    它实现了ChatGPTweb免费接入和API接入方式,让用户可以自由选择适合自己的接入方式。

    此外,Portal还支持上千种模板导入和创建,并且可以将这些模板绑定到快捷键中,使用户能够在日常工作中快速调用常用的话语。

    Portal还提供了对话管理功能和对话图谱,方便用户在深度学习时深入了解对话,轻松地穿梭于父子问题之间,并形成一个整体的理解。

    总的来说,Portal是一个功能强大的工具,能够帮助用户更好地利用ChatGPT的能力,并将其整合到自己的工作流程中。

    特性如下:
    1.免费接入(实验性功能):用户可以通过ChatGPTweb免费使用,无需购买API Key,支持API和ChatGPTweb连接方式,用户可以根据自己的需求选择适合自己的方式。
    2.自定义提示语模板:客户端支持自定义和导入上千种提示语模板,方便用户选择常用的提示语。
    3.快捷键绑定特定模板:通过配置快捷键,用户可以将选择的文字发送到特定的提示语模板,并返回到光标处或者复制到剪切板,让软件无缝嵌入到多种应用中。
    4.对话管理 & 对话图生成:支持多对话切换,方便用户管理多个对话。高亮文字右键创建对话连接,客户端可以生成对话图,可以在对话图中快速浏览,方便用户进行对话分析和管理。

    点击查看详细配置:微信应用:猫娘嘴替 | 文本编辑器应用:文案生成器 | 网页应用:文本翻译器 | #工具