Skip to main content

黑洞资源笔记

  1. 掌握Llama 2:Meta推出提示工程交互式指南 | github | #指南

    一个交互式指南,涵盖了提示工程和最佳实践,专为与大型语言模型(LLM)工作的开发者、研究人员和爱好者设计。

    指南提供了关于如何有效地与Llama 2模型交互的详细信息,包括如何格式化聊天提示、何时使用哪种Llama变体、何时使用ChatGPT而不是Llama、系统提示的工作方式以及一些技巧和窍门。还包括如何使用PEFT进行微调、如何在本地机器上进行微调以及如何部署Llama 2等资源。

    Llama 2是Meta发布的一系列最新的开放访问大型语言模型,包括7B、13B和70B参数规模的模型,这些模型在预训练和微调方面都有显著改进。
  2. 一个交互式工具,旨在帮助研究人员探索现有的notebook可视化分析工具,并寻找设计灵感和实施参考,收集了160多个notebook视觉分析工具,用户可以在浏览器中探索这些工具

    SuperNOVA | #工具
  3. 经过精心优化的终极语音克隆工具,旨在提供卓越的性能、模块化和用户友好的体验,增强功能包括代码模块化、跳长实现、支持30多种语言的翻译、跨平台兼容性、优化的要求、简化的安装流程等。

    Applio | #工具
  4. 专注于快速生成高质量结构化表格数据的框架,支持许多单表和多表数据合成算法,可实现高达120倍的性能提升,并支持差分隐私和其他方法以增强合成数据的安全性。

    合成数据是机器根据真实数据和算法生成的,它不包含敏感信息,但可以保留真实数据的特征。合成数据与真实数据之间不存在对应关系,并且不受 GDPR 和 ADPPA 等隐私法规的约束。实际应用中,无需担心隐私泄露的风险。高质量的合成数据还可以应用于数据开放、模型训练与调试、系统开发与测试等各个领域。

    特点
    高性能:支持多种统计数据合成算法,实现高达120倍的性能提升,无需GPU设备;针对大数据场景进行优化,有效降低内存消耗;持续跟踪学术界和工业界的最新进展,及时推出对优秀算法和模型的支持;通过torch等框架为深度学习模型提供分布式训练支持。
    隐私增强功能:SDG支持差分隐私、匿名化等方法来增强合成数据的安全性。
    易于扩展:支持以插件包的形式扩展模型、数据处理、数据连接器等

    Synthetic Data Generator
    | #框架
  5. OpenAI发布新嵌入模型,降低GPT-3.5 Turbo价格 | blog

    OpenAI发布了新的嵌入模型和API更新,包括两个新的嵌入模型、更新的GPT-4 Turbo预览模型、更新的GPT-3.5 Turbo模型和更新的文本审核模型。

    新的嵌入模型包括一个小型高效的text-embedding-3-small模型和一个大型高性能的text-embedding-3-large模型,允许开发者在使用嵌入时权衡性能和成本,特别是可以通过减少嵌入的维数(即从序列的末尾移除一些数字)来实现。 这些模型能够创建最多3072维的嵌入。

    OpenAI表示,发送到OpenAI API的数据默认不会被用来训练或改进OpenAI模型。
  6. 非母语者英语科研写作的几个技巧 | 文章 | #技巧 #经验

    作为非英语母语者,作者Nuwan Bandara在写科研论文时面临语言障碍。他分享了7个提高写作的技巧。

    在写作时遇到词语难点,先留白继续写,初稿允许留白。先写最熟悉的部分,如方法部分。注重绘制漂亮的图表。创建知识文档记录文献要点。

    先写简单版本的导言,迭代完善。学习他人文章的写作方式,研读AI生成的文本扩展写作语言谱。

    从舒适区开始写作,逐步拓展到其他部分,每部分迭代精炼,保持初稿推进。这些技巧帮助作者进步。

    作为非英语母语科研人员,从文章语言结构上学习成功案例很重要,多阅读科研论文,掌握学术写作标准和语言表达。

    AI生成的文本如ChatGPT虽不能直接引用,但可以用来优化语句结构,提高学术英语写作水平。
  7. CurlyQ 是一个实用程序,为curl 提供了一个简单的界面,并具有提取图像和链接、通过CSS 选择器或XPath 查找元素、获取详细标题信息等附加功能。

    它被设计为脚本管道的一部分,将所有内容输出为结构化数据(JSON 或 YAML)。它还具有使对 JSON 端点的调用更容易的基本支持,但预计你会使用jq之类的东西来解析输出。
  8. 用汇编语言编写的轻量级网络论坛引擎

    AsmBB完全用汇编语言编写,并使用SQLite作为数据库后端。这就是为什么它可以在非常弱的托管上工作,同时为大量访问者提供服务,而不会出现滞后和延迟。

    由于内部设计和减少的依赖性,AsmBB 是非常安全的 Web 应用程序。但它还支持加密数据库,安全性更高。

    另外,AsmBB对运行环境的要求很少:

    -x86 Linux 服务器。
    -不管32位还是64位。无需任何专门预安装的库。
    -最小/最便宜的 VPS 就可以了。共享主机也可以(如果支持 FastCGI)。
    -支持 FastCGI 接口的 Web 服务器。AsmBB 已通过 Nginx、Apache、Lighttpd、Hiawatha,当然还有 RWASA 进行了测试。

    AsmBB 易于定制和修改 - 它使用非常强大的模板系统,可以轻松定制论坛而无需实际修改代码。(不过这并不难)。

    AsmBB | 二进制包 | repo
    安装教程:使用 NGINX 和 systemd 安装 | 使用 RWASA 安装
  9. TextAnalysisTool.NET是一款文本分析工具,旨在快速高效地查看、搜索和导航大型文件。

    这个工具提供了一个数据视图,可以轻松地操作该数据视图(通过使用各种过滤器),根据你的需要以准确显示需要的信息。

    TextAnalysisTool.NET | #工具