Skip to main content

黑洞资源笔记

  1. ModelScope-Agent: 用开源大型语言模型构建可定制的Agent系统,一个适用于实际应用的通用且可定制的Agent框架,基于开源 LLM 作为控制器

    具有以下特点:

    可定制且功能全面的框架:提供可定制的引擎设计,涵盖了数据收集、工具检索、工具注册、存储管理、定制模型训练和实际应用等功能,可用于快速实现实际场景中的应用。

    开源LLMs作为核心组件:支持在 ModelScope 社区的多个开源LLMs上进行模型训练。

    多样化且全面的API:以统一的方式实现与模型API和常见的功能API的无缝集成。

    为了赋予LLMs工具使用能力,提出了一个全面的框架,涵盖了数据收集、工具检索、工具注册、存储管理、定制模型训练和实际应用的方方面面。
  2. 一个代码解释器框架,利用GPT-4、CodeLlama 和 Claude 2 等大型语言模型的强大功能,允许用户编写任务,EvalGPT 将协助编写代码、执行代码并交付结果结果。

    1.自动代码编写:EvalGPT 利用先进的语言模型自动生成代码,减少手动工作并提高生产力。
    2.高效的任务执行:通过将复杂的任务分解为可管理的子任务,EvalGPT 确保高效并行执行,从而加快整个流程。
    3.强大的错误处理:EvalGPT 能够在出现错误时重新计划任务,确保可靠的操作和准确的结果。
    4.可扩展性:EvalGPT 旨在处理不同复杂性的任务,使其成为满足广泛编码需求的可扩展解决方案。
    5.资源优化:受 Google Borg 资源管理的启发,EvalGPT 优化利用计算资源,从而提高性能。
    6.可扩展性:EvalGPT 能够将外部工具合并到其运行时中,因此具有高度适应性,可以扩展以处理各种任务。

    EvalGPT | #框架
  3. 一个专门为LLMs中的金融领域知识而设计的基准测试。

    FinEval是一个包含高质量多项选择题的集合,涵盖金融、经济、会计和证书等领域。它包括4,661个问题,34个不同的学术科目。

    为了确保对模型性能进行全面的评估,FinEval采用了多种方法,包括zero-shot,few-shot,仅预测答案(answer-only)和思维链(chain-of-thought)提示词。

    通过在FinEval上评估最先进的中英文大语言模型,结果显示只有GPT-4在不同提示设置下达到了接近70%的平均准确率,表明大语言模型在金融领域知识方面具有显著的增长潜力。

    我们的工作提供了一个更全面的金融知识评估基准,利用了模拟考试数据,涵盖了广泛的大语言模型评估范围。
  4. Spotify 或将歌词转为付费功能

    音乐平台 Spotify 正在测试新版本的会员权益,其中较大的调整是不再免费提供歌词功能。部分使用免费版 Spotify 的用户已经被加入新版本的测试中,后续歌词功能加大概率会变成 Premium 用户独有的功能。
  5. 中文LLaMA&Alpaca大模型的第二期项目 | link

    本项目基于Meta发布的可商用大模型Llama-2开发,是中文LLaMA&Alpaca大模型的第二期项目,开源了中文LLaMA-2基座模型和Alpaca-2指令精调大模型。

    这些模型在原版Llama-2的基础上扩充并优化了中文词表,使用了大规模中文数据进行增量预训练,进一步提升了中文基础语义和指令理解能力,相比一代相关模型获得了显著性能提升。相关模型支持FlashAttention-2训练。

    标准版模型支持4K上下文长度,长上下文版模型支持16K上下文长度,并可通过NTK方法最高扩展至24K+上下文长度。

    本项目主要内容
    🚀 针对Llama-2模型扩充了新版中文词表,开源了中文LLaMA-2和Alpaca-2大模型
    🚀 开源了预训练脚本、指令精调脚本,用户可根据需要进一步训练模型
    🚀 使用个人电脑的CPU/GPU快速在本地进行大模型量化和部署体验
    🚀 支持🤗transformers, llama.cpp, text-generation-webui, LangChain, privateGPT, vLLM等LLaMA生态

    已开源的模型
    基座模型:Chinese-LLaMA-2-7B, Chinese-LLaMA-2-13B
    聊天模型:Chinese-Alpaca-2-7B, Chinese-Alpaca-2-13B
    长上下文模型:Chinese-LLaMA-2-7B-16K, Chinese-LLaMA-2-13B-16K, Chinese-Alpaca-2-7B-16K, Chinese-Alpaca-2-13B-16K
  6. 开源免费抓包软件,支持全平台系统,用flutter框架开发,扫码连接功能简化了配置过程,支持流量转发。

    1.接下来会持续完善功能和体验,请求重写功能增强、模拟慢请求、请求debug, UI优化。
    2.支持安卓微信小程序抓包,安卓分为系统证书和用户证书,下载的自签名根证书安装都是用户证书,微信不信任用户证书,不Root导致Https抓不了了, 目前市场上所有抓包软件抓不了微信的包,后面单独做个运行空间插件,动态反编译修改配置,信任用户证书来解决。
    3.WebSocket、HTTP2协议支持。

    ProxyPin | #工具
  7. Bloom Filters and Beyond: An Illustrated Introduction and Implementation

    本文详细介绍了Bloom过滤器及其实际应用和Python实现。我们还讨论了计数Bloom过滤器,该过滤器允许删除项目。那些正在开发高性能和大数据系统的人将会发现这是一个有用的工具。