Skip to main content

黑洞资源笔记

  1. Panda:海外中文开源大语言模型,基于 Llama-7B, -13B, -33B, -65B 进行中文领域上的持续预训练,使用了接近15M条数据,并针对推理能力在中文benchmark上进行了评测
  2. LLM Zoo:收集了各种开源和闭源语言模型的信息,包括发行时间、模型大小、支持的语言、领域、训练数据以及相关资源链接。旨在为自然语言处理(NLP)领域的研究人员提供参考,以帮助其选择适合其需求的模型
  3. ddns-go:简单易用的DDNS服务

    支持自动更新域名解析到公网IPv4或IPv6地址。该软件支持系统和Docker中使用,支持多种域名服务商,支持以服务的方式运行。

    用户可以配置多个DNS服务商、多个域名同时解析,支持Webhook通知和TTL等特性
  4. WebGPU是新的WebGL,是绘制3D图形的新方法,并有望成为绘制2D图形的标准。| blog

    WebGPU可以取代Vulkan和普通OpenGL,成为任意编程语言中任意软件绘制图形的标准。Chrome113已经支持WebGPU,到年底WebGPU将在所有浏览器中普及。

    WebGPU的推出对非程序员的影响可能不大,但它有望使浏览器中运行网页游戏成为常态,浏览器里运行类似ChatGPT的大型LLM模型应用也很值得期待。对程序员而言,WebGPU注定是一个重大的进步。
  5. ChatPLUG:旨在构建和分享一个中文开放领域对话系统。

    通过互联网增强的指令微调,注入各种世界知识和对话能力,从而构建一个强大且实用的开放域对话系统。具有知识增强、个性化和多技能等特点。通过在多个任务上表现出良好的多任务泛化能力,胜过现有的中文对话系统。

    目前的局限性包括:对话风格生成、推理能力较弱、对编码任务的表现不佳、可能会生成有害或偏见内容、多语言能力受限
  6. StarCoder模型是一个15.5B参数模型,使用80多种编程语言的GitHub代码进行训练。

    该模型采用了多查询注意力和8192个Token的上下文窗口,使用了1万亿个Token的填充中间目标进行训练。可用于生成代码片段,但生成的代码不保证有效、没有漏洞或不包含漏洞 | github
  7. llm.ts:一个开源的零依赖库,可使用单一API调用30多种LLM,可以在单个响应中发送多个提示到多个LLM,并将结果返回。

    llm.ts支持各种不同的LLM,包括文本生成、代码生成、知识库和对话模型等。llm.ts可以在Node、Deno和浏览器等任何地方使用,用户需要自己提供API密钥
  8. 一个微信机器人工具,支持发送文本消息、图片、文件、XML、表情等,可以接收好友申请、添加群成员等功能,还支持Python、Java、Rust等多个客户端。提供了RPC通信和间谍模块来实现微信消息的转发。

    WeChatFerry | #工具
  9. 用于从各种信息源中提取知识并使用OpenAI的GPT-3模型生成答案的工具。

    它支持从互联网、本地数据、YouTube字幕和音频等各种信息源中提取文本。可以使用RESTful API或Python库进行调用。

    knowledge-gpt | #工具
  10. 用于信号分解的建模语言框架。提供了一个优化算法来进行分解,当损失函数都是凸函数时,算法可以找到全局最优解,在非凸函数时表现出良好的启发式算法性能。支持处理有缺失值的时间序列信号,并提供了许多有用的损失函数类

    OSD | #框架
  11. CDSL-Yaklang: 一门专为网络安全领域设计的编程语言,拥有高效、简洁和易于维护等优点,通过Yakit IDE和命令行都可以快速使用,实现了一个栈虚拟机(YakVM)
  12. GPT4free:一个针对GPT-4/3.5的第三方API反向工程库,可用作OpenAI官方包的替代。此库包含从各种网站获取的模块。此外,GPT4Free还提供了一个基于Web的图形用户界面(Streamlit GPT4Free GUI)以及Docker等方便的部署方式。

    需要注意的是,此库仅供教育目的,使用第三方API和AI模型,与API提供者或模型的原始开发人员无关,使用者必须自行承担风险。