黑洞资源笔记

15:54 · Feb 14, 2024 · Wed

神经网络关键技术图解 | 论文地址 | github | #机器学习

作者把机器学习和神经网络领域的重要技术，都做成了神经回路图（Neural Circuit Diagrams，作者自研的图形语言），目的是展示神经网络架构的细节，便于学习和理解

机器学习
15:51 · Feb 14, 2024 · Wed

这个站点把国外很多优质的播客做了转写，质量不错。| Transcript Forest | #播客

播客
15:44 · Feb 14, 2024 · Wed

Linux 中国所有原创文章的 Markdown 内容备份 | attachments
15:40 · Feb 14, 2024 · Wed

SocraSynth是一个多LLM Agent推理平台，通过条件统计和连续论证来增强上下文，并通过可调节的辩论争议水平，解决了大型语言模型在偏见、幻觉和推理能力不足方面的问题，提供了全面的评估和增强合作的功能。
15:40 · Feb 14, 2024 · Wed

一个OS-Copilot框架，该框架可以加速构建通用计算机Agent，在操作系统层面上进行交互，并通过自我学习和控制Excel和Powerpoint等任务来提高性能。

OS-Copilot | #框架

框架
15:37 · Feb 14, 2024 · Wed

Aya模型：一个513M参数的多语种语言模型，能理解和遵循101种语言的指令。

Aya数据集是迄今为止最全面的多语种指令微调数据集，包含114种语言的5.13亿个提示和补全，完全开源。它为自然语言理解、摘要和翻译任务中的未服务语言提供了基础。
15:32 · Feb 14, 2024 · Wed

OpenAI为ChatGPT和GPTs增加记忆能力 | blog

OpenAI正在测试ChatGPT的记忆能力，使其能够记住用户的讨论内容，从而提高未来聊天的有效性，用户可以控制ChatGPT的记忆。记忆可以让ChatGPT记住用户的偏好和详细信息，从而提供更加个性化和连贯的对话。例如记住用户喜欢的会议纪要格式、拥有的咖啡店细节、孩子的喜好等。

用户可以随时关闭记忆功能，也可以让ChatGPT遗忘特定记忆或清除所有记忆，删除聊天不会删除其记忆。

OpenAI可能会使用用户提供的内容(包括记忆)来改进模型，用户可以通过数据控制关闭此功能。可以使用临时聊天功能进行不需要记忆的对话。

自定义指令可以让ChatGPT更好地了解用户及回复方式。记忆可以补充聊天中获得的信息。团队版和企业版用户可以通过记忆更高效地使用ChatGPT，例如记住格式偏好、编程语言等，企业版用户可以关闭组织的记忆功能。

GPTs也将拥有独立的记忆。建造者可以选择为GPTs开启记忆，用户与不同GPTs的记忆是独立的。OpenAI将关注记忆带来的隐私和安全问题，避免主动记住敏感信息。
15:28 · Feb 14, 2024 · Wed

Chat With RTX：NVIDIA的本地聊天机器人项目

Chat With RTX让用户可以个性化训练一个连接自定义内容(文档、视频等)的大型语言模型，并与其聊天获取相关回复。

Chat With RTX利用了检索增强型生成(RAG)、TensorRT-LLM和RTX加速，可以快速从自定义聊天机器人中获取与上下文相关的回复。它支持各种文件格式，包括文本、pdf、doc/docx、xml等。用户可以指向含有这些文件的文件夹，应用可以在几秒内加载它们。

Chat With RTX技术演示基于GitHub上的TensorRT-LLM RAG开发者参考项目构建。开发者可以基于该项目开发部署自己的RAG应用。

Chat With RTX需要Windows 11系统，NVIDIA GeForce RTX 30/40系列或支持TensorRT-LLM的GPU，16GB以上RAM。

RTX GPU通过TensorRT-LLM可以实现下一级别的AI性能，提供增强的创造力、生产力，以及极快的游戏体验。

NVIDIA提供了各种面向开发者的生成AI工具和面向企业的解决方案。
16:00 · Feb 13, 2024 · Tue

圣克鲁斯加利福尼亚大学的老师Eric Lengyel总结的二进制运算基础
15:52 · Feb 13, 2024 · Tue

DataDreamer：一个强大的开源Python库，用于提示、合成数据生成和训练工作流，旨在简单、高效，且适用于研究。

使用DataDreamer，可以轻松创建和运行多步骤的提示工作流，生成合成数据集，对模型进行训练。
15:48 · Feb 13, 2024 · Tue

RAG工作流自动化优化工具 | AutoRAG | #工具

工具
15:47 · Feb 13, 2024 · Tue

基于MLX的强化学习框架，利用Apple M系列芯片的统一内存功能来增强强化学习算法的性能和效率。

RLX: Reinforcement Learning with MLX | #框架

框架
15:45 · Feb 13, 2024 · Tue

简单而强大的命令行正则表达式测试工具，专为开发人员、数据科学家和任何有兴趣直接从终端操作正则表达式的人而设计

特征
1.交互式用户界面：构建在库之上textual，提供干净直观的界面。
2.正则表达式评估：match支持使用or模式评估正则finditer表达式，允许用户选择最适合自己需求的方法。
3.实时反馈：立即查看正则表达式模式如何匹配或查找输入的迭代，从而增强学习和调试体验。
4.易于使用：通过简单的命令即可快速入门。rexi直接从标准输入读取输入，简化了测试正则表达式的过程。

rexi | #工具

工具
15:43 · Feb 13, 2024 · Tue

Shoggoth：点对点匿名网络，用于发布和分发开源人工智能(AI)。

加入Shoggoth网络无需注册或批准，节点和客户端操作匿名，身份与现实世界的身份分离。任何人都可以自由加入网络，并立即开始发布或访问资源。

Shoggoth的目的是为了对抗AI审查制度，赋予软件开发人员创建和分发开源AI的权力，而无需集中式服务或平台
15:40 · Feb 13, 2024 · Tue

Aya Dataset是一个开放获取的数据集合，旨在填补自然语言处理中的语言差距，包括一个由人工策划的涵盖65种语言的指令遵循数据集，以及一个跨越114种语言的多语言数据集，共包含5.13亿个实例。

该项目旨在为指令微调提供资源，并为未来的研究合作提供宝贵的框架。该数据集对于AI语言建模的突破至关重要，并强调了多样性和包容性数据集的重要性。
15:39 · Feb 13, 2024 · Tue

babelfish by sync：在不到15分钟内部署一个应用，利用AI将任意视频完美翻译成任意语言并实现唇语同步
15:34 · Feb 13, 2024 · Tue

若有需求，我这里也有渠道