黑洞资源笔记
-
-
-
-
-
- ArXiv Paper Reader:旨在简化和流利的arXiv论文阅读,使用 LaTeX 代码转换为 HTML 页面,然后提取文本和公式,将其转换为视频,并创建与 PDF 文档匹配的图,以及文本分段并将其转换为音频
- Magix 是一个用于训练大规模语言模型的轻量工具,具有灵活的数据和模型平行功能
-
- GPT Newspaper:是一个 AI 自动化的新闻平台,通过人工智能自动新闻创作,定制新闻页面,提供个性化的新闻体验
- BrowserGym: 用于 Web 任务自动化的开源项目,提供 Chrome 浏览器环境的 Gym 集成,用于自动化各种网站和应用的任务
- 超赞列表合集,从各类Awesome list项目抓取而来
- NeMo Curator:一个 Python 库,用于创建和处理自然语言处理 (NLP) 数据集,以便训练大型语言模型 (LLM)。该库包含一些可扩展的模块,允许 NLP 研究人员从无标注 Web 采集高质量文本,并提供 GPU 加速功能。
- Local RAG:一个开源项目,使用 开源大预言模型 (LLM) 提取文件并进行检索增强生成 (RAG),无需第三方或敏感数据,在本地保持匿名
- ShareGPT Builder:一个功能强大的 Flask 应用,用于创建和存储 ChatGPT 模型的训练样本,允许手动创建和存储 SFT 格式的聊天对话,并自动将其添加到 JSON 文件中,以便其他模型可访问
- AI-in-a-Box:旨在帮助工程师建立人工智能和机器学习解决方案,并提供快速而高质量的解决方案,以减少架构师的成本和降低风险
-