Dewhale:充分发挥 Github 平台能力的通用 AI 工作流
黑洞资源笔记
-
-
- RigelA - 用纯Rust编写的读屏(Screen Reader)项目,用于视力有障碍的人群操作电脑,软件会将屏幕上的各种信息转换成语音输出
- LLM-And-More:一站式大模型训练及应用构建的解决方案,其覆盖了从数据处理到模型评估、从训练到部署、从想法到服务等整个流程。在本项目中,用户可以轻松地通过本项目进行模型训练并一键生成所需的产品服务。
本项目的优势主要体现在以下三点:
总结了不同应用场景下的专业知识和最佳实践,以保证模型在实际生产中的表现优异。
集成了高性能模型并行框架,有效地减少了训练和推理时的算力开销。
用户可以基于自身需要定制化模型及服务,便捷且自由度高。 - 从零开始学习深度强化学习的实践课程 | link
- 面向音乐信息检索的大型语言模型教程 | LLMs heart MIR
- B-MoCA:用于评估移动设备控制Agent在不同配置下性能的基准测试平台
- MLX-VLM:在 Mac 上使用 MLX 运行视觉语言模型(Vision LLM)的包
- MuPDF.js:为 JavaScript 和 TypeScript 构建的 MuPDF 库,利用 WebAssembly 提供快速和高效的 PDF 操作功能
- kvql:为通用键值数据库设计的类似 SQL 的查询语言
- RAG-Retrieval:开源的Python库,旨在统一高效微调RAG检索模型,包括嵌入、ColBERT和交叉编码器模型,支持多种排序模型并优化长文档处理
-
-
- Mu-Transformer:使用 Jax/Flax 实现的 Transformer 模型,支持 Mu-Parameterization,能在 TPU pods 上运行 FSDP
-
- CCML:用C语言编写的简单自动微分库,旨在教育性地展示计算科学中各种概念的实现细节
- 在线免费教程《命令行中的数据科学》第二版
这本经过彻底修订的指南演示了命令行的灵活性如何帮你成为更高效、更有生产力的数据科学家。 你将学习如何结合小而强大的命令行工具来快速获取、清理、探索和建模数据。 为了让你快速入门,作者 Jeroen Janssens 提供了一个包含 100 多个 Unix 强大工具的 Docker 映像,无论使用 Windows、macOS 还是 Linux,该工具都非常有用。
本书非常适合数据科学家、分析师、工程师、系统管理员和研究人员。