黑洞资源笔记
- 高质量的合成文本数据集资源列表 | Awesome Synthetic (text) datasets
- node-mlx:为 Node.js 设计的机器学习框架,基于 MLX,支持 GPU 加速
-
- coq-of-rust:将 Rust 程序翻译到 Coq 证明系统中,以实现形式化验证,确保程序无漏洞的开源项目
- EVōC:快速灵活的高维嵌入向量聚类库,专为处理大规模数据集设计
-
- catgrad:使用范畴论和静态编译技术优化深度学习训练过程的编译器
- Bend:面向大规模并行硬件如 GPU 的高级编程语言,具有类似 Python 和 Haskell 的表达力,支持高阶函数、闭包、递归和续体,且无需显式并行注解
- A URDF Dataset:专门收集和分享各种来源的URDF(统一机器人描述格式)数据集
- Awesome Public Real-Time Datasets and Sources:公开实时数据集列表,提供多种免费和付费的实时数据源
-
- DingoDB:开源的分布式多模态向量数据库,支持在线强一致性、关系语义和向量语义,具有优秀的水平可扩展性和高可用性
- Awesome Devins:受Devin启发的AI Agent的列表,旨在为软件开发提供自动化和增强能力
- PhysioPro:微软开发的用于生理数据处理和理解的深度学习框架
- rich-argparse:用于增强 argparse 库输出的格式化工具,通过 rich 库提供更丰富的命令行界面帮助信息展示
-
-
- fast-langdetect:基于 Fasttext 构建的高效语言检测库,专为文本转语音(TTS)应用设计,支持多语言分割,提供高达80倍的速度提升和95%的准确率
- instructor-go:用于简化大型语言模型(LLM)结构化输出处理的Go语言库
- superfile:美观且现代化的终端文件管理器