黑洞资源笔记
-
-
-
-
-
-
-
- Post-OCR-Correction:用于文本纠错,特别是 OCR 识别后的文本纠错的英文数据集,包含 31.3k 行数据
-
- PDFText:类似 PyMuPDF用于从 PDF 文件提取结构化文本的Python库
- Simone:将 YouTube 视频转换成博客文章,并自动生成相关的上下文截图
- TagStudio (Preview/Alpha): 开源的文件/照片管理应用和系统,目标是创建一个便携式、隐私友好、开放、可扩展且功能丰富的文件组织系统