Chibisafe:极速、安全、开源的文件上传服务,满足多样化场景需求

• 纯 TypeScript 编写,轻量高效,支持大文件分片上传,极大降低网络失败风险
• 多模式支持:公开、公私用户账户、邀请制,满足不同权限管理需求
• 集成全面控制面板,配置无须修改环境变量,轻松调节限速、文件大小、格式等参数
• 支持 S3 存储,文件管理、标签分类、创建专属相册和代码片段,方便内容组织与分享
• 内置 URL 短链接生成,支持 ShareX 截图上传、iOS 分享菜单快捷上传及浏览器扩展
• 用户管理和配额控制,保障服务公平使用
• 完全开源,无广告无追踪(仅限 IP 请求日志),安全透明
• 容器化部署优选 Docker,迁移便捷,v6 支持一键数据库与上传文件迁移
• 适合企业自建、开发者集成和个人存储,提供强大扩展能力和稳定性能
MCP Reddit Server 提供专业工具,高效抓取与解析 Reddit 内容,助力模型获取实时社区动态。

• 支持抓取任意 subreddit 热门帖子,内容涵盖文本、链接及图集多种类型
• 详细提取帖子及评论数据,方便深入分析社区讨论脉络
• 通过 Model Context Protocol(MCP)标准接口,增强大模型对上下文的理解能力
• 可通过 Smithery 一键安装,兼容 Claude Desktop,简化部署流程
• 开源 MIT 许可,活跃社区支持,已有 147 星标和多次 fork
• 实例应用:快速获取 r/victoria3 热帖,洞察游戏开发日志和玩家互动,提升信息抓取效率

MCP Reddit 以结构化数据服务为核心,提升 AI 模型在社交媒体内容理解和生成的精准度与广度,适合研究、开发及自动化情报采集。
SecoustiCodec:实现跨模态对齐的超低码率实时语音编解码技术

• 码率超低,仅0.27-1 kbps,极大节省带宽资源
• 跨模态对齐,保证文本与语音的同步,提升语义一致性
• 说话人特征保留,语义与副语言信息有效解耦,保真度高
• 流式架构支持实时处理,适合在线语音传输和通信场景
• 高效编码:结合变分自编码器(VAE)与有限状态量化(FSQ)技术
• 开源且支持多平台快速部署(Ubuntu/macOS),易于集成和二次开发
• 提供两种模型版本,分别支持21.5 Hz(0.27 kbps)和86 Hz(1.0 kbps)帧率,满足不同需求
A Survey of Context Engineering for Large Language Models:大型语言模型(LLM)性能的核心驱动力源自上下文信息的设计与管理,Context Engineering作为一门新兴且系统化的学科,正在重塑智能系统的构建范式。该综述基于对1400余篇文献的深度整合,提出了全面且细致的框架与洞察。

Context Engineering为未来AI系统赋予了“情境感知”与“智能调度”的核心能力,推动LLM从孤立文本生成工具跃升为多模态、多任务、长时记忆及协同交互的智能中枢。此综述不仅提供了详尽的技术蓝图,更启发跨学科融合与创新,助力研究者与工程师开辟智能时代的新航路。
GEM:专为通用大语言模型(LLM)设计的开源强化学习环境,推动LLM训练从静态数据迈向动态多样化体验。

• 类似OpenAI Gym,提供多样化环境和统一接口,便于与现有RL框架(如Oat、Verl)无缝集成。
• 支持工具嵌入(Python代码执行、搜索等),灵活封装与异步矢量化环境执行,提升训练效率和扩展性。
• 与Gym接口高度兼容,示例涵盖游戏猜数字、数学题解答、代码执行等多场景,涵盖多环境训练与策略在线更新。
• 安装便捷,PyPI一键部署,支持额外组件快速启用搜索、代码工具,兼容主流深度学习硬件加速。
• 开放生态,欢迎贡献新环境与训练框架,社区活跃,未来计划纳入终端基准、多智能体等复杂场景。
• 由Sea AI Lab支持,构建于多个顶级开源项目基础,包含丰富示例代码,助力LLM智能体训练迈入全新阶段。
超越传统加速器,Xget 打造跨平台资源获取新标杆:

🚀 极致性能:Cloudflare 330+ 边缘节点,HTTP/3 协议加持,响应时间 < 50ms,传输速率提升 30%+
📦 多平台支持:统一加速 GitHub、GitLab、PyPI、npm、Conda、Docker Registry、Hugging Face 等上百种资源,自动识别链接转换,体验无缝高速下载
🔒 企业级安全:多层安全策略(HSTS、XSS 防护、严格内容安全策略),路径长度限制、请求验证、超时保护,确保下载环境安全可信
⚙️ 丰富集成:兼容 git clone/push/pull,支持 wget、cURL、aria2 等主流工具,CI/CD 环境友好,Docker、Podman、containerd 容器镜像全面加速
🌐 轻松部署:Cloudflare Workers 一键部署,开箱即用;支持自定义配置,满足企业和开发者多样需求
📊 内置性能监控与智能重试,提高下载成功率,缓存优化显著减轻源站压力
🛠 生态兼容:支持多语言包管理器(Maven、Gradle、RubyGems、NuGet、CRAN、CPAN、Composer 等),科学加速开源生态资源获取
📚 学术与开源应用加速:arXiv 论文、F-Droid 应用、各类容器镜像拉取一网打尽,极大提升研发与学习效率

Xget 以极致的速度和安全保障,重新定义跨平台资源加速体验,是开发者、运维及科研工作者的理想选择。
千万级信息图表数据集,助力图表理解与生成领域突破

• 覆盖115万+合成与10万+真实信息图表,囊括75种图表类型、330种视觉变体及68种布局模板
• 数据来源广泛,采集自Pinterest、Visual Capitalist、Statista等19个权威图表网站
• 合成图表通过程序化生成,基于详尽的视觉元素和空间布局规则,确保多样且高质量
• 应用场景丰富:
 – 提升基础模型对信息图表的理解能力,附完整训练与评测代码
 – LVLM代码生成基准,精准评估D3.js图表渲染的视觉相似度,支持高低粒度对比
 – 示例驱动的图表生成方法,能根据样例图表风格将用户表格数据转化为美观信息图
• 数据集及相关代码均开源,采用Apache 2.0协议,便于科研与产业应用
• 最新数据发布:2025年6月新增23万+合成图表,整体规模达44万种变体

ChartGalaxy | #数据集
PatternCraft:专业级背景图案与渐变资源库,助力网站与应用界面设计升级:

• 超过100+现代CSS背景图案和渐变代码,支持即时复制粘贴,兼容Tailwind CSS与JSX环境
• 设计风格时尚,响应式自适应,适合React、Next.js、Vue、Angular等主流前端框架
• 零依赖纯CSS实现,无需额外库,性能优异,跨浏览器兼容性强
• 实时预览功能,便于快速筛选与定制,支持收藏喜爱样式,提升开发效率
• 结构清晰,分类细致,方便查找渐变、几何、装饰、效果等多种风格背景
• 可通过调整渐变色值、尺寸、层叠顺序等轻松自定义,满足多样化视觉需求
• 基于Next.js 14、TypeScript与Tailwind CSS构建,Vercel全程托管,保证速度与稳定性
• 开源MIT协议,社区活跃,支持贡献新图案,持续丰富设计资源库

将设计与开发无缝结合,提升项目品质与体验,节省重复造轮子时间。
Linkook:基于单一用户名,深度挖掘多平台关联社交账号及相关邮箱的开源 OSINT 工具,助力信息搜集与渗透测试。

• 支持跨平台账号搜索,自动发现关联的不同用户名社交账号及邮箱信息。
• 集成 HudsonRock 网络犯罪情报库,检测相关邮箱是否遭遇数据泄露或恶意窃取,提升风险洞察。
• 兼容 Have I Been Pwned API,支持订阅后更精准的邮箱泄露监测。
• 支持导出符合 Neo4j 格式的 JSON 文件,实现可视化关系分析,直观展现账号与邮箱间的关联网络。
• 灵活命令行参数,满足结果摘要、简洁模式、全站扫描、本地配置、自定义输出目录等多样需求。
• 相较 Sherlock,递归发现跨用户名的关联账号,避免遗漏多账户用户,提升信息完整性和准确度。
• 完全开源,MIT 许可,支持社区贡献,适合渗透测试、数字取证及安全研究长期使用。
Back to Top