• DoclingMatix:基于 127 万样本的 DocMatix,加入提示式指令,支持图像→指令+结构化文本转换,输出统一的 DocTags 标记格式。
• SynthFormulaNet:645 万公式图像与 LaTeX 对应,涵盖多样字体,提升公式识别精准度。
• SynthCodeNet:930 万代码片段图像-文本对,支持 56 种编程语言,强化代码文档理解。
• SynthChartNet:200 万图表图像(折线、柱状、饼图、堆叠图),附带 OTSL 结构化标注,优化图表信息提取。
SmolDocling 利用这些数据集实现了端到端多模态文档转换的技术突破,具备高效、结构化输出能力。相关论文已发表于 ICCV,模型与数据开放于 Hugging Face 平台,助力研究与应用拓展。
• 适合2-10人小团队,成员每周更新1-3次,内容涵盖项目灵感、文章感想、用户反馈、“假如”设想、旅行或兴趣照片、问题“橡皮鸭”法等。
• 频道以成员姓名命名,仅本人可发起主贴,其他人只能回复线程,避免信息混乱。
• 所有ramblings频道统一归类于列表底部“Ramblings”区,默认静音,无需强制他人阅读。
• Obsidian团队两年前开始尝试,替代传统“水冷间”闲聊,帮助成员专注工作同时保持连接,减少会议需求。
• 自由松散的交流方式激发创新,产生功能点子、小型原型和创意解决方案。
• 每年线下聚会一次,ramblings有效维系全年人际关系与团队氛围。
此方法适合追求高效、专注且人际联结感强的远程或混合办公团队。
• 从基础张量操作、自动微分(autograd)讲起,逐步深入模型构建与训练。
• 8 个详尽教程,系统梳理 PyTorch 全流程,适合零基础友好入门。
• 包含生产环境部署实战,帮助理解理论与应用无缝衔接。
• 教学风格清晰,注重方法论提炼,助力长期掌握 PyTorch 核心技术。
• 课程内容紧贴行业实战,提升开发效率与模型实用性。
PyTorch Beginner Series | #教程
• 支持 Windows/macOS/Linux/ARM 系统,无需额外配置,开箱即用。
• 多协议接入:RTSP、RTMP、HTTP-FLV、MJPEG、HLS、MSE、MP4、WebRTC、HomeKit 摄像头等,涵盖主流及专业流媒体格式。
• 灵活多源管理:支持多摄像头、多协议混合接入,自动匹配客户端支持的编码,实现多源两路音视频协商。
• 高度兼容:兼容主流智能家居平台(Home Assistant 等),支持插件形式集成与独立部署。
• 先进转码能力:内置 FFmpeg 支持硬件加速转码,动态处理不兼容编码,保障流畅播放体验。
• 双向音频支持:RTSP/ONVIF、Tapo、Hikvision、Roborock 等品牌摄像头实现浏览器端双向语音交互。
• 安全与访问控制:API 可限制访问,支持本地与远程安全访问(ngrok、TURN、STUN)。
• 创新应用场景:浏览器即IP摄像头、WebTorrent流分享、流媒体发布至YouTube/Telegram等。
• 业界首创:全球首个支持 HomeKit 摄像头流媒体代理与转发,无需苹果设备也能使用。
• 丰富开发接口:HTTP API、模块化设计,方便二次开发与自定义界面。
go2rtc 通过多协议融合与智能协商,解决了不同设备和客户端生态间的壁垒,真正实现“摄像头即服务”的理念。零配置、零依赖的设计极大降低了运维门槛,适合长期稳定运行和复杂多样的智能家居及监控场景。其持续活跃的开源社区也保障了创新与安全的稳步推进。
• 免费在线访问,无需安装,支持多语言界面,覆盖全球用户。
• 丰富的仿真类型:从经典力学、电磁学,到化学反应、生物过程及地理现象,全面支持跨学科教学与自学。
• 交互式设计,操作直观,帮助用户深刻理解抽象概念和复杂原理。
• 教师资源丰富,含教学活动建议及课程集成方案,提升课堂体验与效果。
• 移动端和桌面端兼容,支持离线使用,方便随时随地学习和演示。
• 持续更新与优化,基于教育研究和用户反馈,确保内容科学性与实用性。
理科教育者与学习者的必备工具,助力构建扎实的科学素养和探究能力。
Code Context:为 Claude Code 及多款 AI 编码 agent 提供强语义代码搜索的 MCP 插件,助力深度理解海量代码库。
• 🔍 语义搜索:基于上下文,精确定位功能和代码片段,快速回答复杂查询如“用户认证相关函数”。
• 🧠 深度语境感知:跨百万行代码理解代码间关联,提升大规模项目维护与协作效率。
• ⚡️ 增量索引:利用 Merkle 树仅重建变更文件索引,节省计算资源,提升响应速度。
• 🧩 智能代码切分:基于 AST 解析代码结构,优化碎片化存储和检索。
• 🗄 可扩展架构:无缝集成 Zilliz Cloud 向量数据库,支持任意规模向量化检索。
• 🛠 灵活配置:支持多语言、多文件类型,允许自定义忽略规则和嵌入模型。
• 🚀 多端兼容:支持 Claude Code、Gemini CLI、VSCode 扩展及其他 MCP 客户端,轻松融入现有开发流程。
• 📦 开源生态:核心引擎、VSCode 扩展、MCP 服务端三大模块一体化设计,便于二次开发和社区贡献。
Code Context 打通了语义搜索与代码理解的壁垒,采用增量索引+AST切分+向量数据库相结合的“三位一体”方案,既保证实时性,又兼顾语义深度和规模扩展,极大提升 AI 编码助手的智能水平和开发者效率。
• 🔍 语义搜索:基于上下文,精确定位功能和代码片段,快速回答复杂查询如“用户认证相关函数”。
• 🧠 深度语境感知:跨百万行代码理解代码间关联,提升大规模项目维护与协作效率。
• ⚡️ 增量索引:利用 Merkle 树仅重建变更文件索引,节省计算资源,提升响应速度。
• 🧩 智能代码切分:基于 AST 解析代码结构,优化碎片化存储和检索。
• 🗄 可扩展架构:无缝集成 Zilliz Cloud 向量数据库,支持任意规模向量化检索。
• 🛠 灵活配置:支持多语言、多文件类型,允许自定义忽略规则和嵌入模型。
• 🚀 多端兼容:支持 Claude Code、Gemini CLI、VSCode 扩展及其他 MCP 客户端,轻松融入现有开发流程。
• 📦 开源生态:核心引擎、VSCode 扩展、MCP 服务端三大模块一体化设计,便于二次开发和社区贡献。
Code Context 打通了语义搜索与代码理解的壁垒,采用增量索引+AST切分+向量数据库相结合的“三位一体”方案,既保证实时性,又兼顾语义深度和规模扩展,极大提升 AI 编码助手的智能水平和开发者效率。