Skip to main content

黑洞资源笔记

  1. 本书是由Richard Hammack撰写的一本关于数学证明技巧的教材。书中内容涵盖了数学基础、逻辑、计数原理、条件语句证明、非条件语句证明、集合论、反证法、数学归纳法等多个主题,期望帮助学生理解数学结构,证明数学命题,并探索数学真理。作者结合了自己在弗吉尼亚联邦大学和兰多夫-梅肯学院教授证明课程的经验,将讲义扩展和精炼成此书,适合各类本科数学课程

    Book of Proof | #电子书
  2. Maxun - Web:数据采集自动化平台 | #爬虫

    爬虫 • 无代码 • 智能化 • 全自动化

    无代码网络数据提取平台, 用户可以在 2 分钟内训练一个网络爬虫机器人, 无需编程知识就能实现自动化的网页数据抓取, 支持将网站转换为 API 或直接导出到电子表格。

    主要特性:
    - 无代码方式提取数据
    - 支持处理分页和滚动
    - 可以按特定时间表运行机器人
    - 支持网站到 API 的转换
    - 支持网站到电子表格的转换
    - 允许用户连接外部代理以绕过反爬虫保护
    - 即将推出: 自适应网站布局变化、支持需要登录和双因素认证的网站抓取

    机器人动作类型:
    - Capture List: 用于提取结构化数据和批量项目
    - Capture Text: 用于提取单个文本内容
    - Capture Screenshot: 可获取全页面或可见区域截图
  3. MemenomeLM: 把 PDF 转化为易上瘾的视频

    针对学习过程, 通过 AI 技术将传统的 PDF 学习材料转换为更生动有趣的视频形式, 既保留了学习内容的专业性, 又强调提高效率、改善学习体验和趣味性, 网站显示已经有超过 10w 学生使用, 涵盖了非常多知名高校。
    Media is too big
    VIEW IN TELEGRAM
  4. 视觉模型集成: 改进 RAG 文档处理新方法

    - 传统 RAG 只处理文本内容, 而这个系统同时处理文本和图像
    - 对 PDF 文档的每一页同时提取文本和图像信息
    - 使用 Qdrant 向量数据库存储文本和图像的双重向量表示

    技术实现细节:
    - 文本处理: 使用文本嵌入模型处理提取的文本
    - 图像处理: 使用 CLIP 模型处理页面图像
    - 向量存储: Qdrant 支持每个文档存储多个向量
    - 视觉分析: 集成了 OpenAI 的视觉语言模型

    查询处理流程:
    - 接收用户查询
    - 使用向量相似度检索最相关的前 3 个结果
    - 将查询和检索到的图像传递给视觉语言模型
    - 聚合文本检索和视觉分析的结果
    - 生成综合的回答

    主要优势:
    - 可以"理解"文档的视觉布局和格式
    - 提供更丰富的上下文信息
    - 能够处理图表、图像等非文本内容
    - 回答更准确, 并能提供视觉证据支持
  5. 视频生成模型的精细调优工具,集成了多种AI视频生成模型,支持从文本到视频、图像到视频以及文本到图像的生成,提供预训练、持续训练、后训练对齐和微调等全面的视频生成流程

    VideoTuna | #工具