Skip to main content

黑洞资源笔记

  1. 一个在线文本编辑器,可以帮助记者和媒体专业人员实时验证新闻的准确性,提高报道的可信度和可靠性,快速检测有偏见或误导性信息,从而促进细致而可靠的报道,还可以检测由人或聊天机器人(如ChatGPT)创建的任何文本中的错误、偏见、争议和虚假信息。

    Factiverse | #编辑器
  2. ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本,在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上,ChatGLM2-6B 引入了如下新特性:

    更强大的性能:基于 ChatGLM 初代模型的开发经验,我们全面升级了 ChatGLM2-6B 的基座模型。ChatGLM2-6B 使用了 GLM 的混合目标函数,经过了 1.4T 中英标识符的预训练与人类偏好对齐训练,评测结果显示,相比于初代模型,ChatGLM2-6B 在 MMLU(+23%)、CEval(+33%)、GSM8K(+571%) 、BBH(+60%)等数据集上的性能取得了大幅度的提升,在同尺寸开源模型中具有较强的竞争力。

    更长的上下文:基于 FlashAttention 技术,将基座模型的上下文长度(Context Length)由 ChatGLM-6B 的 2K 扩展到了 32K,并在对话阶段使用 8K 的上下文长度训练,允许更多轮次的对话。但当前版本的 ChatGLM2-6B 对单轮超长文档的理解能力有限,开发者会在后续迭代升级中着重进行优化。

    更高效的推理:基于 Multi-Query Attention 技术,ChatGLM2-6B 有更高效的推理速度和更低的显存占用:在官方的模型实现下,推理速度相比初代提升了 42%,INT4 量化下,6G 显存支持的对话长度由 1K 提升到了 8K。

    更开放的协议:ChatGLM2-6B 权重对学术研究完全开放,在获得官方的书面许可后,亦允许商业使用。
  3. 一个比较实用的笔记插件:Better Notes,需搭配文献管理工具 Zotero 使用。

    该插件开箱即用,集成了论文阅读、段落注释、做笔记、元数据分析、知识输出、AI 写作等功能。

    插件完全开源、免费,支持双链笔记、Markdown 与标记语言,并深度集成了文献管理与阅读功能。

    Zotero Better Notes | #插件
  4. 剩下两个
    Edu Mail + Gdrive Unlimited + GitHub Education developer pack activated and 6 months of prime video activated $27.5
  5. Danswer:开源企业级问答系统,可以对内部文档进行自然语言提问,并返回可靠的答案、引用和参考资料,可以连接到多种常见工具,如Slack、GitHub和Confluence。Danswer提供直接问答、智能文档检索和AI助手等功能,并支持用户认证和文档级的访问管理,还有一键部署和个性化搜索等特性。

    特征💃
    由生成式人工智能模型提供支持的直接质量检查,答案由引用和源链接支持。
    使用最新的法学硕士进行智能文档检索(语义搜索/重新排名)。
    由自定义深度学习模型支持的人工智能助手,用于解释用户意图。
    用户身份验证和文档级访问管理。
    Slack、GitHub、GoogleDrive、Confluence、本地文件和网页抓取的连接器,未来还会有更多连接器。
    管理仪表板用于管理连接器并设置实时更新获取等功能。
    一行 Docker Compose(或 Kubernetes)部署可在任何地方托管 Danswer。

    即将推出
    聊天/对话支持。
    支持生成式 AI 模型甚至自托管选项的自定义端点。
    用于轻松构建自定义连接器的模板。
    个性化搜索
  6. SSLRec是一个基于 PyTorch 的深度学习框架,用于通过自我监督学习技术增强的推荐系统。包含常用的数据集、用于数据处理、训练、测试、评估和最先进的研究模型的代码脚本。 SSLRec提供了大量实用函数和易于使用的界面,简化了推荐模型的开发和评估。

    突出特点
    🧩灵活的模块化架构。SSLRec 库采用模块化架构,可以轻松定制和组合模块。这使用户能够创建适合其特定需求和要求的个性化推荐模型。

    🌟多样化的推荐场景。SSLRec 库是一个多功能工具,适合有兴趣在不同推荐系统研究领域构建有效推荐模型的研究人员和从业者。

    💡综合最先进的模型。我们的 SSLRec 框架为各种场景提供了广泛的 SSL 增强推荐模型。研究人员可以使用先进技术评估这些模型,并将其作为推动推荐系统领域创新的基础。

    📊统一数据馈送和标准评估协议。SSLRec框架具有统一的数据馈送器和标准评估协议,可以轻松加载和预处理来自各种来源和格式的数据,同时确保对推荐模型的客观和公平评估。

    🛠丰富的实用功能。SSLRec 库提供了大量实用函数,可以简化推荐模型的开发和评估。这些功能结合了推荐系统的常见功能以及图操作、网络架构和损失函数的自监督学习。

    🤖易于使用的界面。我们提供了一个用户友好的界面,可以简化推荐模型的训练和评估。这使得研究人员和从业者能够轻松高效地试验各种模型和配置。

    SSLRec | #框架
  7. YouTube计划通过AI来简化视频的多语言配音。其在VidCon上宣布,将从Google的Area 120孵化器引入Aloud团队,这是一家由AI驱动的配音服务公司。

    根据Aloud网站上的介绍,该工具首先对视频进行转录,生成可供查看和编辑的文字稿,然后进行翻译并生成配音,YouTube还计划在2024年推出让翻译后的音轨听起来像创作者本人声音、更具表达力和唇形同步的功能。

    这项技术对于越来越多的创作者为他们的视频添加多语言配音来说将非常有用。
  8. 苹果的新系统:visionOS

    visionOS 的三维界面使应用程序摆脱了传统显示器的边界限制,使它们可以以不同的比例并排出现。用户界面能够动态响应自然光线,投射阴影以帮助传达规模和距离感。

    visionOS 将包含来自 Adobe(特别是 Lightroom)、微软(Teams 和 Office)、思科(WebEx)Zoom 和其他主要开发商的应用程序 —— 包括在 Vision Pro 上本地运行的 Unity 应用程序。有用于查看解剖图渲染图的医疗软件和用于在真实世界对象之上可视化物理现象(如气流)的工程应用程序。

    此外,visionOS 还支持 EyeSight,它将 Vision Pro 的穿戴者的眼睛投射到头显的曲面外部显示器上。Apple 还强调了 visionOS 中的新安全系统 Optic ID,它使用虹膜扫描进行身份验证。这些数据被加密,并与 Secure Enclave(集成到 Apple 系统芯片中的子系统)一起工作。

    visionOS 的开发者工具套件核心是 SwiftUI + Xcode + Reality Composer + Unity。
  9. 最先进的免费开源程序比较工具 Diaphora。

    Diaphora(διαφορά,希腊语“差异”)3.0 版是迄今为止(2023 年)最先进的程序差异工具(作为 IDA 插件)。 它在 SyScan 2015 期间首次发布,自今年以来一直得到积极维护:它已被移植到 IDA 自 6.8 到 8.3 的每个小版本中。

    独特的功能
    Diaphora 具有许多你可能期望的最常见的程序比较(bindiffing)功能,例如:

    差异汇编器。
    差异控制流程图。
    移植符号名称和注释。
    添加手动匹配。
    相似比计算。
    批量自动化。
    调用图匹配计算。
    基于图论、汇编器、字节、函数特征等的数十种启发式方法...
    然而,Diaphora 也有许多独特的功能,是任何其他公共工具所不具备的。以下是独特功能的不详尽列表:

    能够移植结构、枚举、联合和类型定义。
    支持编译单元(查找和比较编译单元)。
    微码支持。
    并行差异。
    基于伪代码的启发式方法。
    伪代码补丁生成。
    区分伪代码(带有语法突出显示!)。
    脚本支持(用于导出和比较过程)。

    文档 | Diaphora | #工具
  10. Deepmind 推出了一个可以自我改进的AI机器人代理:RoboCat

    它能自我学习并在不同的机械臂上执行各种任务,而且还能自我生成新的训练数据以改进其技术。

    RoboCat的学习速度非常快。只需要观察100次左右的演示,就可以学会操控机械臂来完成各式各样的任务,并且它还能通过自生成的数据来进行迭代改进。

    RoboCat的一些主要特点:

    1、多任务和自适应能力:RoboCat是第一个能够解决和适应多个任务,并在不同的真实机器人上执行这些任务的代理。

    2、快速学习:RoboCat的学习速度比其他最先进的模型快得多。它可以通过观察少至100个示例来学习新任务,因为它从大型多样化的数据集中获取信息。这将有助于加速机器人研究,因为它减少了对人工监督训练的需求,这是创建通用机器人的重要步骤。

    3、自我改进:RoboCat基于Deepmind的多模型模型Gato,它可以在模拟和物理环境中处理语言、图像和动作。将Gato的架构与大型训练数据集结合起来,该数据集包含了各种机器人臂解决数百种不同任务的图像和动作序列。

    4、操作新的机器人臂和解决更复杂的任务:通过RoboCat的多样化训练,它在几个小时内学会了操作不同的机器人臂。虽然它已经在两爪夹具的臂上进行了训练,但它能够适应更复杂的臂,这种臂有三个手指的夹具和两倍的可控输入。

    5、自我改进的通才:RoboCat有一个训练的良性循环:它学习的新任务越多,它在学习其他新任务上就越好。最初版本的RoboCat在以前未见过的任务上的成功率只有36%,这是在每个任务上从500个示例中学习后的结果。但是最新的RoboCat,在对更多任务进行了训练后,将这个成功率提高了一倍多。
    Media is too big
    VIEW IN TELEGRAM
  11. 永乐大典:高清影像数据库(第一辑)正式上线,这是国家图书馆馆藏 40 册《永乐大典》首次在线上公开,包括 75 卷内容,共涉及 14 个韵部、17 个韵字、1800 部书。共计22937卷(含目录与凡例60卷)11095册,约3.7亿字,收先秦至明初的各类典籍七八千种,被称为典籍渊薮、佚书宝库。| #电子书 #数据库